谷歌推出Gemini 3.5 Flash谷歌公司表示该模型速度更快更适合编码和智能代理任务但分析师认为其企业价值取决于实时工作流的可靠性。图片来源gguy – shutterstock.com谷歌推出了Gemini 3.5 Flash这是一款新的AI模型旨在为其产品和企业平台的智能代理工作流提供支持。谷歌希望借此将生成式AI从聊天机器人式的交互拓展至更深入的业务运营领域。这款模型是在年度Google I/O开发者大会上发布的可通过Gemini应用、谷歌搜索的AI模式、Google Antigravity、谷歌AI工作室和Android工作室中的Gemini API、Gemini企业代理平台以及Gemini企业版使用。模型优势与特点在一篇博客文章中谷歌称Gemini 3.5 Flash适用于软件开发、金融文档准备、客户入职、OCR、税务工作流和数据诊断等任务。谷歌还将该模型定位为大型旗舰系统的更快替代方案。它将Gemini 3.5 Flash描述为目前处理智能代理和编码任务最强的模型宣称其在Terminal - Bench 2.1、GDPval - AA和MCP Atlas等基准测试中表现优于Gemini 3.1 Pro。谷歌还表示该模型在多模态理解方面处于领先地位在CharXiv推理测试中得分达到84.2%。谷歌补充道“在每秒输出令牌方面它比其他前沿模型快4倍。”谷歌还表示它与行业合作伙伴共同开发了Gemini 3.5模型系列并指出“从银行和金融科技公司自动化数周的工作流到数据科学团队在复杂数据环境中挖掘洞察都看到了显著的影响”。Gemini的企业测试分析师认为与其将Gemini 3.5 Flash视为改进版的聊天机器人不如将其看作谷歌推动构建可在监督下执行企业任务的AI代理的一部分。Pareekh咨询公司首席执行官Pareekh Jain表示“谷歌在速度、成本和性能方面的改进至关重要因为许多AI试点项目在大规模应用时会因速度过慢或成本过高而失败。更快、更便宜的模型可以使AI代理在编码、支持、分析和自动化等实际业务操作中具有实用性。”但Greyhound研究公司首席分析师Sanchit Vir Gogia指出首席信息官CIO不仅应关注模型成本还应关注完成工作流的成本例如解决索赔异常、审查合同、处理服务事件或推动软件修复通过测试和审批等。Gogia表示“供应商的基准测试测试的是能力而企业试点测试的是生存能力。”Counterpoint研究公司研究副总裁Neil Shah表示企业目标也在发生变化。Shah称“企业目标已从总结文档、回答基于提示的问题或进行基本代码生成转变为将受监督的自主后台工作者直接部署到核心业务工作流中。”这就引出了一个问题谷歌能否使智能代理AI足够可靠以用于实际生产而不仅仅是运行速度更快或成本更低。Gartner高级总监分析师Anushree Verma表示随着AI代理从被动助手转变为业务流程中的积极参与者企业还需要对其操作进行更强有力的控制。Verma称“随着AI代理在业务系统中得到广泛应用企业面临着一系列新挑战例如代理被授权执行哪些操作以及在何种情况下执行。”她还指出风险不仅限于操作错误。跨多个系统运行的代理可能会扩大攻击面为攻击者创造新的入口点并增加恶意提示或数据触发意外操作的可能性。Verma补充道“问责制、可审计性和可解释性也将是关键问题而且随着部署更多代理可观测性变得非常关键。随着代理的迅速普及还会出现更多需要处理的问题可能会导致代理泛滥。”Verma表示应对这些风险需要IT、安全、合规和业务团队共同合作并投资于为AI驱动的自动化构建的工具和流程。生成式AI与人工智能原文此处未给出具体内容保持原文格式呈现。