/ 新闻

火山引擎降价应对Agent浪潮,市场再掀风云

发布时间:2025-06-11 18:50:16

随着AI技术的不断升级和发展,大模型的价格迎来了进一步的下降空间。

北京时间6月11日,OpenAI宣布将o3价格下调80%;火山引擎披露了最新的区间定价方式,使客户的大模型使用成本降至近三分之一。其旗下的视频生成模型Seedance 1.0 pro每千Tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为目前行业最低。

关于OpenAI o3的降价,OpenAI官方表示主要基于推理服务架构的全面优化。另有消息称,OpenAI正在谋求除微软云之外,与谷歌云之间的合作,通过云平台缓解算力压力。火山引擎总裁谭待对第一财经记者表示,云业务对大模型的发展一直是很重要的事情,因为它是数字经济的底座,AI本身又能进一步扩大数字经济的增长。对于大模型来说,除了较高的训练成本外,推理成本更高,且推理有波峰波谷区间,云平台可以更好地适配更多硬件,将波峰波谷通过混合调度打平,进而降低成本。

作为云服务平台,此次火山引擎也发布了一系列AI云原生产品及相关服务。但豆包系列模型的降价,据谭待披露,主要基于工程方面的优化,也包括了通过AI云原生服务中的ServingKit方案优化推理成本等。ServingKit是一款AI云原生推理套件,为企业提供从模型部署、推理优化到运维观测的一站式解决方案。

在具体降价策略上,火山引擎采用的区间定价策略主要聚焦企业使用量最大的0-32K输入区间,该区间内豆包1.6的输入价格为0.8元/百万Tokens、输出8元/百万Tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。同一区间内,深度思考、多模态能力与基础语言模型统一价格。

此次豆包系列模型价格降低的原因包括客户对Tokens调用规模快速增长、模型能力的快速提升、新场景被不断解锁等。以Tokens数量为例,对比今年5月火山引擎Tokens消耗构成和去年12月的数据,随着深度推理模型的发布,AI工具的Tokens消耗在快速增长,五个月时间增长了4.4倍,其中AI搜索增长了10倍,AI编程增长了8.4倍。

现场,字节跳动技术副总裁洪定坤演示了字节旗下AI编程Agent产品Trae,他表示,模型能力的进步使得像Trae这样的AI Coding类产品有了真正落地的机会,截至5月底,Trae月活用户数已超过100万。目前字节跳动内部超过80%的工程师通过类Trae产品进行辅助开发。

AI编程系目前Agent赛道内最热的垂类产品,所代表的是Agent智能化、自主化的性能趋势。如果说2024年是中国大模型应用的元年,那2025年很可能是中国Agent落地的元年,谭待表示,Agent将逐步进入企业的各个业务流程,在这个阶段,深度思考、多模态理解和工具自主调用是模型进化的关键方向。

据谭待归纳,PC时代的主体是Web,移动时代是APP,AI时代是Agent。Agent能够自主感知、规划和反思,完成复杂任务。软件第一次从被动的工具变成主动的执行者。而大模型和Agent开发平台正是这个时代的关键要素,模型需要做好强推理、多模态、低成本才能支撑好Agent的大规模应用。

另外,Agent生态的搭建离不开MCP等协议的完善,除了MCP,谷歌此前发布了相似属性的A2A协议,此次火山引擎除了演示通过MCP进行模型调用,也演示了GUI(图形用户界面)形式的操作能力。此前智谱发布的Agent产品便采用了基于视觉语言模型的GUI Agent模型。

谭待称,MCP存在一定局限性,比如无法在每一个场景里都能找到对应的MCP Server(连接 AI 模型和外部数据源的关键组件)。MCP与GUI两种方式的融合可以实现更高效率的模型工具调用。

此外,火山引擎智能算法负责人吴迪对记者透露,火山引擎正在自研下一代MCP协议或者类A2A协议。目前火山引擎的MCP Hub已与AI编程Agent Trae、方舟体验中心、Coze(字节旗下零代码AI应用开发平台)打通,可以一键选择超过200个MCP服务。

帮企客致力于为您提供最新最全的财经资讯,想了解更多行业动态,欢迎关注本站。

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com