/ 币百科

Mistral 发布名为 Voxtral 的全新 AI 音频模型

发布时间:2025-07-17 07:00:33
欧意最新版本

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

APP下载  官网地址
本站报道:

米斯特拉尔 宣布发布一种名为 Voxtral 的新型音频 AI 模型。 这家法国人工智能公司表示,该模型面向企业,被认为是第一个专注于音频人工智能的大型语言模型(LLM)系列。

据这家法国人工智能公司称,Voxtral 旨在在实际应用中提供实用的语音智能。该 AI 音频模型的性能优于顶级开源音频转录模型之一 Whisper large-v3。

Voxtral 由 Mistral Small 3.1 提供支持

Voxtral 由大型语言模型 (LLM) Mistral Small 3.1 提供支持。该音频 AI 模型可以理解多种语言,例如英语、法语、西班牙语、葡萄牙语、意大利语、德语、荷兰语、印地语等。

该音频模型能够转录长达 30 分钟的音频。此外,Voxtral 还能理解长达 40 分钟的音频,方便用户轻松交谈并提出相关问题。用户还可以要求其生成音频文件的文本摘要,或提供分析和详细见解。此外,他们还可以执行其他操作,例如通过 API 调用运行函数。

MistralVoxtral 提供两种版本的“语音理解模型”,分别为 Voxtral Small 和 Voxtral Mini。两种模型均能够与基于语音的提示或基于音频和文本的提示组合进行交互。

两种模型中,功能更强大的 Voxtral Small 具有 240 亿个参数,非常适合生产规模部署。Mistral写道“Voxtral Small 在所有任务上都与 GPT-4o-mini 和 Gemini 2.5 Flash 具有竞争力。”

来源:Mistral AI。

Voxtral Mini 是一款轻量级的方案,拥有 3B 参数,是本地和边缘部署的理想之选。其 API 版本 Voxtral Mini Transcribe 不仅经济高效,而且性能优于 OpenAI 的 Whisper,价格不到后者的一半。

Voxtral Small (24B) 和 Voxtral Mini (3B) 均可从 Hugging Face 下载并本地托管。开发者还可以通过单个 API 调用将音频模型集成到任何应用程序中。起价为每分钟 0.001 美元,这使得转录可扩展。Mistral 表示,Voxtral 将在勒查特未来几周内将在网络应用程序或移动应用程序中推出。

Mistral 是欧洲领先的人工智能公司之一。据报道,该公司成立于 2023 年,已从 Andreessen Horowitz、Nvidia、三星和 Salesforce 等知名公司筹集了超过 10 亿欧元(约 12 亿美元)的资金。

KEY 差异线:加密货币项目用来获得媒体报道的秘密工具

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com