Mistral AI 是一家由前谷歌和 Meta 员工创建的法国人工智能公司,该公司刚刚对其免费的多模态人工智能平台进行了全面升级,其功能接近甚至超过了 OpenAI 或 Anthropic 的付费产品。
这家总部位于巴黎的初创公司推出的这套人工智能工具现在具有网络搜索和图像生成功能,同时还有一个新的视觉模型,在关键基准上优于大型竞争对手。
该公司还推出了文档分析更新、大型语言模型更新以及专注于编码任务的 LLM Codestral。
不过,它的锦上添花之处在于使用 Flux Pro 生成图像,这意味着它是目前图像生成能力最强的多模态聊天机器人。新的 Canvas 界面可以直接编辑内容,将 Le Chat-Mistral的聊天机器人用户界面定位 为企业就绪的工作区工具。
Mistral在一份 声明中说:"我们不会不惜一切代价追逐人工智能;我们的使命是将前沿人工智能交到你 的 手中。"Mistral 与竞争对手更广泛的人工通用智能野心保持了距离,这些野心引发了专家们的担忧。
该公司在 12 月的一轮融资中估值 20 亿美元。
Pixtral Large是一个拥有1240亿个参数的视觉模型,在MathVista和DocVQA上的准确率分别为69.4%和93.3%,超过了GPT-4和谷歌的Gemini 1.5 Pro。它能在 128,000 个令牌的上下文窗口内处理多达 30 幅高分辨率图像。
与此同时,Flux Pro 在质量和推理速度方面优于所有其他图像生成器,Decrypt 此前也曾报道过这一点。
ChatGPT 使用的是 DALL-E,相比之下比较原始。因此,将 Flux 整合到 Le Chat 中是一个值得欢迎的举措。
这些功能是作为 "免费测试版产品 "推出的,用户可以免费使用最新的生成式人工智能工具。Mistral 没有说明打算何时开始对其工具收费。
我们对 Mistral 和 ChatGPT 的免费版聊天机器人进行了测试。两者有很多相似之处--主要是在写作风格上,但不同之处也足以将两者区分开来。
ChatGPT 的 GPT-4o 仍然是 语言模型中的佼佼者,在复杂推理、创意写作和技术分析方面表现出无与伦比的细腻。
它理解上下文并保持连贯的长篇对话的能力已成为行业标准。在广泛的测试中,GPT-4o 在从文学分析到高级编码挑战等任务中都表现出了卓越的能力。
Le Chat 的 Mistral Large 2.5 虽然令人印象深刻,但在复杂的推理任务中比 GPT-4o 低一个级别。不过,它在实际应用中表现出色,能迅速做出反应,在日常任务中表现出色。虽然该机型具备多语言功能,但其创造性往往不如 GPT-4o。
网络搜索集成
Le Chat 提供免费的网络搜索功能--用户可以通过直接引用链接访问当前信息,这与使用传统搜索引擎的方式类似,但采用了人工智能合成技术。这种整合感觉自然而不突兀,使事实检查和研究工作流程变得非常高效。免费使用这一功能是一个重要的价值主张。
ChatGPT 的 SearchGPT 虽然在方法上更为复杂,但却设置了付费墙。它以独特的视角进行网络整合,通常能提供更多的上下文分析(甚至能对某些回复产生幻觉)。Chrome 浏览器插件与 OpenAI 的语言模型功能进行了更深入的整合,不过许多用户可能会认为 Le Chat 的直接方法更适合日常使用。
图像生成功能
Le Chat 与 Flux Pro 的集成是图像生成领域的一大优势。该系统能根据提示生成非常精细的视觉效果,尤其在艺术风格、精确的人体解剖和复杂的场景构图方面表现出色。最近的基准测试结果表明,Flux Pro 在图像生成技术方面处于领先地位,在纹理细节和空间连贯性等方面的表现明显更好。
ChatGPT 的 DALL-E 3 虽然在推出时具有开创性,但现在与更新的型号相比已显老态。虽然它能生成尚可使用的图像,但在复杂的提示、细致的纹理和一致的风格保持等方面,它往往显得力不从心,而 Flux Pro 则在这些方面表现出明显的优势。在专业级图像生成任务中,这种差距尤为明显。
自定义人工智能代理
Le Chat 对人工智能代理的民主处理方式代表了可访问性的重大转变。用户可以免费为从数据分析到创意写作等任务创建、定制和部署专门的代理。
另一方面,ChatGPT 采用的是双层系统。虽然免费用户可以访问预制的 GPT,但创建自定义 GPT 的功能仍属于高级功能。
这些 GPT 的质量非常好,通过自然语言提示进行配置的功能也很不错;但创建工具的限制和价格墙限制了个性化工作流程优化的潜力。
视觉分析功能
至少在我们的首次快速测试中,这一项似乎不相上下。在实际应用中,GPT-4V 和 Pixtral Large 展示了非常相似的功能。
两者都擅长图表解读、图像理解、数学符号和空间感知。
虽然基准数据显示 LLM、视觉模型和图像生成模型略有不同,但在日常使用案例中的实际差异并不大。
从创意写作到技术图表,这两种系统都能准确处理,令人印象深刻,因此在它们之间做出选择更多的是生态系统偏好,而不是能力差异。
这些平台之间的选择越来越取决于具体的使用案例
ChatGPT 在以下方面仍然更胜一筹
Le Chat 提供了更好的价值:
财务影响是决定成败的关键:乐聊免费提供 ChatGPT Plus 大约 80-90% 的功能,这使其对个人用户和预算有限的小型企业越来越有吸引力。
总的来说,Mistral 目前提供了更好的价值主张,而且他们的模式可能会为用户提供足够的服务,从而证明取消订阅是合理的--至少在测试期还没有结束的时候是这样。
编辑:Josh Quittner 和 Sebastian Sinclair
© 2025 DeFi.io