Mistral推最强开源多模态模型 Pixtral Large,升级Le Chat可直接调用Flux Pro
法国人工智能初创公司 Mistral AI 宣布为其 Le Chat AI 助手添加了一系列新功能,包括集成的网络搜索、图像生成以及新推出的 Pixtral Large 模型。
法国人工智能初创公司 Mistral AI 宣布为其 Le Chat AI 助手添加了一系列新功能,包括集成的网络搜索、图像生成以及新推出的 Pixtral Large 模型。
Le Chat 功能升级
用户现在可以通过 Le Chat 直接访问实时网页内容,轻松获取所需的信息。同时,借助 Black Forest Labs 的 Flux Pro 模型,用户还能生成高质量的图像,满足多种创作需求。
除了网络搜索和图像生成,Le Chat 还引入了一个画布界面,让用户可以在聊天窗口内直接编辑生成的内容。这一功能使得用户能够编写文档、创建演示文稿以及编辑代码,而无需重新生成响应,极大地提高了工作效率。
推出Pixtral Large 模型
Mistral AI 推出的 Pixtral Large 模型在视觉任务中的表现十分优异。该模型基于 Mistral Large2构建,在多个行业基准测试中取得了优秀的成绩。
例如,在 MathVista 这一数学推理测试中,Pixtral Large 得分达到了69.4%,超越了其他竞争对手如 GPT-4o 和 Gemini1.5Pro。
同时,该模型在分析图表和复杂文档方面的能力也得到了认可,能够处理包括图形、表格和公式在内的多种信息。
Pixtral Large 模型结合了1230亿参数的多模态解码器与10亿参数的视觉编码器,能够同时处理多达128张高分辨率图像,最大上下文窗口达到30K。
这使得其在文档分析及复杂图像处理方面表现出色。Mistral AI 表示,Pixtral Large 还将在 Hugging Face 平台上提供学术和商业两种许可证,便于不同用户进行研究和应用。
此外,Mistral AI 还对其 Mistral Large 语言模型进行了更新,提升了长上下文理解和函数调用的准确性。
更新后的模型将通过 Mistral 的 API 提供,并很快在 Google Cloud 和 Microsoft Azure 上上线。
Pixtral Large论文入口:https://arxiv.org/abs/2410.07073
模型页面:https://huggingface.co/mistralai/Pixtral-Large-Instruct-2411
Le Chat入口:https://auth.mistral.ai/ui/login?flow=b3e9d399-afc8-497b-8f8d-99900b447c08
API入口:https://docs.mistral.ai/api/
更多推荐
所有评论(0)