Mistral AI重磅发布开源多模态大模型Pixtral Large,并为其AI助手Le Chat注入新功能,展现出这家法国AI公司在技术创新方面的雄心。 核心技术突破:
Pixtral Large采用123亿参数的多模态解码器和10亿参数的视觉编码器架构,具备强大的视觉理解能力。该模型在多项权威基准测试中表现抢眼: - 文档分析能力(DocVQA)达93.3%
- 数学视觉推理(MathVista)获69.4%的成绩
- 在图表解析与实际应用场景中超越Claude 3.5、Gemini 1.5 Pro等竞品
Le Chat功能升级: - 网页搜索:整合实时互联网内容
- 图像生成:接入Black Forest Labs的Flux Pro模型
- 画布界面:支持在对话窗口直接编辑文档、演示文稿和代码
- 文档处理:可分析包含图表、公式在内的复杂PDF文件
|