阿里云通义千问2.5大模型发布：中文大模型性能全面超越GPT-4 Turbo

小哪吒

5月9日，在通义大模型发布一周年之际，阿里云宣布了通义千问2.5的全新升级，这一版本在模型性能上全面超越了GPT-4 Turbo，成为目前地表最强的中文大模型。同时，通义千问1100亿参数的开源模型在多个基准测评中也取得了最佳成绩，超越了Meta的Llama-3-70B，成为开源领域最强大的模型。

阿里云智能集团首席技术官周靖人在介绍中提到，自2023年4月问世以来，通义千问一直专注于基础模型的技术研发，从初代模型升级至2.5版本。与通义千问2.1版相比，2.5版本在理解能力、逻辑推理、指令遵循、代码能力等方面分别提升了9%、16%、19%、10%，中文能力持续领先业界。权威基准OpenCompass的测评结果显示，通义千问2.5的得分追平了GPT-4 Turbo，这是国产大模型首次在该基准上取得如此佳绩。

此外，通义还发布了1100亿参数开源模型Qwen1.5-110B，该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B，在HuggingFace开源大模型排行榜Open LLM Leaderboard上夺得榜首，再次证明了通义开源系列在业界的竞争力。

在今日的阿里云AI智领者峰会-北京站活动中，原通义千问APP宣布更名为“通义APP”，致力于成为“通情达义”的全能AI助手。通义大模型已经发展出业界领先的文生图、智能编码、文档解析、音视频理解等能力，企业客户和开发者可以通过API调用、模型下载等方式接入通义，个人用户也可以从APP、官网和小程序免费使用通义。

阿里云官方还透露，通义大模型已经服务超过9万家企业，通义开源模型的累计下载量已突破700万。通义落地应用进程加速，现已进入PC、手机、汽车等多个领域。小米旗下人工智能助手“小爱同学”已与阿里云通义大模型达成合作，未来计划进行多模态、OS深度整合、端侧大模型等升级。同时，微博、完美世界游戏等企业也宣布接入通义大模型，预示着通义千问2.5将在更广泛的应用场景中展现其强大的能力。

阿里云通义千问2.5的发布，不仅是技术进步的体现，更是中文大模型在全球AI领域竞争力的一次重要展示。随着通义千问2.5的广泛应用，我们有理由期待它将为智能科技领域带来更加深远的影响。

[行业动态] 阿里云通义千问2.5大模型发布：中文大模型性能全面超越GPT-4 Turbo

相关帖子

阿里云首位AI编程员工：通义灵码（工号AI001）

阿里云将在韩国、马来西亚、菲律宾、泰国和墨西哥新增五个数据中心

复旦大学与阿里云深化人工智能教育合作

Qwen3 全系适配 MLX：32 款量化模型全面开源

微医控股与阿里云达成战略合作，共建医疗大模型

阿里云发布自动驾驶模型加速框架 PAI-TurboX：训练时间可缩短 50%

浏览过的版块