5月9日,在通义大模型发布一周年之际,阿里云宣布了通义千问2.5的全新升级,这一版本在模型性能上全面超越了GPT-4 Turbo,成为目前地表最强的中文大模型。同时,通义千问1100亿参数的开源模型在多个基准测评中也取得了最佳成绩,超越了Meta的Llama-3-70B,成为开源领域最强大的模型。
阿里云智能集团首席技术官周靖人在介绍中提到,自2023年4月问世以来,通义千问一直专注于基础模型的技术研发,从初代模型升级至2.5版本。与通义千问2.1版相比,2.5版本在理解能力、逻辑推理、指令遵循、代码能力等方面分别提升了9%、16%、19%、10%,中文能力持续领先业界。权威基准OpenCompass的测评结果显示,通义千问2.5的得分追平了GPT-4 Turbo,这是国产大模型首次在该基准上取得如此佳绩。 此外,通义还发布了1100亿参数开源模型Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B,在HuggingFace开源大模型排行榜Open LLM Leaderboard上夺得榜首,再次证明了通义开源系列在业界的竞争力。 在今日的阿里云AI智领者峰会-北京站活动中,原通义千问APP宣布更名为“通义APP”,致力于成为“通情达义”的全能AI助手。通义大模型已经发展出业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户也可以从APP、官网和小程序免费使用通义。
阿里云官方还透露,通义大模型已经服务超过9万家企业,通义开源模型的累计下载量已突破700万。通义落地应用进程加速,现已进入PC、手机、汽车等多个领域。小米旗下人工智能助手“小爱同学”已与阿里云通义大模型达成合作,未来计划进行多模态、OS深度整合、端侧大模型等升级。同时,微博、完美世界游戏等企业也宣布接入通义大模型,预示着通义千问2.5将在更广泛的应用场景中展现其强大的能力。 阿里云通义千问2.5的发布,不仅是技术进步的体现,更是中文大模型在全球AI领域竞争力的一次重要展示。随着通义千问2.5的广泛应用,我们有理由期待它将为智能科技领域带来更加深远的影响。
|