2024年9月19日,在备受瞩目的云栖大会上,阿里云CTO周靖人宣布了通义千问新一代开源模型Qwen2.5的发布。该模型以其旗舰版本Qwen2.5-72B的卓越性能,声称已超越了Llama 405B。
Qwen2.5系列涵盖了不同尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸均提供基础版、指令跟随版和量化版,共计超过100个模型。其中,语言模型包括0.5B、1.5B、3B、7B、14B、32B和72B等不同参数规模的版本;编程模型Qwen2.5-Coder则包括1.5B、7B,以及即将推出的32B版本;数学模型Qwen2.5-Math则提供1.5B、7B和72B版本。
值得注意的是,除了3B和72B版本外,通义千问的所有开源模型均采用Apache 2.0许可证,用户可以在Hugging Face仓库中查阅相关许可证文件。此外,阿里云还通过Model Studio提供了旗舰语言模型Qwen-Plus和Qwen-Turbo的API,并开源了性能提升的Qwen2-VL-72B版本。
阿里云官方透露,截至2024年9月中旬,通义千问开源模型的累计下载量已超过4000万次,成为全球下载量第二的模型群,仅次于Llama。在云栖大会上,阿里云还宣布了通义千问推荐模型的全线降价,最高降幅可达85%,这一举措无疑将进一步推动AI技术的普及和应用。 随着AI技术的不断进步,开源模型的广泛应用正逐渐改变着科技行业的面貌。阿里云此次发布的Qwen2.5,无疑将为全球AI社区带来新的活力和机遇。
|