当前位置:»资讯 AI新闻 全球AI最前线

[行业动态] 全球90+大模型PK排名出炉:GPT-4夺冠,Llama 3第六,阿里Qwen1.5-72B第十三

本帖最后由 小哪吒 于 4-24 00:21 编辑

大模型评测社区LMSYS发布了一份大模型排行榜单(排行榜更新日期4月22日)。收集了超过700,000个人类成对比较,使用Bradley-Terry 模型对法学硕士进行排名,并以 Elo 量表显示模型评级。

全类能力中:GPT-4夺冠,Llama 3-70B第六,阿里Qwen1.5-72B第十三

WX20240423-234956@2x.png
代码能力中:GPT-4夺冠,Llama 3-70B第七
WX20240423-235749@2x.png


中文能力中:Claude 3夺冠,阿里Qwen1.5-72B第八

WX20240424-000032@2x.png


下面这张图展示了部分热门模型的比拼次数和胜率,图中的两项指标都没有统计平局的次数。

WX20240423-235221@2x.png


社区LMSYS地址:https://chat.lmsys.org/

声明: 本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

豫ICP备2024052610号-1 ©AI闹海