公告:聚站网(www.565865.com)专业分类目录平台,收录各行业优秀网站(违法站勿扰),快审仅需20元/站,永久收录!合作QQ:404959672

快速审核,网站广告合作请联系我们
  • 分类:131
  • 网站:20136
  • 文章:19162

1月30日晚间消息,阿里云宣布通义千问旗舰版模型Qwen2.5-Max升级发布。

Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果,预训练数据超过20万亿tokens。该模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。

据悉,目前开发者可在Qwen Chat(https://chat.qwenlm.ai/)平台免费体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型API服务。

Qwen2.5-Max在知识(测试大学水平知识的MMLU-Pro)、编程(LiveCodeBench)、全面评估综合能力的(LiveBench)以及人类偏好对齐(Arena-Hard)等主流权威基准测试上,展现出全球领先的模型性能。通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。

指令模型是所有人可直接对话体验到的模型版本,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

基座模型反映模型裸性能,由于无法访问GPT-4o和Claude-3.5-Sonnet等闭源模型的基座模型,通义团队将Qwen2.5-Max与目前领先的开源MoE模型 DeepSeek V3、最大的开源稠密模型Llama-3.1-405B,以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。在所有11项基准测试中,Qwen2.5-Max全部超越了对比模型。

目前,Qwen2.5-Max已在阿里云百炼平台上架,模型名称qwen-max-2025-01-25`,企业和开发者都可通过阿里云百炼调用新模型API。同时,也可以在全新的Qwen Chat平台上中使用Qwen2.5-Max,直接与模型对话,或者使用artifacts、搜索等功能。

    关键词: 阿里 模型 测试 DeepSeek
    精彩推荐

    时间:25/02/26

    新浪科技讯1月30日晚间消息,阿里云宣布通义千问旗舰版模型Qwen2.5-Max...

    时间:25/02/25

    当地时间1月31日,OpenAI正式推出了全新推理模型o3-mini,并首次向免费用...

    时间:25/02/25

    新浪科技讯2月1日上午消息,OpenAI今日发布o3-mini模型,这是OpenAI推理...

    时间:25/02/25

    特斯拉凤凰网科技讯1月30日,特斯拉公司今天发布了截至12月31日的2024...

    时间:25/02/24

    图源 pixabay在接二连三的热搜和新梗包围下,蛇年春晚再次破了新纪录。...

    文章分类
    快审网站推荐
    随机网站推荐
    央视网站21/10/02

    央视网(www.cctv.com)是中国网络电视台旗下互联网站业务,也是中央重点...

    爱卡汽车21/10/05

    爱卡汽车成立于2002年8月,是中国汽车第一社会化网络互动媒体,拥有全球...

    个人简历网是国内知名的综合性个人写作参考资源平台。网站前身为个人...

    CCTV节目为你提供央视各个频道的节目预告、直播、点播等服务,可在线获...

    99健康网21/10/12

    99健康网是一家专业提供健康资讯的综合性健康网,是最适合中国人的健康...

    酷知经验21/10/10

    酷知网每天为你更新分享各类生活中所遇到的各种问题解决方式方法,通过...

    电子发烧友网站提供各种电子电路,电路图,原理图,IC资料,技术文章,免费下...

    华军软件园提供国内外最新的绿色免费软件下载中心,其中包含电脑软件、...

    律师21/10/10

    律师365,国内最为专业的律师咨询网站:为寻求法律咨询及聘请律师的朋友...

    欣欣旅游网是中国在线旅游超市,4万家旅游顾问为您提供超过200万条旅游...