公告:聚站网(www.565865.com)专业分类目录平台,收录各行业优秀网站(违法站勿扰),快审仅需20元/站,永久收录!合作QQ:404959672

快速审核,网站广告合作请联系我们
  • 分类:131
  • 网站:17961
  • 文章:17522
阿里巴巴开源Qwen1.5-110B模型,性能比肩Meta-Llama3-70B

近日,阿里巴巴宣布开源了其Qwen1.5系列中的首个千亿参数模型——Qwen1.5-110B。这一举措不仅彰显了阿里巴巴在人工智能领域的创新实力,也标志着中国企业在大型语言模型领域取得了显著进展。

据悉,Qwen1.5-110B模型采用了Transformer解码器架构,并引入了分组查询注意力(GQA)技术,使得模型在推理时更加高效。该模型支持长达32K tokens的上下文长度,具备多语言处理能力,支持包括英、中、法、西、德、俄、日、韩、越、阿等在内的多种语言。

在性能评估方面,Qwen1.5-110B模型展现出了与Meta的Llama3-70B模型相媲美的实力。这一成绩是在没有大幅改变预训练方法的情况下取得的,阿里巴巴方面认为,性能的提升主要归功于模型规模的增加。这一结果不仅证明了阿里巴巴在模型设计和优化方面的专业能力,也为中国在大型语言模型领域的发展注入了新的活力。

除了在基础能力评估中表现出色外,Qwen1.5-110B模型在Chat评估中也取得了优异的成绩。在MT-Bench和AlpacaEval 2.0这两个Chat模型基准评估中,该模型相较于之前发布的72B模型表现出了显著的优势。这一结果进一步证明了更大规模的基础语言模型可以带来更好的Chat模型性能。

阿里巴巴方面表示,Qwen1.5-110B是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超过1000亿参数的模型。这一成就不仅彰显了阿里巴巴在大型语言模型领域的领先地位,也为中国企业在全球人工智能竞争中赢得了更多的话语权。

随着人工智能技术的不断发展,大型语言模型已经成为了各大科技企业的重点研究方向。阿里巴巴此次开源Qwen1.5-110B模型,不仅为开发者提供了更加优秀的工具,也为推动人工智能技术的普及和应用做出了积极的贡献。

未来,我们期待看到更多中国企业在大型语言模型领域取得突破,为人工智能技术的发展和应用注入更多的活力和创新力量。

    关键词: Llama3 Meta Qwen1.5 大型语言模型 阿里巴巴
    精彩推荐

    时间:24/05/01

    近日,阿里巴巴宣布开源了其Qwen1.5系列中的首个千亿参数模型——Qwen1...

    时间:24/05/01

    近日,根据Chromium Gerrit CL页面所披露的信息,谷歌计划为iOS版Google ...

    时间:24/05/01

    在视频大模型领域,Vidu和Sora无疑是两颗璀璨的明星。它们分别代表了中...

    时间:24/05/01

    OPPO今日推出 Find X7全新配色 ——「白日梦想家」,为消费者带来更多...

    时间:24/04/30

    近日,根据外媒获得的一份法庭文件,美国联邦贸易委员会(FTC)正式指控亚马...

    文章分类
    快审网站推荐
    随机网站推荐
    当当网站21/10/13

    当当网是全球知名的综合性网上购物商城,由国内著名出版机构科文公司、...

    太平洋汽车网隶属于广州太平洋电脑信息咨询有限公司自2002年7月成立...

    学常识22/10/31

    学常识提供日常生活小常识,涵盖生活小窍门、及生活小妙招和各种经验...

    同花顺金融服务网成立于1995年,是一家专业的互联网金融数据服务商,为您...

    尚之潮网是为广大网民提供第一时尚生活美容娱乐综合资讯平台,为时尚爱...

    房天下是房地产家居网络平台,时刻为你更新最新房源资讯,包括买卖房子、...

    56网21/09/26

    56网成立于2005年4月,是中国领先的视频分享网站。“分享视频,分享快乐...

    凤凰天使21/10/13

    ★凤凰天使(TSKS韩剧社所在地)♡15周年♡(关闭注册)★ ...

    央视网专业提供国内外新闻资讯,涵盖**,军事,科技,社会,法职,农业,经...

    欣欣旅游网是中国在线旅游超市,4万家旅游顾问为您提供超过200万条旅游...