公告:聚站网(www.565865.com)专业分类目录平台,收录各行业优秀网站(违法站勿扰),快审仅需20元/站,永久收录!合作QQ:404959672

快速审核,网站广告合作请联系我们
  • 分类:131
  • 网站:18232
  • 文章:17774
阿里云通义千问发布全新Qwen2系列AI模型:性能大幅提升,支持128K tokens长上下文

今日,阿里云通义千问(Qwen)宣布,经过数月的持续研发和优化,其AI开源模型系列已升级至Qwen2,并在Hugging Face和ModelScope上同步开源。此次升级不仅引入了五个尺寸的预训练和指令微调模型,还在多项性能上实现了显著提升,包括代码和数学能力的增强,以及对更长上下文长度的支持。

Qwen2系列包括五个不同尺寸的模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B,这些模型在参数量、非Embedding参数量以及上下文长度上均有所不同,以满足不同场景下的需求。特别值得一提的是,Qwen2-72B-Instruct模型的上下文长度支持最高达到了128K tokens,为用户提供了更加广阔的文本处理空间。

在训练数据方面,Qwen2系列在中文和英语的基础上,增加了27种语言相关的高质量数据,从而大幅提升了模型的多语言能力。同时,所有尺寸的模型都采用了GQA(Gradient-based Quantization Aware Training)技术,该技术能够显著加速推理过程并降低显存占用,为用户提供更加高效和稳定的模型使用体验。

在模型评测方面,Qwen2系列在大规模模型上实现了非常大幅度的效果提升。尤其是Qwen2-72B模型,在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型,如Llama-3-70B以及Qwen1.5最大的模型Qwen1.5-110B。这一成果充分展示了Qwen2系列在AI模型研发领域的领先地位和强大实力。

阿里云通义千问作为阿里云旗下的AI开源项目,一直致力于推动AI技术的创新和发展。此次Qwen2系列的发布,不仅为用户提供了更加先进和高效的AI模型,也进一步彰显了阿里云在AI领域的技术实力和创新能力。未来,我们期待通义千问能够继续推出更多优秀的AI模型和技术,为AI领域的发展贡献更多的力量。

    关键词: Qwen2 通义千问 阿里云 阿里云通义千问
    精彩推荐

    时间:24/06/08

    今日,阿里云通义千问(Qwen)宣布,经过数月的持续研发和优化,其AI开源模型系...

    时间:24/06/07

    在经历了一系列挑战和失败之后,SpaceX的巨型星际飞船火箭终于在周四成...

    时间:24/06/07

    微软公司今日针对Windows Insider项目中的Canary频道成员,发布了Windo...

    时间:24/06/07

    备受全球粉丝瞩目的《最后的我们》HBO剧集第二季正在紧锣密鼓地制作...

    时间:24/06/07

    随着科技的飞速发展,人工智能(AI)已经成为我们日常生活中不可或缺的一部...

    文章分类
    快审网站推荐
    随机网站推荐
    搜视21/10/12

    搜视网国内首家电视直播导航网站,站内涵盖了电视直播、节目预告、节目...

    阿里巴巴21/09/24

    阿里巴巴(1688.com)批发网是全球企业间(B2B)电子商务的著名品牌,为数千万...

    中国采招网致力于为企业提供招标、采购、拟在建项目信息及网上招标采...

    和讯网21/10/02

    和讯网-中国财经网络领袖和中产阶级网络家园,创立于1996年,是中国最早...

    蚂蜂窝无线为你提供全面实用的旅游攻略、自由行、自驾游等服务,站内还...

    爱卡汽车21/10/05

    爱卡汽车成立于2002年8月,是中国汽车第一社会化网络互动媒体,拥有全球...

    律师21/10/10

    律师365,国内最为专业的律师咨询网站:为寻求法律咨询及聘请律师的朋友...

    2345软件21/10/08

    2345软件大全汇集了国内各种绿色、安全、无毒无插件的各种软件下载,包...

    看准网21/10/08

    看准网专注于公司评论,晒工资,工资待遇,面试,公司福利等.您可以在看...

    中国品牌网,中文品牌网,全球品牌网,中国品牌网,中国第一品牌网,全球...