10月26日,《每日经济新闻》记者从腾讯方面获悉,腾讯混元大模型迎来全新升级,升级后的腾讯混元中文能力整体超过GPT3.5,代码能力大幅提升20%。此外,腾讯宣布正式对外开放混元大模型“文生图”功能。
本次升级距离腾讯正式发布混元大模型不到两个月。据腾讯透露,目前超过180个腾讯内部业务已接入腾讯混元,已有来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户通过腾讯云调用腾讯混元大模型API。
对于混元大模型前期训练成本投入的问题,腾讯机器学习平台算法负责人康战辉在接受采访时表示,混元作为千亿级参数规模的大模型,目前训练成本较高。对于适用于复杂场景的通用大模型,相比于成本投入而言,腾讯更重视效果;而一些细化场景可以使用小模型,更强调成本投入的高性价比。
已接入超180个内部业务
9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。如今,腾讯公布了最新进展。
在内部应用上,超过180个腾讯内部业务已接入腾讯混元,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。最近,QQ浏览器还基于腾讯混元推出了“PDF阅读助手”,具备智能摘要、智能问答和多轮提问等功能。记者注意到,实际上,腾讯混元通过自家应用,也间接面向外部C端用户。
外部用户方面,已有来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户,通过腾讯云调用腾讯混元大模型API,应用领域涉及智能问答、内容创作、数据分析、代码助手等多个场景。今年9月首批通过备案后,腾讯混元大模型也已经面向C端用户陆续开放体验,用户通过小程序或网页端,就能与腾讯混元对话。
在能力提升方面,一大亮点是开放混元大模型“文生图”功能。“文生图”能够实现输入对图片的描述文字后,AI(人工智能)平台根据文字描述生成对应的图片,是AIGC(生成式人工智能)具有广泛应用前景的场景之一,也是全球大模型竞速下的“主战场”之一。
10月26日,腾讯混元大模型“文生图”技术负责人芦清林在接受包括每日经济新闻在内的媒体采访时表示,大模型“文生图”的难点体现在对提示词的语义理解、生成内容的合理性以及生成图片的效果。针对这三个技术难点,腾讯进行了专项的技术研究,提出了一系列原创算法来保证生成图片的可用性和画质。目前腾讯混元“文生图”能力,已经被用于素材创作、商品合成、游戏出图等多项业务中。
此外,腾讯也升级了混元的代码、数学能力。记者了解到,混元大模型经过对32种主流语言代码文件、各类计算机书籍和博客的学习增训,代码处理水平提升超过20%,腾讯内部目前已经有多个开发平台接入了腾讯混元大模型,工程师们可以使用腾讯混元来进行代码生成、代码补全、代码漏洞检测和修复、表格数据处理、数据库查询等工作。
大模型看效果,小模型看效益
混元大模型拥有超千亿参数规模,预训练语料超2万亿tokens,相比于同行十亿、百亿级别的参数规模,研发与训练成本较高。
谈到大模型的研发成本,腾讯机器学习平台算法负责人康战辉在接受媒体群访时表示,目前腾讯研发大模型有两个方向:在通用大模型上,相比于成本投入而言,腾讯更重视效果,强调长期投入;在小型模型上,希望能更加精细化,将不同的模型应用到不同场景,同时更加考虑投入和产出的性价比和效益。通俗来说,就是“大模大做,小模小做”。
出于上述逻辑,腾讯超180个内部业务接入混元大模型的参数量规模也有所差别。“模型的选择关键还要看场景,要结合业务场景给出灵活的方案,例如现在腾讯的业务部门有的用千亿模型,有的用中小模型,有的用混合模型,我们不断根据业务流量和商业模式去调整出我们自己的技术底座。”康战辉说道。
《每日经济新闻》记者注意到,就在本月,多个厂商陆续发布大模型商业应用:百度发布文心一言大模型4.0版本,并推出十余款AI原生应用全面赋能业务生态。在垂直领域,美图发布了自研AI视觉大模型MiracleVision(奇想智能)3.0版本,通过“提示词智能联想”“提示词精准控制”等功能,可以让用户的各种奇思妙想实现所想即所得;宇信科技(300674)推出了首批金融行业大模型应用产品和解决方案,包括4个应用级产品和1个开发平台。
大模型商业化进程正持续推进,腾讯对此也有一些思考。芦清林以“文生图”为例,阐述对未来应用路径的展望。“‘文生图’的应用价值在广告场景是非常明确的,第一是能够帮助广告主更快地提升投放广告的效率,第二是腾讯拥有丰富的广告经验和知识,知道如何针对广告主投放广告的人群,生成更符合人群特点的广告,因此广告主愿意在这个产品上投入。”他说道。
据腾讯透露,目前在广告业务下的多轮测评中,腾讯混元“文生图”的案例优秀率和广告主采纳率分别达到86%和26%。
每日经济新闻