中国网财经11月12日讯(记者 朱玲)“大模型高度依赖数据、算力和人才,只有极少的企业能够从头到尾地完成产业级研发,尤其是在金融领域,更需要多方共建生态。“日前,度小满CTO许冬亮在2023金融街(000402)论坛年会“金融科技创新与合规安全”平行论坛上表示。
“一方面,金融领域的数据分散在各个金融机构,通用大模型缺少金融数据进行训练,金融专业知识不足;另外一方面,如果从底层开始训练大模型,所需要投入的算力成本非常高,比如千亿级别的通用大模型,训练一次需要付出几千万的成本”,许冬亮解释道,“因此,金融大模型的产业应用需要场景应用方(金融机构)、模型提供方、训练工具提供方等多方共建,共同参与”。
行业内不同角色的分工协作,才能推动大模型的产业应用。2023年10月,中国工程院院士邬贺铨在百度世界大会上表示:“度小满轩辕大模型通过大规模融合高质量的金融专业预训练和指令数据,并且针对金融行业进行能力优化,保持通用能力的同时,提高了金融的专业能力“。他认为在“轩辕”大模型的底层模型上,金融企业可以在上面继续做自己的开发和私有化部署。
今年5月,度小满发布了国内首个开源金融大模型“轩辕”。9月,度小满“轩辕-70B”金融大模型在C-Eval和CMMLU两大权威榜单上位列所有开源模型第一。
从基础模型到落地应用,为行业创造价值,许冬亮认为,金融机构还需要处理好五大关键问题:一是基础模型应该怎么选;二是金融机构自身的业务数据怎么融到大模型中;第三是如何控制幻觉问题等模型缺陷问题;四是未来每个机构都会部署大模型的情况下,机构如何构建竞争壁垒。最后是模型的安全合规的如何保障。
目前,大模型技术已经应用在度小满各个业务场景,从营销、客服、风控、办公再到研发,已经初见成效。在代码助手方面,用大模型辅助生成的代码,采纳率能够达到42%,帮助公司整体研发效率提升了20%;在客服领域,大模型推动服务效率提升了25%。在智能办公领域,大模型目前的意图识别准确率已达到97%。
随着大模型技术在越来越多金融机构落地应用,如何防范大模型的潜在合规风险也备受关注。“金融是强监管行业,安全合规是大模型落地的前提条件和重要保障。金融大模型安全合规既需要监管政策的约束,更需要大模型企业自身的主动作为”,许冬亮认为,“大模型需要学习人类的价值观,保护好用户的个人权益,确保输出结果可信可控”。