奇富科技费浩峻谈金融大模型：先“做大”再“做小” 在有限算力内提升模型效果应用垂类领域

　　随着国内大模型技术的不断发展和应用，大模型浪潮席卷各行各业，金融大模型也已在金融领域成为投入使用的重要工具，包括度小满、奇富科技、马上消费金融等在内的各大科技企业争先布局，先后发布落地了多项金融大模型，为金融机构进一步赋能。

　　然而，当前国内大模型仍处研发和迭代的初期阶段，大模型在金融领域究竟能做什么？金融大模型的研发和后续发展面临着怎样的困难与挑战？如何利用大模型更好进行金融数据的挖掘、分析和预测？近日，财联社记者就上述相关问题独家专访了奇富科技首席算法科学家费浩峻。
　　在费浩峻看来，金融大模型未来必将成为金融专家，但大模型却并非越“大”越好，参数越高意味着投入的算力资源越大，如何在有限算力内提升模型效果，使实际业务应用更快更高效，是首先需要平衡的。
　　财联社：金融大模型对金融机构的赋能具体体现在哪些方面，是如何发挥作用的？
　　费浩峻：随着模型能力不断演进，未来大模型将持续改变金融最本质的核心层
　　2022年11月末，ChatGPT横空出世，掀起大模型浪潮。此后，文心一言、同义千问等通用大模型以及MedGPT、奇富GPT、ChatLaw等行业大模型相继发布。随之，金融大模型在金融行业加速应用。
　　目前AI大模型分为通用大模型及行业大模型，前者具有更广泛的的应用范围，可以在多个领域内发挥作用；后者针对法律、医疗、金融等某个特定领域或行业，在垂直领域内具有较高专业性和针对性。
　　“大模型对金融机构的赋能可以是方方面面的”，在费浩峻看来，金融大模型对金融业务流程中与人相关、人机交互的环节，都可赋能。“目前，金融大模型的作用，多是在提效。”
　　以奇富科技金融大模型的实践为例，在电销系统中，语义分析和线索挖掘帮助提升电销线索识别准确率高达98%，同时将转化率提高超过5%；在智能营销环节，大约70%的图片素材由AIGC生成，并计划通过大模型对素材进行标注和多维度评级，以实现广告投放的优化；在语音机器人话术生成场景，生成话术优质率已达70%。
　　“以通话质检为例，过去我们会用传统的模型去做一些质检，来保证电话通话有效性，现在利用大模型，质检的覆盖率和效率会提升很多。我们第一版大模型自动化质检实现了100%覆盖，同时检出率较以前模型有了15%的提升。”费浩峻介绍道。
　　“大模型是个衍生的状态，从现在到未来还会持续的发展，因此金融大模型对金融行业的整个赋能也是一个循序渐进的过程。”费浩峻认为，未来随着模型能力的不断演进，大模型会逐步应用到金融核心业务层，持续赋能金融最本质的核心层，并起到越来越重要的作用。
　　财联社：现阶段金融大模型在研发过程中遇到了哪些难点？
　　费浩峻：数据和算力是影响大模型效果的关键，幻觉是大模型最常见的问题
　　金融行业数字化转型趋势下，越来越多的公司参与布局金融行业大模型。今年5月份，奇富科技率先宣布推出其公司自研的金融大模型“奇富GPT”，也被业内称为国内首个金融行业通用大模型；同月，度小满推出国内首个千亿级中文金融大模型“轩辕”；6月份，恒生电子发布金融行业大模型LightGPT；8月，马上消费金融发布首个零售金融大模型“天镜”；9月，蚂蚁集团正式发布工业级金融大模型AntFinGLM等等。
　　“数据和算力（的限制）是影响大模型效果的最本质的问题，也是大模型落地过程中行业首要面对的问题。”费浩峻坦言，大模型的参数量大致分为十亿、百亿、千亿级别，不同参数量背后代表着投入的算力资源不同，也意味着研发成本不同。
　　费浩峻认为，大模型并不是越“大”越好，如何在有限算力内提升模型效果，使实际业务应用更快更高效，是首先需要平衡的。“我们希望把模型‘做大’后再‘做小’，做大是把它的能力做大，比如像Chat GPT这种千亿参数的模型有很强的能力，保持能力不变的同时把参数做小，结合多种场景运用到垂直领域中，会实现更好的效果。”他解释称。
　　对于大模型在金融行业的运用，费浩峻认为，作为数据密集型行业，金融业沉淀了如金融交易、客户信息、市场分析、风控等各个方面的海量数据，并催生出大量高效处理的技术需求。同时金融行业持续进行数字化转型，过去对数据的收集、处理、清洗等工作都做得较好，有着良好的数据基础，因此金融业是在大模型演进过程中走得较快的领域。
　　“幻觉，是目前大模型最常见的问题。”在费浩峻看来，学习了海量数据的大模型，会根据对前文内容的理解生成下文，并产生“编造”一些“无中生有”内容，这会直接影响金融分析结果的可信度，尤其是在实际与用户直接做沟通时，稳定性不足，会对用户体验造成一定伤害。“金融行业容错率是比较低的，各个场景中，如果存在幻觉就很难真正实现to C运用。”
　　财联社：金融大模型未来发展是一个怎么样的趋势？会有哪些挑战？
　　费浩峻：金融大模型将成为金融专家，在未来5年出现大幅转化
　　大模型浪潮席卷各行各业，持续进行数字化转型的金融业成为大模型率先落地发力的最优场景之一。对于金融大模型未来发展趋势，费浩峻认为，目前，金融大模型仍处于工具阶段，助力人工促进效率提升。在其设想中，伴随发展，金融大模型将取代一部分人力，最终成为“金融专家”。
　　费浩峻称，从趋势来看，基于相同的技术路径，金融大模型未来的发展将与AGI（通用人工智能）的节奏保持一致，在未来5年出现大幅的转化。对于布局金融大模型赛道的各家公司，其认为，远未到竞争阶段，“大家应合作共赢，共同努力把金融大模型做得更好。”
　　“随着整个大模型的不断演进和生态进阶，科技公司、金融科技公司以及金融机构三者之间一定会走向通用协作。”费浩峻分析，头部科技公司将完成通用模型的建设，在此基础上，头部金融科技公司完成垂类金融行业大模型的建设，金融机构或是小型金融科技公司专注在赋能业务的应用层，形成行业共建的局面。
　　当然，技术要天马行空，敢想才能有突破，但更要脚踏实地。费浩峻强调，金融大模型的技术发展，还要脚踏实地。金融大模型技术一定要跟业务强结合，在整个实践过程中每个阶段都要赋能金融业务流程带来价值，从而证明自身价值，才能发展下去。
　　“数据怎么安全和合规的采集、管理和使用，是大模型生态底层的问题。”谈及金融大模型发展面临的挑战，费浩峻直言，整个行业都面临着数据安全合规和隐私防范的一大挑战。对此，行业通常的做法是建立起数据围栏，将所有数据进行严格脱敏，并在指令级建设安全围栏，对所有输入的指令进行多层检验，防止大模型被恶意使用。
　　而生态层面，模型不断的升级，以及这个过程中的自我革新同样也是挑战。在他看来，现在金融大模型能力要做到金融专家的水平还需要数据和技术的不断衍生，但这个过程必然会跟过去的系统产生冲突，如何取舍、废弃过去的东西，要有一定的决断。

浏览过的版块