平安人寿:算力和语料,是制约保险领域大模型应用的首要挑战


嘉宾 | 魏政刚 平安人寿科技总监
作者 | 李忠良
策划 | 高玉娴
大模型如火如荼,在保险领域也开始广泛应用。这不仅标志着科技与传统行业之间的融合越发紧密,也预示着一个全新的、更加智能化的保险时代即将到来。
有消息称,平安集团正在研发上千亿参数的模型。结合其以往在人工智能上的探索和应用经验,平安在大模型领域采取了综合性的策略,而非仅仅聚焦于提供某一类服务,如单纯的聊天或问答功能。
在日前的 InfoQ《超级连麦·数智大脑》直播节目中,德邦基金 CTO 李鑫与平安人寿科技总监魏政刚、阳光保险集团人工智能部大模型首席专家张晗深入探讨了“大模型在保险业务全链路的应用”。
魏政刚指出,国内保险行业的业务模式以代理人为中心,因此人工智能和数字化转型的关键问题也是与代理人紧密相关。以平安人寿为例,其推出了基于大模型的数字人产品,主要用于协助代理人与客户沟通。这对初入行业的代理人提供了极大帮助,可以指导他们与客户交流、收集信息并提供合适的产品推荐。
当然,魏政刚也进一步解释,这不意味着大模型在保险价值链的其他环节不被应用。实际上,核保、保全、理赔等多个环节都已广泛采用人工智能技术。
但是,如果要进一步实现大模型的规模化应用,保险业还必须搞定来自应用场景、语料、算力、底层技术理解、人才等五个方面的挑战。其中,算力能力与语料准确性更是重中之重。
本文整理自李鑫与魏政刚的对话内容(经 InfoQ 进行不改变原意的编辑整理):
李鑫:当前,国内保险行业的发展趋势如何?同时,数字化转型对保险行业又将带来哪些机遇与挑战?
魏政刚:国内的保险业务模式主要以代理人为核心,即专属代理人模式。事实上,大部分保费和成交都是通过这个渠道完成的。当然,还有其他的销售渠道,如电网销、独立经纪人等。
人工智能和数字化转型方面,问题的核心也是围绕代理人展开。在保险行业,有内勤和外勤之分,外勤通常指代理人,而内勤通常指公司总部、机构等员工。在代理人运营及其营销推广服务方面,我们看到大量的机会可以通过数字化技术来加强。
关于数字化与保险行业的结合,我们从两个维度来看:一是保险行业的价值链,二是数字化与人工智能技术的层次
在探讨保险行业中的应用与技术结合,我们首先看这个行业的价值链或横轴。其起始点从投入开始,紧随其后的是营销和销售,接着是新业务的管理。当保单进入系统后,下一步则是核保环节。之后是我们提供的客户服务,有时也被称为保全,最后则是理赔环节。总结下来,在这个横轴上,我们主要关注五个大环节:营销、销售、新业务、核保和理赔
从纵轴来看,这代表了人工智能的技术发展。其最底层是非常基础的原子性函数。这一层在西方的发展特别显著,因为很多底层逻辑和数据推导都起源于此。再上一层则是基础模型,如 CNN、KN、RNN 以。再往上,则是组合算法层,其中包括多种算法的组合、参数配置以及我们在算法上的调优。再上一层,我们看到了许多人工智能框架,以及尚未开源的一些大型模型如百度、腾讯、阿里等。
在这基础上,我们面临的问题和机会点出现在横轴上的各个环节中。总的来看,人工智能大模型在保险行业的应用不仅仅是数字化的表现。人工智能为保险行业带来了巨大的促进作用,不论其是否能够引发新的商业模式,我们至少可以看到,它对我们的成本降低、业务发展、代理人的展业活动和增员板块带来了明显的促进,尤其是今年我们倡导的 MVP、QVP FVP 等方面的举措。
李鑫:在平安人寿,目前人工智能技术应用有什么关键进展?
魏政刚:平安集团及平安人寿很久之前便开始了人工智能产品的研发。在大模型还未在市场大放异彩之前,我们已在基础的 AI 应用上对各种产品进行了实际体现。以 2019 年和 2020 年为例,为了应对远程工作需求,我们推出了智能拜访助手。这是一个综合应用了 AI 技术的工具,涵盖了语音、画像、视频以及自动生成的话术等功能。
从应用角度看,人工智能的应用可以概括为文本、语音和图像视频这几大方向。但当它们综合运用时,就面临如何在产品形态中完美结合,以及如何将其放入最恰当的使用场景中的问题非常重要。因此,我们的努力不仅仅是在探索和使用 AI 技术,更多的是在产品的适配性和形态打磨上。
对于大模型,其在市场上的应用开始于去年下半年。随着例如 ChatGPT 在市场上的推广,我们从集团层面开始大量投资。有消息称,我们正在研发拥有千亿参数的模型。结合我们以往在人工智能上的探索和应用经验,我们采取了一个综合性的策略,而非仅仅聚焦于提供某一类服务,如单纯的聊天或问答功能。
我们所推进的技术和应用都紧密结合了我们的业务场景,而主要的焦点仍然在营销和销售端。可能有些人会好奇,为什么是营销和销售端?在保险产品方面,其同质性是显著的。保险产品并不像简单的消费品容易理解,它不仅需要一定的知识体系,还需要个人的体验以及结合理性和非理性的销售要素。
从销售的角度看,第一是保险的基本原理:第二是保险产品的知识体系,每家公司都提供的数百种保险产品,每种产品的结构,以及每种产品所带来的保障利益和应对风险的要素。因为保险消费者的需求是多样的,例如理财、保障、税收优惠、财产传承等。因此,对产品的深入了解和知识体系是至关重要的。
第三是关于销售技巧的深化和延展。在保险代理人的发展中,过去是红海模式,即“大进大出”的模式。在最高峰时期,中国的专属代理人数量达到了 1000 多万,而现今只剩下约 400 万,这样模式导致了代理人在销售技能上的参差不齐。销售是一个非常讲究专业性的领域,存在许多销售技巧。除了培训代理人,我们还需要启迪和教育客户,使他们了解保险的益处。
在保险行业中,需求激发是至关重要的一步。大部分人可能会直接表示没有保险需求,但实际上,每个人都有潜在的保障需求和对保险的期待。如何挖掘和激发这些需求是一个巨大的课题。而在这方面,大模型相对于其他技术具有显著的优势。大模型可以模拟人的思考和认知,可以为我们寻找最优解。
我们大量地聚焦在销售和营销上。但这并不意味着我们在价值链的其他环节没有利用大模型。事实上,人工智能被广泛应用于多个领域,如核保、保全、理赔等。例如,在客户服务方面,我们可以利用大量的保单信息和客户在 C 端平台上的行为轨迹来提供更优质的服务。
李鑫:当前的通用大模型在商业化应用中面临哪些主要挑战?如何有效地突破这些障碍?
魏政刚:对于当前大模型在商业化应用中的挑战,以下几点尤为关键:
  1. 水平应用与垂直应用:从业界沟通来看,国内市场上,针对终端消费者(ToC)的水平应用投入巨大且机会较小。相比之下,垂直应用结合针对企业的应用(ToB)可能是未来的趋势。


  2. 算力问题:尽管某些应用不需要广泛的算力,但在深度学习模型的训练和推理过程中,算力仍然至关重要。当前的应用需要降低某些参数设置以适应算力限制。尽管这是一个短期挑战,随着国际关系的改善和国内半导体研发的进步,中长期内这一问题有望得到解决。


  3. 语料问题:相比英文,中文语料在质量和结构化方面都存在挑战。这可能与语言特性和知识沉淀有关。特别是在保险这一行业,大量的销售技巧和知识被深埋在代理人的经验中,而这部分知识难以被结构化。尽管从英文转译到中文是一个方法,但直接从业务伙伴和代理人中提炼中文语料,或使用像 ChatGPT 这样的模型生成语料,可能会更有效。


  4. 底层技术理解:虽然国内大部分 AI 应用都是在应用层,但对底层技术的深刻理解至关重要。这包括算法选择、激活函数的选择、微调策略等。这种深入的技术理解与业务理解结合起来,对于产品的成功至关重要。


  5. 人才问题:我们需要业务和技术双背景的复合型人才,他们需要对业务有深入理解,同时对技术也有足够的掌握。
在发展前景上,大模型和多模态技术在 IT 与 AI 领域持续显示巨大潜力。虽然许多传统 IT 和 AI 技术已广泛应用,但像 Stable Diffusion、Midjourney 这样的大模型技术仍有巨大的想象空间。特别在中国这样的劳动密集、专业化市场,对这些技术的需求尤为旺盛。
以平安人寿为例,我们推出了数字人这类基于大模型的产品,主要协助代理人与客户沟通。这对初入行业的代理人特别有助,因为它可以指导他们与客户交流、收集信息并提供合适的产品推荐。虽然已获得正面反馈,但我们仍秉持互联网的试错精神,不断创新。
但我们也面临挑战,就是上面谈到的五方面。尤其在金融行业,第三点更为重要,也就是语料的准确性,因为行业受到严格监管。大模型有时会输出不准确的信息,这有很大的问题。我们现在的研究的重点是模型的实用性和合规性。对于合规性,我们不仅需要在监管文档上训练模型,还要结合实际监管案例。仅依赖大模型可能不足,像 LLaMA2 这样结合不同算法的方法可能更为有效。
李鑫:在国内,大模型是否在 ToB 和垂直领域机会更多一些?
魏政刚:关于大模型在业务应用上的选择和定位,可以从两个维度来考虑:水平和垂直
首先,ToC 即面向消费者的应用,其投入巨大。在国内这一领域,几个龙头企业已经初露锋芒。与美国的情况相似,这些领军企业拥有雄厚的资金,对基础研发都非常重视。对于我们这种更偏重于金融领域的公司,如果要在 ToC 方向发力,就必须深入一个具体的垂直细分领域。因此,对于平安这样的金融科技公司,垂直应用更为合适,因为我们的目标是在金融领域通过技术进行赋能。
从平安集团的策略来看,我们正在大力发展大模型技术,已经取得了一系列进展。平安作为一家综合金融加医疗服务的企业,科技驱动下涵盖了银行、证券、保险等多个金融细分领域,因此我们需要一个深入金融领域的垂直模型。
在选择 ToC 或 ToB 时,我们也要考虑到当前大模型的特性。例如,大模型的训练是基于一段时间内的语料,而不是实时更新的。但未来,大模型可能会与搜索引擎等实时应用更紧密地结合。因此,在此背景下,面向消费者的 ToC 可能更适合由科技巨头来开发和维护。总结来说,我们认为垂直应用面向企业ToB 模式更为合适。
李鑫:未来,随着通用大模型的发展,是否会逐渐替代目前的专用 AI 模型?
魏政刚:特定领域的 AI 技术,尤其是针对图像和语音的技术,并不会被完全取代。例如 OCR、CNN、RNN 等算法框架和基础算法仍将被广泛应用。在 NLP 领域,像分词这样的技术可能会受到挑战,因为当我们有了更先进的 Transformer 技术来解决问题。无论从学术还是工程的角度,研究和关注的方向都需要适时调整。
这不仅仅是一个简单的"yes"或"no"的问题,我们需要从两个维度去看待这个问题:一方面,从技术的分类和层次出发,看哪些技术应该或容易被替换;另一方面,根据所在行业的特性和价值链来决定哪些业务环节需要技术替换。如果某个特定的 AI 技术在特定业务领域已经表现得很好,那么可能就没有替换的必要。
决策需要谨慎,新技术出现并不意味着我们应该立即进行替换。但前瞻性研究和试点都是必要的。尽管传统领域中有些方法已经做得很好,但随着时间的推移,替代的机会和理由可能会出现。因此,我们需要两条腿走路:一方面是实际的生产和商业应用,另一方面是前瞻性的思考和尝试。这种结合可能会为公司带来更大的价值。
李鑫:大模型应用的投入产出比如何考量?
魏政刚:进行新技术的尝试者一定需要付出代价,但这个代价与其带来的收益并不是 1:1 的关系,而可能是 1:10。技术进步的过程中,尝鲜者有时会面临风险。我们真的需要从头训练我们的基座模型吗?在很多情况下,我们可以直接采用已经训练好的模型,如在金融领域,可以从集团获得已经训练好的模型,这样避免了重复劳动。但在特定的业务板块,仍需要进行训练。成本主要体现在训练和推理两方面
在我们的价值链和产业链中,选择在哪个环节进行突破,需要综合考虑业务需求、公司战略以及市场变化。对于中国保险行业,我们更多地将精力放在销售和代理人上,考虑其市场特点。在推理上,提示词工程和逻辑处理也非常重要。
面对大模型的成本问题,主要考虑的是业务与市场策略的结合,以及确保资金得到合理的使用。另一方面,科技人员应当追求简洁、低成本的解决方案。
总体上,技术投入与其带来的收益是值得的。这不仅是基于我们的增长预期,也基于我们对技术,尤其是人工智能和大型语言模型,能够真正为业务赋能的信心。平安人寿的改革成果也印证了这一点,从中我们可以看到生产力和收入水平的提升。然而,如何精确计算这种技术投入与业务收益之间的平衡点仍然是个挑战,特别是对于非 IT 企业。但从我们的实际经验和进步来看,我们相信这种投入是有益的
李鑫:关于大模型在保险行业未来 3-5 年的应用和发展的趋势,您如何看?
魏政刚:金融领域,尤其是保险行业,与科技的结合是当前的趋势。此前有关于“元宇宙”的讨论,这种科技能力的广泛应用也表明了科技在保险业的重要性。然而,业内的变革和演变往往需要时间。例如,从传统的代理人模式逐渐转向更高质量的模式,这一过程已经持续了很长时间,且仍在进行中。
人工智能和大语言模型在这个领域的应用,在 3-5 年内可能更多是补充性质,并不会完全替代。而且,业务可解释性是关键,人工智能和大数据的应用需要能够解释其决策和行为。中国的保险行业是强监管的,因此行业的发展和兴衰周期往往受到监管政策的直接影响。对于技术的适配性,我认为周期会更长。
未来的方向应该是释放人的潜力,将人从繁琐的日常任务中解放出来,使其能够专注于更具挑战性和深度的问题。如果未来的保险代理人或经纪人都是来自顶尖大学,那么这将是一个很好的趋势标志。在销售方面,可能会出现更多的数字化产品和形态,比如数字化的代理人。
总的来说,科技在保险行业中的进步和应用空间越来越大。中国的金融行业和企业需要找到与西方不同的发展路径,而科技结合将是这条路径的核心。希望保险行业能够通过与科技的结合,提供更真实、本质、科学和理性的服务,真正帮助人们,推动社会进步。
 关于 FCon
首届 FCon 全球金融科技大会将于 11 月 19-20 日在上海举办。大会将围绕金融领域数字化转型挑战探索、DevOps 在金融企业落地实践、金融行业大模型应用、创新的金融科技应用、金融实时数据平台建设之路、金融安全风险管控、数据要素流通与数据合规等 10+ 专题进行交流。
目前大会邀请了汇丰科技中国区的代理总经理马国栋、度小满金融数据智能部总经理杨青先、蚂蚁集团副总裁 & 首席技术安全官韦韬博士、恒生聚源总经理吴震操担任大会联席主席。更多嘉宾仍在邀请中......
我们诚挚地邀请您加入我们,共同探索金融科技的未来。
扫码或点击阅读原文即可查看全部演讲专题:
目前是 7 折特惠购票,报名立减 ¥2040,咨询购票可联系:17310043226(微信同手机号)。

 福利通道
  • 关注InfoQ数字化经纬公众号,回复抽奖可以参与本周活动,有机会获得定制礼品。

  • 关注InfoQ数字化经纬公众号,回复「进群」加入数字化读者群交流。