大模型是唤醒数据的一个重要“闹铃”

AI会颠覆ToB软件吗?

这是近期「ToB行业头条」在采访ToB创业者时讨论度最高的一个问题。

创业者们在思考如何利用这个颠覆性机会构建新的护城河,但现实情况却是,当下的生成式AI仍有一定的局限性,与ToB软件/产业的结合更是一个需要被反复论证迭代的过程。

为此ToB行业头条」推出【AIGCx企业服务】系列专题,希望通过分享一线创业者们今时今日对AI的思考与判断,找到「AI将如何颠覆ToB软件」这个终极命题的答案。

专题报名请联系策划:瑞雪(wx:furuixue224)


出品ToB行业头条(wwwqifu)

采访对象惟客数据 李翔
作者樊航

大模型之风席卷至今,人们已经对大模型的狂热,逐渐转向对商业化落地效果的冷静审视。

尤其是在ToB市场,文旅、金融、零售、制造等领域都在依靠大模型进行智能化探索,业内从业者更是形成这样的一个共识,在通用大模型基础上经过行业知识精调的行业大模型,其在特定工作场景的表现,通常会优于通用大模型

不论是BAT等互联网大厂,还是有着“AI四小龙”之称的科技公司以及各垂直赛道的头部企业都争先开启了行业大模型的布局。

「ToB行业头条」观察到,专注于以数据赋能企业经营的大数据和人工智能第一梯队企业惟客数据自ChatGPT出现后就开始了探索,除了联合合作伙伴研发行业大模型外,还将之应用到了内部开发人员使用的场景,以及给已有产品赋能的场景中。

按照惟客数据AI 算法专家李翔博士的说法,数据是企业重要资产、是生产要素、是企业重要决策支撑之一,但唤醒企业沉默数据让其真正产生可见的业务价值仍然是亟需解决的难题,而大模型的出现就是唤醒数据的一个重要的“闹铃”。

很显然,对于如何让大模型深入落地,在更多场景中把大模型的能力真正用起来。惟客数据已经有了自己的理解,为此「ToB行业头条」采访了惟客数据 AI 算法专家李翔博士,从模型选择、应用实践、商业化考量等多方面进行了探讨。

以下为采访原文,经「ToB行业头条」编辑整理:

ToB行业头条:首先我们谈谈“入局最佳时机”问题, 实际上国内众多企业信息数字化的水平和整体能力相对落后一些,对新兴技术的需求也要滞后,尤其对当下的企业而言,对数据资产的建设以及通过数据赋能企业经营可能仍然处于数据治理阶段,也就是大家所谈到的打通数据孤岛,唤醒数据的阶段。

那么对于以数据赋能客户经营数字化赛道的企业而言,当下拥抱大模型技术,是一个好的时机吗,为什么?

李翔:绝对是一个很好的时机,「势」来了,「而为」就行了。

打通数据只是当下企业的一个小目标,只是让“看数据”这类简单的数据应用变得可行,但数据的价值远不止如此。

为什么要唤醒数据?就是因为数据的价值没有真正被发挥出来,产生可见的业务价值。现如今,数据早已是企业重要资产、是生产要素、是企业重要决策支撑之一,但碍于成本、业务理解、技术等多方面因素,实际使用效果有限。

而大模型就是唤醒数据的一个重要的“闹铃”,大模型的出现,可以解决掉其中很多的细节问题,比如落地一个AI应用的成本,在某些场景下,比如客服、知识库问答等,相对于以前的实施成本,可以降低90%+,而且效果还可以大幅度提升。

总的来说,无论是哪条赛道,当前拥抱大模型,都是一个非常好的时机,尤其是注重数据和应用赛道的我们来说。

ToB行业头条:大模型浪潮之下,惟客数据看到的短期机遇是什么?长期机会又在哪里?

李翔:短期机遇有两个,一个就是结合大模型去赋能自己已有的产品,降低产品的使用门槛,提供一些提高人效的功能,比如自动化营销产品,现在可以直接在产品中基于大模型生成对应的营销素材,提高产品的竞争力。

另外一个就是内部提效,比如软件工程师,通过大模型可以在软件开发的各个过程中提效,像DDD领域建模中的架构设计,单元测试代码的自动生成等,可以大幅度提高软件开发和项目交付的效率。

长期机遇来看,就是基于大模型结合行业数据和场景找到更多的数据服务和应用,为此我们还打造了WakeMind平台,通过标准化一些通用的流程和操作,提高开发基于大模型的应用的效率,同时还支持私有化模型的订制和部署服务

ToB行业头条:我们观察到WakeData此前推出的行业大模型WakeMind是联合战略合作伙伴共同研发的,行业大模型联合研发是基于什么样的考虑?

李翔:我们有真实场景和行业经验的积累,这些正是通用大模型不能解决的那些垂直问题所需要的,我们有微调百亿参数模型的软件和硬件能力,但没办法对千亿参数模型做微调,无论是所需要的硬件成本,还是模型收敛的难度所要求的能力,都远高于百亿模型。

但我们还是想探索一下千亿模型对解决实际问题的效果的上限,所以才需要和第三方联合研发,并且把微调后的模型通过蒸馏裁剪的方式再压缩到百亿规模,对应的效果上限也会比直接微调百亿模型要高一些,压缩的初衷也是基于可商用的成本考虑。

ToB行业头条:作为一个仅仅成立五年的以大数据和人工智能为核心的企业而言,能快速响应这一波浪潮,所具备的底蕴在哪里?

李翔:首先还是人才团队,在公司成立之前,核心创始团队就已经在魅族,从0到1打造了可以支持多个应用的、月活达到五千万用户以上的大数据平台产品,并在公司的各个产品和业务线上做了AI的落地和赋能

包括传统的AI落地,场景从用户画像的基础性标签预测,到搜索、广告CTR预估、feed推荐,技术侧从CV、NLP到基于深度学习的搜广推,覆盖了大部分互联网行业常见的AI领域。

另外包括团队经验,在最近五年在服务各个企业的过程中,团队积累到的非互联网场景下的行业和数据的理解,以及对线下企业做AI落地的经验

当然对大模型脉络的持续跟进也是一个很重要的原因,从最早的BERT、ERNIE到后来的千亿参数的base model,比如GPT3、悟道等,技术的敏感性也使我们在ChatGPT出来之前就对这个领域有了较为深入的理解,而且不只是对技术的理解,而且还在很多真实的场景做了对应的落地,比如基于BERT系的模型做微调,降低一些NLP任务对数据量和训练成本的要求、提高效果等。

ChatGPT引爆全球后,我们也在第一时间做了接入,并结合自己的产品和场景,做了相对的应用落地,打造了我们自己的WakeMind平台,可以快速搭建基于大模型的应用,对内赋能提效,对外用基于大模型的更好的产品去服务客户。

ToB行业头条:我们也知道当下不管是大厂还是各垂直赛道都在布局大模型,惟客行业大模型在未来会不会和这些大模型有重合?差异化在哪里?

李翔:我们在大模型侧的布局分为两个方向,第一个方向就是做大模型的应用,基于我们的WakeMind平台去快速搭建大模型的应用,在这个方向里面,已有的和未来的大模型都会是我们服务的提供方,我们直接使用这些通用大模型的能力去为企业做各个场景的落地和服务。

行业大模型和其他通用大模型相比有两个子方向的差异,第一个就是大模型由于缺乏垂直场景的数据,导致对垂直行业的理解不够深入,无法服务这些场景,即使基于langChain这些技术对通用模型进行简单的扩展,也只是把更多的上下文进行了处理和传送,这样并不能很好的解决对应的垂直问题;

另外一个就是数据隐私和安全的原因,需要做一些私有化模型的部署,这块从当前已有的大模型提供的服务来看,对这个的支持非常有限。

所以,基于我们在行业积累的经验以及已有模型对行业数据的学习,可以通过垂直领域的行业大模型把这个差异做进一步的放大。

ToB行业头条:惟客数据在应用层当下做了哪些探索,加持大模型能力的惟客数据产品又如何去帮助企业自我革命、提升效能,持续解放生产力?底层客户数据资产构建?中层客户经营旅程和经营规则?上层的多接触点营销链路?

李翔:应用层有两个方向,一个方向是赋能我们已有产品,通过改变交互的方式去降低产品使用门槛的方式,提高产品的竞争力。

比如在CDP客户数据平台领域,以前运营人员需要繁琐的规则设计才能圈选到合适的目标客群,现在则通过简单的语言描述和对话,即可以辅助找到对应的目标客群,去做对应的运营,大幅降低平台的使用学习成本,跨越式的提升使用效率和交互体验。

通过自然语言描述,系统就可以直接生成对应的目标人群,也可以通过语言描述就可以制定一个自动化的营销旅程,通过简单的修改,就可以完成一个营销自动化的复杂操作。

在MA营销自动化领域,将产品接入了微信生态、抖音、小红书等触点,并且支持自动化构建营销旅程,提供丰富的旅程模版库,可以实现“实时的、一对一的、个性化的”用户触达。

这其中有一个重要的环节是个性化营销素材的生成,包括文本、图片、图文混排等,可以大幅提升这个部分的效率和质量,同时降低成本。

另外一个方向是探索行业客户的具体需求并落地,比如投资助手、区域经营分析助手等,让大模型去理解垂直场景的繁琐的过程和材料,最终把这些信息通过简单的交互传递给人,也就是解决大量paper work需要处理的场景,这种场景是大模型擅长且提效最明显的。

ToB行业头条:做软件始终要降低自己产品的使用门槛,门槛每降低一点,就意味着潜在的用户指数增加的可能性更高一点,大模型能力是否在降低产品使用门槛方面做出贡献?举例说明一下。

李翔:这个肯定是可以的,大模型改变的就是人和任何软件和硬件的交互方式,让人不需要去学习复杂的操作过程,只需要通过自然语言的交互,就可以让大模型完成对应的软件和硬件操作。

拿我们已经落地的一些产品为例,比如数据平台,传统的方式需要专业的人员去理解业务的需求,再把业务需求转化成可以执行的数据查询语言,通过SQL在数据平台上执行,把对应的数据查询并返回。

现在我们已经可以在大部分场景下,只需要业务人员把需求用自然语言的方式描述出来,然后就可以通过大模型结合当前场景的数据字典,把自然语言转换成数据平台能理解的语言,并通过自动执行返回业务想看的数据指标。

ToB行业头条:想请您谈一下商业化的问题,目前惟客数据是否在大模型方面投入的成本和实际的商业化路径上有研判?请您分别阐述一下。

李翔:上面也提过,我们在大模型的方向有两个,基于通用大模型就是按照Token数进行收费,这个从当前的情况和未来的发展趋势来看,成本还是可以接受的。

另外对于行业大模型,我们不会基于千亿规模的base model去做微调,主要原因是从当前已有开源模型的效果和ROI判断的,所以通常的参数规模也是在百亿左右,这样基于DeepSpeed,单机多卡就可以做LORA或者P-Tuning的instruction微调。

而且相对来说,行业数据也不会像训练base model一样,需要海量的数据和计算,同时部署百亿参数模型所需要的显卡资源也是可以接受的,比如单机单卡就可以把模型推理服务部署起来。

ToB行业头条:如何看待大模型技术对这个赛道的长期影响?是赋能还是需要重构?新的创业公司还会有机会赶上吗?

李翔:长期来看,大模型技术是一个不可或缺的工具,类似于几十年前计算机对各个行业和赛道的影响。

既可以是赋能,也可以是重构,还是看具体的场景需求。比如上面提到的降低对已有产品的使用门槛来说,是偏赋能的,至于是否要完全重构,还是要看之后带来的业务价值是否足够大,ROI是否足够高。

对于新的创业公司来说,还是挺难的,因为很难拿出自己的壁垒,我个人觉得只有两个路径,要么基于行业理解,基于通用大模型和langChain,把行业理解沉淀到如何使用大模型的经验上,要么基于垂直场景和行业数据直接打造自己的行业大模型,最终的目的都是要打造对应的行业应用。

AIGC X 企业服务

专题更多内容,点击文章标题即可跳转阅读

《AIGC之于SaaS:深度探索,积极拥抱》

AIGC时代,设计软件应该做什么?》

AIGC技术赋能下,CRM市场格局将如何变化?》

《常垒资本石矛:对今年的大模型投资布局并不看好


专题参与请联系专栏策划:瑞雪(wx:furuixue224)





加入我们

专题推荐

▼点击图片即可跳转阅读


点个「在看」,和我们一起聊聊

本文来自ToB行业头条