火山引擎的大模型故事:不做产品,当好底座


 “在淘金时代,活下来的永远是卖勺子和卖铲子的人。“

来源  /   ToB行业头条  (ID:wwwqifu)  

作者 /  海阳 



进入白热化阶段的大模型竞赛,已经不只有单纯地短兵相接,还有一些实施“特定战术”的选手出现,例如火山引擎。

6月28日,火山引擎在“V-Tech体验创新科技峰会”上,公开发布了大模型服务平台“火山方舟”,为企业提供模型精调、评测、推理等全方位的平台服务(MaaS)。

火山引擎总裁谭待强调到:“火山方舟最终服务的是模型的应用方;火山引擎是跟大模型的生产方合作,一部分被精选的大模型厂商在火山方舟上部署,然后对外提供服务。”

不做大模型产品,要做大模型底座。火山引擎此番做法引起了行业热议,大家纷纷在思考为什么火山引擎明明具备研发大模型产品的能力,却甘愿做底座呢?火山引擎的葫芦里究竟卖着什么药?

01

通用or 垂直?
全都要的火山引擎

当百度、阿里巴巴、腾讯、360、以及诸多知名研究机构纷纷拿出一款款大模型产品之后,人们万万没想到火山引擎会选择了另一个路径。

因为在大众眼中,字节跳动不仅在AI方面的积累深厚,早已构建出了“视觉语言模型+火山高速训练引擎+火山机器学习平台+行业应用”的AI生态体系。

正是存在这样的认知,于是在今年4月份,当市场有声音称“火山引擎不会做大模型”之后,大众没有选择相信。可伴随着火山方舟的正式发布,这个曾经被忽略的信息彻底被坐实。与此同时,“火山引擎为什么不做大模型,要做大模型底座”的话题,也引发了广泛讨论。

一些人认为,火山引擎不做大模型很可能是因为大模型赛道竞争过于激烈,从技术到宣传,每个环节都太卷了,这让火山引擎对入局没有充足的信心可以杀出重围。

然而这样的想法并不正确,因为他们过于关注前半句“不做大模型”,少有在后面“做大模型底座”方面思考。因为“做大模型底座”本身就代表着火山引擎已经入局大模型赛道。只不过与其他选手相比,前者是自己端着自身产品进行竞争,后者是端着合作伙伴的产品竞争。至于为什么要选择不自研大模型,“通用 or 垂直”的选择或许是一个重要因素。

做大模型在某种程度上其实与做产品相同,亦有“通用 or 垂直”的思考:

通用大模型是聚焦基础层,以技术攻关为目的,优异之处在于应用范围足够广,弊端在于对于诸多细微场景理解不够透彻,有时对一些细微环节产生的效果不太明显。

垂直大模型是聚焦具体垂直场景领域,以产品开发为目的。优异之处在于特定场景下的解决问题能力优秀,具备深厚的行业Know-how积累,弊端在于除特定场景效果可能有所下滑。

而市场需求是多样性的,单垂直、单通用大模型的应用,都无法实现带动千行百业,因此市场未来一定是多模型、百花齐放。

但是在当下,虽然像张勇、李彦宏等诸多科技大佬都在表明:AI 大模型时代,每个行业的应用都值得重新做一遍。但是如何将每个行业应用重做?重做之后有明显的价值吗?对于上述问题市场方面尚未出现一个共同认同的方向。

基于种种行业情况,火山引擎更愿意以平台方式来助力大模型生态。相反作为底座,火山引擎只需通过打通底层的技术结构、规范协议等,就能为自身的火山方舟MaaS平台上接入诸多大模型产品,不仅包括垂直、通用两种类型的大模型服务。同样对于精力、财力、时间成本的损耗控制到完全能接受的状态。

于是,当这条既能快速进入“大模型竞赛”不失先发优势,又能兼具多种类型大模型产品服务的路径被发现后,这无疑成为了火山引擎重点考虑的执行选项。

02

没想赢得最多
但赢面最大

除上述以外,促使其推出“火山方舟”平台,以大模型底座的样貌入局的另一个重要原因,则是火山引擎“没想成为赢得最多的入局者,而是想成为赢面最大的入局者。”

在任何领域赛道,赢者通吃一直被大家提及,可基于事实固然能看到头部厂商占据着极大市场份额,但是整个赛道已经是百花齐放的状态,例如网约车赛道。造成这个现象的原因在于,基于不同用户、客户们的多元且个性化的需求,供应端也会呈现千姿百态,这为赛道内众多企业提供了一定的生存空间。

同样,大模型赛道也是如此。谭待表示,企业使用大模型,未来可能会呈现“1+N”的模式:“1”是通过自研或深度合作,形成1个主力模型;由于成本和场景复杂多元等原因,在这个主力模型之外,还会有N个模型同时应用。

至于为何如此,谭待讲到,一方面是企业使用大模型,最担心的是数据泄露;如果将大模型私有化部署,企业将承担更高的成本,模型生产方也会担心知识资产安全。另一方面则是企业不必急于绑定一家大模型,而是应该结合自身业务场景,综合评估使用效果和成本,在不同场景选用更具性价比的模型,甚至是组合模型服务。

例如,北京城市大脑大模型项目,可能就是考虑到上述情况,于是由中关村科学城城市大脑和科大讯飞两家企业开发,以科大讯飞的“星火”基础大模型和中科大脑公司“如如ChatTT”行业大模型所打造。

火山引擎又是信奉“实用主义”的团队,无论是一直强调的“业务价值驱动”、“云上增长新动力”的目标,还是推出A/B测试、IaaS层的自研DPU、抢占式实例SPOT,到分布式云原生平台、混合云veStack、多云安全平台,都指向火山引擎的服务目标是要有具体价值呈现的服务。

“火山方舟”的使命是加速大模型和大算力的应用落地,加快大模型在各行业发挥商业价值。火山引擎智能算法负责人吴迪讲到:“火山方舟”致力于帮助千行百业,更容易地获取模型,更放心地使用模型,更高效地打造应用。希望在模型供应商和模型使用方之间,促成“研究-训练-应用-变现-反哺研究”的正向循环

根据公开资料显示,对模型提供方,通过 “火山方舟”能够以更低的成本触达海量客户,更小的代价在ToB市场实现规模化;严谨的安全互信机制,兼顾灵活性与安全性等,最终形成最具竞争力的性价比。

对模型使用者来说,通过 “火山方舟”可以便捷地接触到众多高质量的基座模型,一站式对接多家模型提供商,为不同场景选择最合适的模型。

整体来说,成为大模型底座可以让火山引擎、大模型厂商、大模型使用企业共同获利,并形成一个不断实现价值上升的飞轮,对于任何一方都会获得利好。

所以,即便火山引擎在这个飞轮中并不是直接的掘金者,没有一次获取巨额价值的机会,但好在这个办法稳妥,赢面最大。

03

前行路上的挑战
以及已做的应对之法

任何事情都有两面性,火山引擎选择做大模型底座也不意味着稳赢,其前行路上同样有所挑战。分别是安全、生态稳定性。

安全方面,平台的正向发展,就要承接住大量的合作伙伴、使用者入驻,并保障双方在广泛接洽中的信任问题,保障双方的安全,这点在大模型赛道也是如此。

谭待讲到,企业使用大模型,最担心的是数据泄露;如果将大模型私有化部署,企业将承担更高的成本,模型生产方也会担心知识资产安全。

然而,目前在大模型赛道,安全问题颇为严重。据网络安全公司Cyberhaven的调查,至少有 4%的员工将企业敏感数据输入 ChatGPT,敏感数据占输入内容的比例高达 11%。像今年初,三星公司在使用 ChatGPT不到20天时,就发现其半导体设备相关机密数据被泄露,并连续发生3起类似事故。

而作为平台方的火山方舟,要想推动整体的正向发展,就需要做以解决。对此火山引擎心知肚明,也推出相应的解决方案。

火山引擎智能算法负责人吴迪介绍到,“火山方舟”已上线了基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现了模型的机密性、完整性和可用性保证,适用于对训练和推理延时要求较低的客户。

不仅如此,“火山方舟”还在探索基于NVIDIA新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案,更全面地满足大模型在不同业务场景的数据安全要求。

可以说,在安全方面火山引擎已经让火山方舟做足了准备,这方面在未出现情况之前是过关的。

生态稳定性方面,这是任何平台能否成功、能否持续成功的最重要的因素之一。它代表的是平台方如何协调好平台入驻合作伙伴,以及与平台之间的黏性问题。毕竟对于任何平台来说,不论是入驻合作伙伴的退出、用户的退出,都将影响着平台上的所有人的想法与观点。

而对于火山方舟而言,生态稳定性方面更为重要。在前中期,能否持续的且有序的丰富生态圈,吸引更多用户进入,而形成的生态发展正循环显得十分重要,这需要火山引擎在前期制订好良好的合作协议、用户使用权益等等。

到后期,伴随着各生态伙伴的发展,且逐步成为行业头部后,如何体现自身平台重要,避免一个个达到一定规模的合作伙伴轻视平台生态、甚至跳出平台生态,进而自立门口。

目前火山方舟在“V-Tech体验创新科技峰会”宣布已集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研院所的大模型,并已启动邀测。其颇为丰富的模型生态证明了在当下阶段其平台具备不错的吸引力,以及对合作伙伴的价值。

从来就没有什么是唯一的正确,因为条条大路通罗马。火山引擎入局大模型赛道的方式,就如同选择了一个少有人尝试,但依旧能清晰看到前方的道路,发展同样可观,未来值得期待。





加入我们

专题推荐

▼点击图片即可跳转阅读


点个「在看」,和我们一起聊聊

本文来自ToB行业头条