入局Chatgpt,看国内大厂都在做什么


ChatGPT的概念从年初火到现在,在全球大型科技公司加入战局后,这一概念的热度不断拔高。放眼全球,微软有Open AI,谷歌转向Anthropic,微软AI事业靠着ChatGPT扶摇直上,谷歌向人工智能初创企业Anthropic投资约3亿美元,以期在当下火爆的“生成式人工智能”领域占据一席之地,紧随其后,亚马逊近日宣布正在扩大与AI初创公司Hugging Face的合作,进军Chatbot(聊天机器人)领域,并将通过Amazon Web Services提供Hugging Face的产品,其中包括与ChatGPT背后技术所竞争的语言生成工具。



2023年虽然只刚刚到来2个月,却足以称得上是“世界AI自动化大年”,ChatGPT的问世将AIGC的发展推到了新的高度。毫无疑问,如今的ChatGPT俨然已成了人工智能“顶流发展方向”,国内有实力的科技公司都在加紧开发自己的AI产品。


截至目前,已经宣布拥有类似ChatGPT技术储备、准备发布和已经发布类ChatGPT产品服务的国内大厂包括:阿里巴巴、腾讯、百度、华为、字节跳动、京东、360、科大讯飞、快手、网易有道等,超过10家互联网巨头纷纷进入了热门的ChatGPT领域。


百度的掌门人李彦宏在百度一季度OKR中就浅浅地放了句狠话,“引领搜索体验的代际变革,全线接入文心一言。”到2月7日“文心一言”就宣布了内测,且在3月面向公众开放。其实早在ChatGPT在用户层面爆火之前,百度早就基于自身的AI全栈能力做了增强大模型“文心”,只不过不是GPT方向,而是面向工业、能源、金融、通信、媒体、教育等各行各业的产业方向。底层技术早已经有了累积并在B端跑通了,百度顺着ChatGPT的热度官宣推出“文心一言”也就是加个C端交互系统。



腾讯官方和研究院也先后对外表示鹅厂在ChatGPT相关技术早有布局,并隐隐表示自己的AIGC大模型并不比OpenAI等国外科技公司差。腾讯官方对媒体的说法是在ChatGPT相关方向上已有布局,专项研究也在有序推进。


腾讯的混元大模型集CV(计算机视觉)、NLP(自然语言理解)、多模态理解能力于一体,先后在MSR-VTT,MSVD等五大权威数据集榜单中登顶。2022年5月,腾讯“混元”AI大模型在CLUE(中文语言理解评测集合)总排行榜、阅读理解、大规模知识图谱三个榜单同时登顶。12月,混元推出国内首个低成本、可落地的NLP万亿大模型,并再次登顶自然语言理解任务榜单CLUE。混元用千亿模型热启动,最快仅用256卡在一天内即可完成万亿参数大模型HunYuan-NLP 1T的训练,整体训练成本为直接冷启动训练万亿模型的1/8。


阿里方面,2月9日,阿里的达摩院版ChatGPT在内测中预先曝光。该新产品具备多种功能,包括知识问答、人工智能绘画、代码生成、小说续写、文案撰写和写诗作词等。在人工问答的水平方面,达摩院版ChatGPT已经实现了相对真实的回答,同时也能实现多轮问答。实际上,在2022年5月,阿里公布了相应的能力,在AIGC方面,随着超大规模多模态预训练模型M6的发布,生成的实景图片已经非常逼真。还有消息称,阿里正在研究AI大模型技术怎么和钉钉深度结合。


2 月 10 日消息,据科创板日报报道,华为计算产品线相关负责人就“华为在类似 ChatGPT 方向的布局”回应称,公司 2020 年开始在大模型有布局,2021 年发布了鹏城盘古大模型,包括 30 亿参数的视觉(CV)预训练模型,以及与循环智能、鹏城实验室联合开发的千亿参数、40TB 训练数据的中文语言(NLP)预训练模型,是业界首个千亿级生成和理解中文 NLP 大模型。华为云盘古大模型可以实现一个 AI 大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,并使用 ModelArts 平台,让 AI 开发由作坊式转变为工业化开发的新模式。



京东方面,2月10日下午,京东宣布,京东云旗下言犀人工智能应用平台将整合过往产业实践和技术积累,推出产业版ChatGPT:ChatJD,并公布ChatJD的落地应用路线图“125”计划。据悉,ChatJD将以“125”计划作为落地应用路线图,包含一个平台、两个领域、五个应用。京东副总裁何晓冬表示,京东在ChatGPT领域拥有丰富的场景和高质量的数据。未来京东也会不断结合ChatGPT的方法和技术点,融入到产品服务中来,推动人工智能的产业落地。



字节跳动方面,多个消息来源透露,字节跳动正在布局大模型,在语言和图像两种模态上发力。报道称,其中,语言大模型团队由字节搜索部门领导,目前规模在十数人左右;图片大模型团队由产品研发与工程架构部下属的智能创作团队牵头。语言大模型团队负责人与图像大模型团队负责人的间接和直接汇报对象,均为 Tik Tok 产品技术负责人朱文佳。对此,字节相关技术负责人回应称,技术中台在这些领域有探索,但还很初期,不成熟。另有知情人士表示,字节跳动语言大模型团队在今年组建,探索方向主要为与搜索、广告等下游业务的结合,语言大模型团队的预期是在今年年中推出大模型。




——————   END  ——————


本文来自斯巴诺萨设计