百度王海峰:大模型产业落地可采用集约化生产、平台化应用模式

专注AIGC领域的专业社区,关注OpenAI、百度文心一言等大语言模型(LLM)的发展和应用落地,关注LLM的基准评测和市场研究,欢迎关注!

7 月 28 日 -30 日,顶级学术会议 ACM 中国图灵大会在武汉举办,围绕 " 通用智能,人机共生 " 主题,图灵奖得主、中国科学院院士、企业代表等与会探讨尖端技术及人工智能发展,展望计算科学未来。

百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰解读文心大模型的核心技术,阐述人工智能产业模式,为人工智能技术及产业发声。据了解,文心一言已成为百度员工工作中的 " 超级助理 ",Comate智能编码伙伴帮助 80% 百度工程师提升编程效率,改变了程序开发模式,吸引 100 多家合作伙伴。

百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰

飞桨开发者数量已达到 750 万

当前,人工智能已经成为新一轮科技革命和产业变革的重要驱动力量,而深度学习是其关键核心技术,具有很强的通用性,呈现出标准化、自动化、模块化的工业大生产特征,推动人工智能进入工业大生产阶段。大模型具有效果好、泛化性强、研发流程标准化程度高等特点,成为人工智能发展的主流方向。

人工智能时代,IT 技术栈发生根本性改变,从芯片、操作系统和应用三层架构,转变为芯片、框架、模型、应用四层架构。深度学习框架和大模型构成了产业智能化基座,支撑各行各业的应用智能化重构。

百度在 " 芯片 - 框架 - 模型 - 应用 " 人工智能四层技术栈全面布局,自研的深度学习平台飞桨支撑了文心大模型的高效训练和推理,截至目前飞桨平台开发者数量已达到 750 万。IDC 报告显示,百度稳居中国深度学习平台市场综合份额第一。根据中国信通院发布的《深度学习平台报告 ( 2022 ) 》,飞桨是中国深度学习市场应用规模第一的深度学习框架和赋能平台。

据 IDC 报告,文心大模型综合评分第一,算法模型第一,行业覆盖第一

据了解,文心一言是百度自主研制的知识增强大语言模型,首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强等技术优势。

王海峰解读了文心大模型 3.5 的核心技术创新,通过飞桨与文心协同优化,文心大模型 3.5 实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,模型效果提升 50%,训练速度提升 2 倍,推理速度提升 30 倍。

在基础模型训练上,采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,并采用多种策略优化数据源及数据分布,加快了模型迭代速度,显著提升了模型效果和安全性。同时,百度研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,进一步提升模型效果及场景适配能力。

在知识增强和检索增强基础上,文心大模型 3.5 提出了 " 知识点增强技术 ",使得模型能够更好地利用精细的知识点来提升理解生成等方面的能力,进而提升对世界知识的掌握和运用。

在推理方面,通过大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络技术,提升文心大模型 3.5 在逻辑推理、数学计算及代码生成等任务上的表现。

文心大模型 3.5 还新增了插件机制,包括官方插件百度搜索和 ChatFile,使得文心一言能够生成实时准确信息和长文本摘要,拓展了大模型能力边界。

根据 IDC 最新发布的《AI 大模型技术能力评估报告,2023》,百度文心大模型 3.5 在14 个参评模型中拿下 12 项指标的 7 个满分,得到 " 综合评分第一,算法模型第一,行业覆盖第一 " 三个绝对第一。

本文来源紫金财经,如有侵权请联系删除

END