从理论到实践：剖析 Aquila 模型的研发过程和未来展望_AI&chatGPT_长臂猿

长臂猿 >> AI&自媒体 >> AI&chatGPT >> 从理论到实践：剖析 Aquila 模型的研发过程和未来展望

从理论到实践：剖析 Aquila 模型的研发过程和未来展望

本周的 AI 技术圈依然热闹非凡，Claude 3 再度点燃 AI 战火，性能和速度全面赶超 GPT-4，Stability AI 发布论文来详细介绍了 Stable Diffusion 3 的底层技术 DiT（Diffusion Transformer）架构，英伟达禁止模拟运行 CUDA……回到国内，零一万物开源 Yi-9B 模型，北京智源人工智能研究院等研究团队提出 Cradle 框架，让智能体像人类一样直接控制键盘鼠标，腾讯和字节用 AI 技术再度展开社交领域的争夺战，QQ 测试 AI 聊天搭子，抖音退出「话炉」的 AI 社交 App……

创新与竞争不断的环境之下，给人以更多期待与想象。4 月 25 - 26 日，由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「全球机器学习技术大会」将在上海环球港凯悦酒店举行。

来自 AI 科研先锋单位的北京智源人工智能研究院基础语言模型与软件组负责人刘广将出席本次盛会，并发表主题演讲。

专家介绍

刘广，北京智源人工智能研究院基础语言模型与软件组负责人

刘广，北京邮电大学智能科学与技术博士，北京智源人工智能研究院基础语言模型与软件组负责人，负责飞智 FlagAI 开源项目以及悟道·天鹰 Aquila 系列基础模型（7B/34B/70B)，主持科技创新 2030-“新一代人工智能”重大项目课题，在人工智能领域学术会议和期刊上发表论文，发明专利申请十余项，主要研究方向是预训练大模型等。

演讲主题

在 2024 全球机器学习技术大会上，刘广博士将分享自己的一线大模型实战经验，发表「从理论到实践：剖析 Aquila 模型的研发过程和未来展望」的主题演讲。

他将深度探讨 Aquila 大规模语言模型（LLM）的研发过程。从理论到实践全方位解析 Aquila 模型的研发背景、面临的问题，以及我们如何应对这些问题，具体的实践结果，及其未来发展的方向。

这个过程涵盖了从获取和处理语料库，优化模型训练过程，到提高模型效果和准确性的各个环节。这是一个典型的实战案例，展示了如何在实际项目中应用和优化大规模语言模型。

刘广的实战经验分享将为想要进一步了解大规模语言模型研发的人们提供深度的洞察和借鉴价值，而非仅仅停留在简单概念的理论层面。同时，他也会深入探讨 Aquila 模型的未来，包括如何提升其性能、准确性，拓宽其应用领域，以及如何在未来的研发过程中继续优化用户体验。

与此同时，刘广博士将与来自国内外的 50+ AI 专家、学者和业界精英们汇聚一堂，共同分享在大模型和 AI 领域的最新研究成果和实践经验。他们包括：

Daniel Povey，Kaldi之父，IEEE Fellow，小米集团首席语音科学家
复旦大学教授，博士生导师，MOSS大模型核心人员，前搜狗首席研究员张奇
零一万物联合创始人，前字节跳动 AIGC 和视觉大模型 AI 平台负责人潘欣
北京智源人工智能研究院基础语言与软件组负责人刘广
新浪微博新技术研发负责人，中国中文信息学会理事张俊林
北京聆心智能科技有限公司联合创始人 CEO 郑叔亮
面壁智能 CTO，OpenBMB 开源社区联合发起人曾国洋
度小满金融技术委员会执行主席，数据智能应用部总经理杨青
李永彬，阿里巴巴达摩院资深算法专家，阿里巴巴通义实验室对话智能负责
王勤龙，蚂蚁集团 AI Infra 技术专家
白海科技创始人兼 CEO，CCF 大数据专委常务委员和高性能专委委员卢亿雷
文因互联工程 VP 兼首席科学家，中国人工智能学会会员工委会副秘书长宋劼
原腾讯音乐机器学习平台 CubeStudio 负责人，楷乔科技联合创始人栾鹏
DeepWisdom 创始人兼 CEO，MetaGPT 项目作者吴承霖
WPS AI 技术总监，中国图象图形学学会《文档图象分析与识别专委会》专业委员熊龙飞

更多嘉宾与主题，请登陆大会官网：www.ml-summit.org ，或点击「阅读原文」查看！

下一篇：最后一页上一篇：JetBrains...