卷模型技术,更要卷工程实现!

GPTLlama  AI 

Shelf life2012 AlexNet 

 AI 

AI  AI 

 AI  AI  AI 

2023812NPConAI AIAIAI


主题演讲

《大模型涌现,如何部署训练架构与算力芯片》


国际计算机学会(ACM)、中国计算机学会(CCF)专业会员,中美发明专利约70+项,著有《GPT-4大模型硬核解读》《GPT-4核心技术分析报告》《GPGPU芯片设计》

演讲内容:

随着GPT等大模型技:术的高速成长与普及,LLM/MLM的开源资源、部署训练架构、算力成本成为大模型应用落地和企业盈亏ROI的关键分水岭,重要性不低于模型精度。本主题将分享GPT等大模型的开源Foundation Model与Finetune、开源应用平台、部署与训练架构、以及GPU和DSA芯片对部署综合成本的重要影响,场景涵盖云计算和端侧私有化部署,对互联网与MaaS企业的产品业务设计与大模型部署有关键参考意义。


主题演讲

LLM 应用技术栈与Agent全景解析


超过 11 年的互联网从业经验,对产品设计、敏捷项目管 理、DevOps、学习型组织文化与 Web 应用开发有深刻理解。近年在企业服务、工具软件领域的 SaaS 的产品、运营和技术管理上有丰富经验。

演讲内容:

将概括目前大模型应用技术栈全景,梳理应用技术栈已实现的能力与要解决的问题、以及 Dify 等AI应用工具平台在 大模型生态中的位置及能力构建,并对当下的大模型技术发展及应用发展的趋势进行展望。


主题演讲

美团视觉GPU推理服务部署架构优化实践


美团视觉智能部,担任软件开发工程师职位,主要负责服务平台开发、视觉模型部署方案设计和GPU服务性能优化等方面的工作。同时,也非常关注人工智能领域的前沿进展和应用,积极拥抱新技术带来的变化。在工作之余,热爱骑行,非常欢迎和大家一起交流学习、探索自然享受骑行乐趣。

演讲内容:

美团视觉致力于将视觉AI技术应用于本地生活服务的各个场景。但随着在线推理服务使用的GPU资源不断增加,GPU利用率低的问题也日益凸显,导致大量计算资源浪费。经过实验分析,我们发现GPU利用率低下的推理服务存在一个共性问题:模型结构中CPU算子和GPU算子相互耦合,严重影响运行效率。为此,我们提出了一种通用高效的部署架构,通过模型结构拆分和微服务化,解决这种常见的性能瓶颈问题。目前,该解决方案已在美团视觉核心服务上成功应用,优化后服务GPU利用率接近100%,服务性能成倍提升。


主题演讲

AI大模型算力系统分析



Dr.Zhu 就职于浪潮信息人工智能与高性能应用软件部,负责大模型、AIGC等前沿AI算法研发和AI应用落地工作。

演讲内容:

结合浪潮信息源大模型的工作实践和智算中心算力平台建设经验,分享当前AI基础大模型的技术趋势、算力需求和计算特征以及当前业界面临的主要技术挑战等内容。



闪电演讲

让你的 AI 应用快速落地


全栈开发者,知名开源项目 ViewDesign(iView) 创始人。

著有《Vue.js 实战》、《Vue.js 组件精讲》,组织过多次 Vue.js 活动。


演讲内容:

InsCode(inscode.net) 是一个一站式的应用开发服务平台,在 AI 的加持下,解决从开发-部署-运维-运营的全链路开发工作。


《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进


毕业于北京航空航天大学,从一线软件及算法工程师至创业企业CTO。


进入资本市场,多年来一直专注在Data&AI Infra方向,为多家知名创业公司提供咨询服务。



《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进


南开大学、明尼苏达大学联合培养博士,其领导的研究团队聚焦推荐系统、信息检索、因果推断技术的前沿探索,并将预研成果在公司超过30个产品/场景落地,发表论文超过50篇,申请专利超过40项,并在ACM SIGIR、SIGKDD等学术组织担任高级程序委员/程序委员/审稿人等职务,译著《奇点临近》中文版。



《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进


毕业于北京航空航天大学计算机学院,一直从事NLP算法工作。


目前为智谱AI的CodeGeeX团队算法专家,专业领域为大模型训练及应用。


《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进


清华大学计算机系学士、硕士;有超过10年的新技术研发和创新管理经验。曾任四达时代传媒集团研究院首席架构师,负责设计和建设覆盖非洲十余个国家的三网融合视频系统;连续创业者;拥有数十项国家发明专利。