- 长臂猿-企业应用及系统软件平台
【CSDN 编者按】在人工智能几经起落的发展史里,人工智能进化的里程碑式的演进中,我们总会看见百年企业 IBM 的身影。除了大家所熟知的 1997 年 IBM 的深蓝计算机在国际象棋比赛(和复赛)中击败国际象棋世界冠军 Garry Kasparov,还有上世纪的跳棋人机大战等诸多事件。而今天,在大模型的时代,IBM 带来了针对基础模型 watsonx 和生成式 AI 的全新平台 —— watsonx。
IBM 大中华区董事长、总经理陈旭东这样说道:“ChatGPT 的横空出世,证明了大语言模型是一条走得通、通往未来 AI 的道路,也意味着 AI 的发展经过几十年的算法、算力、数据方面的量变积累,‘质变时刻’已经到来。”
2011 年,IBM(国际商业机器公司)正式踏入了百年企业的行列,它是世界上最具影响力的科技公司之一,具有丰富的历史和卓越的技术传统。IBM 当时举办了一场纪念百年辉煌历程的盛大庆典,用一部短片将 IBM 的百年历史浓缩成了令人陶醉的几分钟,并全球各个角落提供了为时一整年的志愿者活动。
直到现在,我们仍然可以通过 IBM 100 网页穿越时空,回顾从机械制表机起,逐一浏览原子重排技术、Fortran、RISC、大型机、个人电脑、小型机、深蓝、Watson 的每一个创举。
2023 年,IBM 百年庆典后的第十二年,这是属于 AI 的一年。各行各业的公司纷纷加入这股智能潮流,研发各形各色的大模型,推出可以为我们规划假期的生成式聊天机器人、组织企业数据的 AI 智能助手以及可以创建图像和视频的 AI 服务。今年 8 月,IBM 也紧跟着这道热潮,宣布启动新一代 AI 与数据平台 IBM watsonx,为企业级基础模型和生成式 AI 提供动力。
这是继红帽 OpenShift 开放式混合云技术平台之后,IBM 落地大中华区市场的又一个具有里程碑意义的开放式 AI 技术平台。
“Watson ”是 IBM 创始人老沃森的名字,也是 IBM 文化奠基人托马斯·J·沃森(Thomas J. Watson Sr.)的名字。随着时间的推移,这个名字变得更加具有象征性,代表了 IBM 在人工智能领域的雄心壮志和创新。若要回溯这些历史,还得先从那些不起眼的象棋棋子开始。
凭借强大的硬件系统和创新的评测功能,深蓝一号在 1996 年以六局的赛制(six-game chess matches)发起了比赛,与当时的国际象棋世界冠军卡斯帕罗夫对决。令许多人惊讶的是,深蓝直接拿下了第一局,这也是机器首次战胜国际象棋世界冠军。然而,卡斯帕罗夫并没被早期失利吓倒,而是最终以四比二的比分赢得了整个比赛。
经过多次更新和提高其国际象棋知识以对抗上一场比赛中使用的策略,重建的深蓝在 1997 年的复赛中战胜了卡斯帕罗夫。
在比赛中,卡斯帕罗夫擅长的非传统开局、心理威吓和超时战术对机器没有任何影响,因为深蓝只会冷静地识别和分析棋局上的情况:人类玩家在棋盘上表现出的威胁和情感在机器对局势的评估中没有太大影响。
深蓝使用的架构并未局限于赛场,而是很快应用到金融建模、数据挖掘和分子动力学等方面。最终,深蓝被退役并存放在华盛顿特区的史密森尼博物馆,结束了风光的一生。在 AI 领域,IBM 也没有因此懈怠,而是投入到另一项重大挑战:打造一台能够在更复杂的游戏中击败人类冠军的计算机。
AI 能思考吗?
随着 ChatGPT 点燃了这场寒冬,企业对生成式 AI 和大语言模型的关注度激增,迫切希望应用 AI 领域的新技术来提升竞争力。今年 8 月的发布会上,IBM 将多年以来在企业级 AI 领域积累的技术和经验,结合最近五年在基础模型研究方面取得的进展,推出了新一代数据与 AI 平台 IBM watsonx。
watsonx 是 IBM 为解决企业在人工智能应用中的数据管理、模型开发、验证、部署和治理等方面的挑战而推出的综合平台。该平台包括 watsonx.ai、watsonx.data 和 watsonx.governance 三个关键组件,共同构成了一个完整的AI生命周期解决方案。
watsonx.ai 是平台的核心,专注于AI模型的训练、验证、微调和部署。它为企业提供了强大的计算资源,以处理大规模的模型训练任务。有了 watsonx.ai,AI 构建者就可以利用 IBM 的模型和 Hugging Face 的模型来完成一系列 AI 开发任务。
这些模型经过预训练,可支持一系列自然语言处理(NLP)类型的任务,包括问答、内容生成和摘要、文本分类和提取。watsonx.ai 允许企业选择适合其需求的模型架构,并根据模型性能的基准测试结果来评估和选择最佳模型。
在发布会的演讲中,IBM 大中华区首席技术官、研发中心总经理谢东也对 IBM 近期的 AI 研究作出了详细的介绍:「最近,很多人都问我一个问题:IBM 是否还在持续发展人工智能?我想告诉大家,IBM 一直都是混合云与 AI 领域的领导者。
IBM 多年来一直是多个重大体育赛事的技术赞助商,包括美国高尔夫球大师赛、英国温布尔登网球锦标赛和美国网球公开赛。
我之所以提到这些体育赛事,不仅因为我热爱体育,更重要的是要说明,用于这些大赛的基于 watsonx 的生成式人工智能的技术,也是我们用于赋能各行各业应用的 AI 技术——基于特定专业领域的数据(如网球、高尔夫球)和知识,提供更为准确的预测(如球员比赛的赢率)。
但有人可能会问,人工智能如此强大和有趣,是否很容易应用到各个领域呢?我要告诉大家,实际情况并非如此。虽然很多人熟悉 ChatGPT 等大语言模型,但实际应用 AI 需要考虑多个因素,包括模型的选择、数据的利用、开发环境和算力等等。
这就是许多企业目前面临的挑战。随着大语言模型的不断涌现,企业需要仔细思考选择哪个模型、如何充分利用自身数据、如何开发应用和部署等问题。而 IBM 正致力于解决这些问题,为企业提供完整的人工智能解决方案。」
watsonx.data 是数据管理的关键部分,它帮助企业高效地准备、过滤和清洗数据以用于训练模型。数据的分类和词符化是数据准备过程中的重要步骤。watsonx.data 还允许企业使用自有数据或 IBM 数据堆来满足模型训练的需求,并提供了数据名片和版本控制,以便进行数据的可追溯治理。
数据——这个词汇一直萦绕在无数技术人的心中,更是 IBM 历史上重要的一页。IBM 在上世纪 70 年代对数据库领域产生了深远影响。1970 年,IBM 的科学家埃德加·科德(Edgar F. Codd)提出了关系型数据库的理论,这一理论后来演化成了 SQL(结构化查询语言),为关系型数据库管理系统(RDBMS)的发展奠定了基础。
到了上文提到的 IBM Watson 时代,Watson 利用大规模的数据库来构建知识图谱,帮助用户获取复杂问题的答案。Watson 还被用于医疗领域,可以通过分析数百万篇医学文献和病例数据库来辅助医生制定诊断和治疗方案。
如今,watson 之名还在延续。今年晚些时候,watsonx.data 将利用 watsonx.ai 的基础模型,来帮助简化和加速用户与数据的交互方式,使他们能够使用自然语言以对话式的用户体验来发现、增强、优化和可视化其数据与元数据。
watsonx.governance 关注企业级 AI 的合规性和治理。正如这场发布会的名称——“企业级 AI 的未来”。它确保模型和数据遵守法律法规和道德标准,特别是在处理敏感信息和隐私数据时。在演讲中,强调了治理的重要性,以确保企业可以信任其 AI 系统。watsonx.governance 还提供了事实表,用于记录模型和数据的详细信息,以便进行监控和更新。
跨世纪的 AI 探索者
尽管深蓝在计算棋局和搜索可能着法方面非常强大,但它被批评为一种"硬编码"方法,即它不具备真正的智能或推理能力。深蓝的胜利主要依赖于其出色的计算速度和搜索算法,而不是对棋局的理解。
Watson 的批评主要涉及到它在回答问题时的不确定性管理和推理能力。尽管 Watson 可以处理大量的信息和文本数据,但它有时会给出不准确的答案,因为它不能真正理解问题的上下文,只是根据统计概率进行答案选择。
现在,大模型也正在受到一样的抨击。
它依旧不会推理、不会思考、不具备情感,但却和 IBM 的几次尝试一样有用,为全行业注入了新的活力。就像深蓝和 Watson 在投入使用后为 IBM 的专业领域带来了重大的贡献一样,大模型也滋润着各行各业。
人工智能领域仍在不断发展,无数企业和科学家们不懈努力,追求更优化的方法来处理认知任务和推理问题,以实现更高级别的智能。尽管面临挑战,AI 领域的前景仍然充满希望。