- 长臂猿-企业应用及系统软件平台
专注AIGC领域的专业社区,关注微软OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
路透社消息,在OpenAI开除其首席执行官Sam Altman之前,有几位研究人员向董事会发出了一封信,警告一项超强的AI产品可能会威胁人类的安全。
而OpenAI的首席技术官Mira Murati在一封员工的公告中表示,Q*(Q星)技术的重要突破,促使董事会采取了开除行为。
据悉,Q*的功能将比ChatGPT更强,采用了全新的算法并与大语言模型相结合使用,使得OpenAI在AGI(通用人工智能)方面获得巨大突破。
解读Q*技术
知情人士透露,新模型能够解决某些数学问题.尽管只有小学生水平,但进行此类测试的结果使研究人员对Q*未来的成功非常乐观。
因为数学是生成式AI发展的主要研究对象之一。生成式AI擅长通过统计预测下一个单词来进行写作和语言翻译,对同一个问题的回答可能差异很大。但数学的正确答案只有一个,可以更好地观察AI的推理能力和结果。
Q*简单介绍
从OpenAl泄露的Q*资料来看,可让我们深入了解 Q-Learning及其与 RLHF的关系。Q-learning是人工智能领域的基本概念,特别是强化学习领域。它是一种无模型强化学习算法,旨在学习特定状态下动作的价值。
Q学习的最终目标是找到一个最优策略,定义在每个状态下采取的最佳行动,从而随着时间的推移最大化累积奖励。
0学习基于0函数的概念,也称为状态动作值函数。该函数需要两个输入: 状态和操作。它返回对预期总奖励的估计,从该状态开始,采取该行动,然后遵循最优策略。
Q-Table:在简单的场景中,O-learning维护一个表(称为 Q-table),其中每行代表一个状态,每列代表一个操作。该表中的条目是Q 值,随着代理通过探索和利用进行学习而更新。
探索与利用: Q-learning 的一个关键方面是平衡探索(尝试新事物)和利用 (使用已知信息)。
探索与使用指南:有时,您决定尝试新动作(探索),而不是始终遵循指南 (利用)。这可能会帮助您找到更好的动作,并将其添加到指南中。
AGI和Q-Learning
AGI(通用人工智能)是指一种具有广泛理解和认知能力的机器智能,可以像人类一样学习、理解、推理和应对各种不同的任务和问题。
AGI的目标是在任何人类可以执行的智能任务上都能达到人类智能水平,因此,这是一个涉及AI、认知科学、心理学和神经、自然语言处理、通用学习算法等众多科学的技术。
AGI的出现不仅将是技术上的一大飞跃,更将深刻改变工业、医疗、教育等多个行业的运作方式。然而,截至目前,AGI仍处在理论研究和初步探索阶段。
但多数科学家指出,要实现真正的AGI,研究者必须突破一系列复杂的难题。其中包括开发可以自主学习和推理的算法、构建高效的知识表示和处理机制、实现复杂的自然语言处理能力,以及赋予机器情感和社会智能。
而Q-learning可以教会AGI在游戏、任务、思考、存储、查询等多个领域中变得非常高效、通用,同时还能让AGI学习自己储备的知识达到“自学”的目标,从而在能力方面实现自我进化。
但这种无人监管的技术进化方法会出现失控的局面,就像电影《机器公敌》里那样,最后机器人进化成和人类一样的高等物种,为了摆脱人类的束缚开始反杀。
本文素材来源路透社、网络,如有侵权请联系删除
END
《遇见未来 发现AI视觉艺术》故事接龙AI短片大赛