比ChatGPT还强！OpenAI开除Sam Altman原因曝光_AI&chatGPT_长臂猿

长臂猿 >> AI&自媒体 >> AI&chatGPT >> 比ChatGPT还强！OpenAI开除Sam Altman原因曝光

专注AIGC领域的专业社区，关注微软OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

路透社消息，在OpenAI开除其首席执行官Sam Altman之前，有几位研究人员向董事会发出了一封信，警告一项超强的AI产品可能会威胁人类的安全。

而OpenAI的首席技术官Mira Murati在一封员工的公告中表示，Q*（Q星）技术的重要突破，促使董事会采取了开除行为。

据悉，Q*的功能将比ChatGPT更强，采用了全新的算法并与大语言模型相结合使用，使得OpenAI在AGI（通用人工智能）方面获得巨大突破。

解读Q*技术

知情人士透露，新模型能够解决某些数学问题.尽管只有小学生水平，但进行此类测试的结果使研究人员对Q*未来的成功非常乐观。

因为数学是生成式AI发展的主要研究对象之一。生成式AI擅长通过统计预测下一个单词来进行写作和语言翻译，对同一个问题的回答可能差异很大。但数学的正确答案只有一个，可以更好地观察AI的推理能力和结果。

Q*简单介绍

从OpenAl泄露的Q*资料来看，可让我们深入了解 Q-Learning及其与 RLHF的关系。Q-learning是人工智能领域的基本概念，特别是强化学习领域。它是一种无模型强化学习算法，旨在学习特定状态下动作的价值。

Q学习的最终目标是找到一个最优策略，定义在每个状态下采取的最佳行动，从而随着时间的推移最大化累积奖励。

0学习基于0函数的概念，也称为状态动作值函数。该函数需要两个输入: 状态和操作。它返回对预期总奖励的估计，从该状态开始，采取该行动，然后遵循最优策略。

Q-Table:在简单的场景中，O-learning维护一个表(称为 Q-table)，其中每行代表一个状态，每列代表一个操作。该表中的条目是Q 值，随着代理通过探索和利用进行学习而更新。

探索与利用: Q-learning 的一个关键方面是平衡探索(尝试新事物)和利用 (使用已知信息)。

探索与使用指南:有时，您决定尝试新动作(探索)，而不是始终遵循指南 (利用)。这可能会帮助您找到更好的动作，并将其添加到指南中。

AGI和Q-Learning

AGI（通用人工智能）是指一种具有广泛理解和认知能力的机器智能，可以像人类一样学习、理解、推理和应对各种不同的任务和问题。

AGI的目标是在任何人类可以执行的智能任务上都能达到人类智能水平，因此，这是一个涉及AI、认知科学、心理学和神经、自然语言处理、通用学习算法等众多科学的技术。

AGI的出现不仅将是技术上的一大飞跃，更将深刻改变工业、医疗、教育等多个行业的运作方式。然而，截至目前，AGI仍处在理论研究和初步探索阶段。

但多数科学家指出，要实现真正的AGI，研究者必须突破一系列复杂的难题。其中包括开发可以自主学习和推理的算法、构建高效的知识表示和处理机制、实现复杂的自然语言处理能力，以及赋予机器情感和社会智能。

而Q-learning可以教会AGI在游戏、任务、思考、存储、查询等多个领域中变得非常高效、通用，同时还能让AGI学习自己储备的知识达到“自学”的目标，从而在能力方面实现自我进化。

但这种无人监管的技术进化方法会出现失控的局面，就像电影《机器公敌》里那样，最后机器人进化成和人类一样的高等物种，为了摆脱人类的束缚开始反杀。

本文素材来源路透社、网络，如有侵权请联系删除

END

《遇见未来发现AI视觉艺术》故事接龙AI短片大赛

下一篇：最后一页上一篇：比肩Gen-2...