揭秘OpenAI神秘项目Q*，专家称或仅为提升ChatGPT的尝试

noBug

2023-12-1 / 0 评论 / 464 阅读

12/1

划重点:
1. 🌐 OpenAI最新项目Q引发猜测，专家认为可能是提升ChatGPT的常规尝试。
2. 🔍 Q或涉及“过程监督”技术，由OpenAI首席科学家Sutskever领导，旨在减少大型语言模型的逻辑错误。
3. 🚀 项目可能利用大量合成数据和强化学习，培训语言模型解决特定任务，如简单的算术问题。

12月1日消息:近期，OpenAI的Q项目引起广泛关注，引发了关于其真实性和目的的各种猜测。据专家称，这可能只是OpenAI试图提升ChatGPT的一种传统尝试，而非神秘突破。

报道指出，Q项目似乎与OpenAI今年5月宣布的“过程监督”技术相关。该技术由OpenAI首席科学家兼联合创始人Ilya Sutskever领导，该项目旨在降低大型语言模型（LLMs）的逻辑错误。

过程监督的核[]心思想是训练[]人工智能模型[]分解解决问题[]所需的步骤，[]从而提高算法[]正确答案的几[]率。特别是在[]处理基础数学[]问题时，LL[]Ms经常犯简[]单错误，而过[]程监督展示了[]如何帮助它们[]更有效地处理[]这些问题。

一些迹象表明，Q的名字可能与强化学习中的Q-learning有关，这是一种通过积极或消极反馈学习解决问题的算法，曾用于创建游戏玩家机器人和调整ChatGPT以提高其帮助性。还有人认为该名字可能与广泛用于使程序找到目标最佳路径的A搜索算法有关。

另一方面，T[]he Inform[]ation提[]供了更多线索[]，指出Sut[]skever[]的突破允许O[]penAI克[]服获得足够高[]质量数据来训[]练新模型的限[]制。报道称，[]这项研究涉及[]使用计算机生[]成的数据而非[]从互联网提取[]的真实数据，[]这似乎是在提[]到使用所谓的[]合成训练数据[]的想法，这已[]成为培训更强[]大AI模型的[]一种方式。