GPT-5降臨,，代號獵戶座,？OpenAI疑用草莓訓練，數(shù)學推理暴漲

山峰云繞 2024-08-29 發(fā)布于貴州

展開全文

https://m.toutiao.com/is/ihjpk6Nr/

編輯：Aeneas 好困

【新智元導讀】OpenAI又憋大招了,！據(jù)悉,，下一代旗艦模型GPT-5或名為「獵戶座」，由「草莓」合成的數(shù)據(jù)訓練,。而草莓具有極強的復雜推理（數(shù)學,、編程）和語言能力，或將超越當前的任何模型的推理和生成的能力,。

OpenAI的下一代旗艦大語言模型,，要來了？

據(jù)悉,，新模型代號Orion（獵戶座）,，就是能超越GPT-4的下一代模型。

而獵戶座的預訓練數(shù)據(jù),，正是由草莓模型生成的,。

而草莓模型驅動的聊天機器人，很可能就會在今年秋天上線,！

關于OpenAI的草莓,，外媒The Information最近又挖到了新的細節(jié)。

根據(jù)The Information的信息,，網(wǎng)友推測：「GPT-4+草莓」會在秋季推出,，之后上線的繼任者「獵戶座」可能就是GPT-5。

由于大概率要避開11月,，因此,，獵戶座的發(fā)布時間要么在之前要么是在12月。

甚至,，AI大V,、Hallid.ai聯(lián)創(chuàng)「indigo」提出了一個大膽的猜測：獵戶座或許不是GPT-5，而是GPT-6,。

AI大V「Chubby」表示附議,。

最后，Chubby激動地表示：所有人都覺得AI的發(fā)展正在放緩,？并不是,。在大公司,，廚房里的東西正在沸騰！

網(wǎng)友們紛紛表示：「我們正在見證一種超越我們自己思想的誕生」,。

打開Q*之門,，一切模型憑此迭代。

有人擔心,，如果GPT-5控制整個互聯(lián)網(wǎng),，人類會從此迷失。

所以,，獵戶座到底是GPT-5還是GPT-6呢,？網(wǎng)友們各持己見。

但有人猜測,，我們目前還沒有足夠的算力來達到GPT-5,，更不用說GPT-6了。

透個底,，讓美國政府安心

此前，關于草莓的傳聞早已滿天飛,。

今年夏天,，Sam Altman的團隊已經(jīng)向美國國家安全官員展示了這項技術。

在安全問題日益敏感的情況下,，OpenAI的做法也算給大家打了個樣,。

如果政府官員覺得這項AI不安全怎么辦？那就給他們展示一下,。

這次演示,，就是OpenAI讓政策制定者覺得更透明的努力的一部分。畢竟,，如果他們感覺到受到這項技術的威脅了,，很可能就會給公司帶來麻煩。

現(xiàn)在,，OpenAI的安全團隊已經(jīng)出走,，憤怒的前員工在網(wǎng)上大肆爆料，這種時候,，對政府官員更加透明的做法,，就顯得尤為重要。

The Information表示,，這次演示還可能另有目的：跟政府隊員就如何保護技術進行對話,，以防止美國的AI技術被他國竊取。

說不定,，還可以借此機會攻擊Meta一波,，因為他們的AI是開放權重的,，其他國家想要獲取，是非常容易的事,。

總之,，未來幾年內(nèi)，AI開發(fā)者應該會經(jīng)常出現(xiàn)在舊金山和華盛頓之間的航線上了,，因為他們時不時就需要跟政府官員來往一下,。

草莓：數(shù)學提升，能解字謎

一個月前路透社曾報道,，OpenAI內(nèi)部測試了一種AI,，在MATH基準上得分超過了90%。

據(jù)猜測,，這個模型很可能就是草莓,。

如今的傳言是，今年秋天OpenAI研究者會推出代號為草莓的新AI（也就是之前的Q*）,，或許會聊天到ChatGPT之類的聊天機器人中,。

它能做到目前的聊天機器人無法做到的很多事情，比如解決未曾遇到的數(shù)學問題,，還能解決編程難題,。

在獲得額外「思考」時間后，草莓模型還可以回答更主觀的問題,，比如產(chǎn)品的營銷策略,。

據(jù)悉，在語言任務上,，草莓表現(xiàn)出了強大的能力,。比如OpenAI的一位員工曾向同事演示了草莓成功解決《紐約時報》的Connections——復雜的文字謎題。

OpenAI在LLM和會話AI領域的領先地位,，一直在遭受沖擊,，因此OpenAI只能對外不時放出點草莓的消息，提升一下自己的存在感,。

另外,，據(jù)說草莓的技術已經(jīng)顯示出了智能體的能力。

草莓模型似乎能夠自主瀏覽網(wǎng)絡,，像人類研究人員一樣,，獨立上網(wǎng)、進行深度研究,。

它不僅能生成答案,，還能規(guī)劃、執(zhí)行一系列復雜任務,，還能收集信息,。

與之類似的,，還有斯坦福的Quiet-STaR。

就像人類會在說話或寫作前會停下來思考自己的想法一樣,，Quiet-STaR可以訓練LLM去生成在復雜推理問題中采取步驟的內(nèi)部「思考」,，從而做出更好的決策。

論文地址：https:///abs/2403.09629

眼下,，OpenAI的業(yè)務正以驚人的速度增長：跟去年相比,，今年它向企業(yè)銷售LLM和ChatGPT訂閱的收入大約增加了三倍，達到了每月2.83億美元,，盡管公司每月的虧損可能高于此,。

目前，OpenAI的私人估值為860億美元,。

Sam Altman還希望為公司籌集更多資金,，找到減少損失的方法。

自2019年以來,，OpenAI已經(jīng)從微軟籌集了約130億美元,，與這家企業(yè)軟件巨頭的協(xié)議，會持續(xù)到2030年,。

合作條款可能會發(fā)生變化,，包括OpenAI向微軟支付租用云服務器以開發(fā)AI的方式。

云服務器,，是OpenAI最大的成本。

OpenAI的新希望：Orion（獵戶座）

但說到底,，OpenAI的前景終究還是依賴正在開發(fā)的新旗艦——Orion,。

有人能解釋一下為什么OpenAI、谷歌和亞馬遜一直用希臘神話來命名他們的模型嗎,？

去年初推出后,，GPT-4已經(jīng)被各家趕超得差不多了，現(xiàn)在GPT-4級的模型,，可以說是各家人手一個,。

有人猜，OpenAI可能會推出一個比原始草莓模型更小,、更簡化的模型,，也就是蒸餾版。

這個版本被寄望于提升GPT-4和ChatGPT性能,，目的是保持和更大模型相同的性能水平,，而且更易于操作，成本更低,。

另外,，還有知情人士透露,，OpenAI還在用更大的草莓版本，為Orion的訓練生成數(shù)據(jù),。

這種人工合成數(shù)據(jù),，意味著草莓能幫助OpenAI克服獲取高質(zhì)量數(shù)據(jù)的限制，從而可以從現(xiàn)實世界數(shù)據(jù)（比如從互聯(lián)網(wǎng)獲取的文本或圖像）中訓練新模型,。

研究人員表示,，使用草莓可以幫助Orion減少幻覺的產(chǎn)生。

這是因為,，AI模型是從訓練數(shù)據(jù)中學習的,，所以它們看到的復雜推理的正確示例越多，就越好,。

對此,，智能體初創(chuàng)公司Minion AI的CEO兼GitHub Copilot前首席架構師Alex Graveley給予了高度厚望。

「想象一個沒有幻覺的模型,，一個你問它邏輯難題,、它第一次就答對了的模型?！?/span>

「訓練數(shù)據(jù)中存在較少的歧義,，因此它的猜測更少?！?/span>

The Information猜測,，草莓改進的推理能力，可能會整合到ChatGPT中,。這些答案可能會更準確,，但也可能更慢。

因此,，草莓可能并不適合需要即時即時響應的應用,。而在GitHub中修復非關鍵編碼錯誤，則是理想的選擇,。

或許,，以后的ChatGPT用戶，可以根據(jù)請求的時間敏感性來切換草莓模型,。

Sam Altman在五月的一次活動中曾表示：「我們感覺,，為下一個模型準備的數(shù)據(jù)已經(jīng)足夠」。

這個模型,，很可能指的是就Orion,。Altman表示：「我們進行了各種實驗，包括生成合成數(shù)據(jù)?！?/span>

解決復雜數(shù)學問題：有前景的應用

如果說目前AI最有前景的應用,，那解決復雜數(shù)學問題，必然是其中一個了,。

畢竟,，現(xiàn)有的AI在數(shù)學密集的領域如航空航天和結構工程中，表現(xiàn)實在不佳,。

各種LLM在回答數(shù)學問題時,，往往會給出各種讓人啼笑皆非的答案。

而且,，數(shù)學推理能力的提升還能幫助AI模型更好地推理會話查詢,，比如用戶的服務請求。

谷歌和一些初創(chuàng)公司,，也在這方面發(fā)力,。

上個月，谷歌DeepMind開發(fā)的AI,，已經(jīng)能在國際數(shù)學奧林匹克競賽中擊敗大多數(shù)人類參賽者,。

OpenAI的另一大競爭對手Anthropic祭出的最新模型，也能編寫更復雜的軟件代碼,，還能回答有關圖表和圖形的問題,，這些都要歸功于它推理能力的改進。

還有一些初創(chuàng)公司為了提高模型的推理能力,，采用了一種廉價的技巧,，將問題分解為更小的步驟，盡管這些方法速度慢且成本高昂,。

無論Strawberry是否會作為產(chǎn)品推出,，人們對Orion的期望都不會低了，因為OpenAI會力求繼續(xù)保持領先地位,，同時還要保證顯著的的收入增長。

OpenAI的領先者優(yōu)勢,，已經(jīng)不明顯了,。

雖然在5月宣布了「Her」的版本，但谷歌卻搶先推出了AI驅動的語音助手,，后者也足夠靈活,，還能處理用戶的打斷，和突然變化的話題,。

而Lmsys Chatbot Arena等大模型排行榜上,，谷歌、xAI,、Anthropic和Meta的模型也都在趕上OpenAI的步伐,。

Ilya看到了什么,？

值得一提的是，「草莓之父」,，其實就是已經(jīng)離職了的OpenAI的首席科學家Ilya Sutskever,。

幾年前，Ilya啟動了一個項目,，在研究過程中,，誕生了草莓。

而在Ilya離職之前,，OpenAI的研究人員Jakub Pachocki和Szymon Sidor,，就已經(jīng)在Ilya的工作基礎上開發(fā)了一個新的數(shù)學求解模型Q*，這讓不少關注AI安全的研究人員感到擔憂,。

另外,，在去年Q*的前期準備中，OpenAI研究人員開發(fā)了一種被稱為「測試時計算」的概念變體,，目的是提升LLM的問題解決能力,。

這樣，LLM就會花更多時間考慮被要求執(zhí)行的命令,，或問題的各個部分,。

當時，Ilya發(fā)表了一篇與這項工作相關的博客,。

博客地址：https:///index/improving-mathematical-reasoning-with-process-supervision/

在博客中,，模型解決了數(shù)個有難度的數(shù)學問題。

比如在這道有挑戰(zhàn)性的三角函數(shù)題中,，需要連續(xù)應用幾個并不明顯的等式,。

在這道題，GPT-4成功執(zhí)行了一系列復雜的多項式分解,。

步驟5中使用的Sophie-Germain恒等式是重要的一步,，可以被認為極有洞察力。

在這道題的步驟7和8中,，GPT-4開始執(zhí)行猜測和檢查,。

這也是模型可能產(chǎn)生幻覺的常見情況，LLM會聲稱某個特定的猜測是成功的,，但實際上并不成功,。

在這種情況下，獎勵模型會驗證每個步驟,，并確定思路是否正確,。

在最后這道題中，模型成功地應用了多個三角恒等式，來簡化了表達式,。

或許,，我們能從中窺見草莓和Orion的端倪。

參考資料：

https://www./articles/openai-races-to-launch-strawberry-reasoning-ai-to-boost-chatbot-business?rc=epv9gi

https://www./articles/openai-shows-strawberry-ai-to-the-feds-and-uses-it-to-develop-orion?rc=epv9gi

本站是提供個人知識管理的網(wǎng)絡存儲空間,，所有內(nèi)容均由用戶發(fā)布,，不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導購買等信息,，謹防詐騙。如發(fā)現(xiàn)有害或侵權內(nèi)容,，請點擊一鍵舉報,。

轉藏分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自：山峰云繞 > 《機器學習視覺訓練模式識別攝像頭搜索原理》

舉報/認領

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

山峰云繞

關注對話

TA的最新館藏

FreeCAD(3D建模軟件開源免費軟件)v1.0 FreeCAD
太極拳一定能打,！只是現(xiàn)在的太極不是以前的,！我們都被騙了！
大神級產(chǎn)品：手機裝 Linux 運行 Docker 如此簡單
內(nèi)家拳,，就是每一招都用內(nèi)勁來打
難得一見的太極拳呼吸要訣
大道至簡,，內(nèi)功就是一層窗戶紙,！#太極#太極拳內(nèi)功

喜歡該文的人也喜歡更多

熱門閱讀換一換

久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

GPT-5降臨,，代號獵戶座,？OpenAI疑用草莓訓練，數(shù)學推理暴漲