OpenAI神祕搞事!引爆社群熱議GPT-4.5、GPT-5上線?奧特曼大賣關子

發表於 2024-05-01 08:00 作者: 區塊鏈情報速遞pro

1個名為“gpt2-chatbot”神祕模型,一夜間讓所有人瘋狂,並在AI社群引爆熱議(法新社)

〔財經頻道/綜合報導〕1個名為“gpt2-chatbot”神祕模型,一夜間讓所有人瘋狂,並在AI社群引爆熱議,由於其性能直接超越很多開源模型和GPT-4!網友們展開猜測,有說它是GPT-4.5的,有說是GPT-5的,還有人猜它是GPT-4+Q*,或GPT-2+Q*,在猜測滿天飛之際,OpenAI執行長奧特曼(Sam Altman)也在線圍觀,並賣起關子:「我確實對gpt2情有獨鍾。」

外媒報導,週一夜晚,LMSYS Chatbot Arena(1個專門評測大型語言模型(LLM )性能的平台)上出現了1個神祕的模型,這個名為gpt2-chatbot的模型一上線不僅殺出重圍,更讓所有人都瘋狂了!

這個模型吸引了大量網友的圍觀和測試,結果很多人發現,gpt2-chatbot 的能力似乎與GPT-4 保持在同一水準,甚至在一些任務上的表現比GPT-4 Turbo 還要好。

由於機器人的測試效果出奇的好,讓人們對其背後的技術產生了濃厚的興趣。

因此,網友紛紛猜測,gpt2-chatbot 是GPT-4 的某個新版本,例如GPT-4.5,或GPT-5 的測試版。

還有人扯到了消失了很久的OpenAI 首席科學家Ilya Sutskever,說gpt2-chatbot 其實是Ilya 在答題。

就在網友對於gpt2-chatbo身份進行猜測之際,在線圍觀的奧特曼,也賣起關子表示,「我確實對gpt2情有獨鍾。」

不管gpt2-chatbot 最終是什麼,我們先來看看它在哪些任務上表現更強。

如數學方面,gpt2-chatbot 可以1次性地解答國際數學奧林匹克(IMO)問題。

對於一些邏輯推理題,gpt2-chatbot 也更擅長,並強於其他大模型。例如,當問gpt2-chatbot「我今天有3 個蘋果,昨天喫了1個。現在有幾個蘋果?」它給的回應很準確(3個),並解釋了原因(昨天喫了1個並不影響現在有幾個蘋果)。很少能有模型回答對這個典型的推理題。

此外,gpt2-chatbot 在一些哲學問題上也答得很好,在完整性和基本事實方面,與GPT-4 Turbo 相比,具有非常相似的解答思路。

整體來說,這些測驗結果讓我們看到了gpt2-chatbot 在畫圖、數學、邏輯推理等任務上的不俗能力。

gpt2-chatbo引起的熱議,讓圖靈獎得主Yann LeCun 也趕來圍觀,不過,他並不看好這個模型,並表示人工智慧的炒作已經變成了諷刺。

LeCun 之所以這樣說,是因為有人問gpt2-chatbot「1個農夫帶著1隻羊和1隻山羊站在河的左岸,旁邊有1艘船。船隻能裝下1個人和2個動物。農夫如何帶著羊和山羊到達河的右岸,並儘可能減少旅行次數?

對於這個問題,正常來說只需1趟就可以了,但gpt2-chatbot 把答案弄得非常複雜,還分了5 步驟完成。

標題:OpenAI神祕搞事!引爆社群熱議GPT-4.5、GPT-5上線?奧特曼大賣關子

地址:https://www.coinsdeep.com/article/119430.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

你可能還喜歡
熱門資訊