Bitget App
交易「智」變
快速買幣市場交易合約BOT理財跟單
馬斯克所言不虛!Grok 3 測試結果出爐,各方面皆吊打其他 AI 模型

馬斯克所言不虛!Grok 3 測試結果出爐,各方面皆吊打其他 AI 模型

ZombitZombit2025/02/18 20:55
作者:zombit jeff

Table of Contents

Toggle
  • Grok 3 完勝對手
  • 馬斯克所言不虛?
  • 實際產品恐令人失望

Grok 3 完勝對手

根據知名 AI 模型排名開源平台 lmarena.ai 的最新測試數據顯示,xAI 早期版本的 Grok 3(代號「chocolate」) 在 Arena 排行榜上排名第一。

BREAKING: @xAI early version of Grok-3 (codename "chocolate") is now #1 in Arena! 🏆

Grok-3 is:
– First-ever model to break 1400 score!
– #1 across all categories, a milestone that keeps getting harder to achieve

Huge congratulations to @xAI on this milestone! View thread 🧵… https://t.co/p8z8lccNd5 pic.twitter.com/hShGy8ZN1o

— lmarena.ai (formerly lmsys.org) (@lmarena_ai) February 18, 2025

在這次測試結果中,Grok-3 創下多項紀錄,其中包括成為史上首個突破 1400 分的語言模型,並在數學、創意寫作、多輪對話、編程等測試類別中全數拿下第一名。

馬斯克所言不虛!Grok 3 測試結果出爐,各方面皆吊打其他 AI 模型 image 0

使用者可以在此 網站 參與模型的測試,並投票選擇哪一個模型更為優秀。

馬斯克所言不虛?

根據 Zombit 此前 報導 ,馬斯克在《世界政府高峰會》的活動上發表演說時透露,Grok 3 將在幾週內問世,並自信的表示 Grok 3 將超越迄今為止所有其他人工智慧模型。其在演講中說道:

「有時我覺得Grok 3 聰明得可怕…我們正處於打磨 Grok 3 的最後階段,可能會在一兩週內發布,所以很快就來了。」

如今從測試結果來看,馬斯克似乎並不是「老馬賣『Grok』,自賣自誇」。

實際產品恐令人失望

然而,儘管 Grok 3 在測試結果表現突出,但實際相用戶推出的似乎不會是完整版本,而是被削弱的閹割版。知名開發者 banteg 指出,Grok 3 已經向部分用戶推出,但似乎與他們展示的版本有所不同,其在推文中表示:

「DeepSearch 只執行一次搜尋 + 推理,並且削弱後甚至無法搜尋 X 上的貼文。」

grok 3 rolled out to x users, but it seems different from what they've demoed. deepsearch is just one search + inference and it downgraded so it can't even search x posts. pic.twitter.com/N2RuigjPai

— banteg (@bantg) February 18, 2025
0

免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。

PoolX: 鎖倉獲得新代幣空投
不要錯過熱門新幣,且APR 高達 10%+
立即參與

您也可能喜歡

0xbow 的「隱私池」首次亮相以太坊,提供合法的鏈上隱私保護

簡單來說 0xbow 在以太坊主網上推出了隱私池,使 ETH 持有者能夠進行私人交易,同時確保他們的資金與非法活動無關。

Mpost2025/04/01 15:33
0xbow 的「隱私池」首次亮相以太坊,提供合法的鏈上隱私保護

OpenAI 未來幾個月將發布新的開放權重語言模型

簡單來說 OpenAI 計劃在未來幾個月內發布一種具有推理能力的新型開放權重語言模型,並為開發人員、研究人員和有興趣參與回饋會議的社群推出了一份表格。

Mpost2025/04/01 15:33
OpenAI 未來幾個月將發布新的開放權重語言模型

多種山寨幣在幣安上突然崩盤,ACT數分鐘內暴跌50%

快速觀察 幾個代幣在幣安上於數分鐘內出現兩位數的跌幅。此次突然下跌的原因不明,讓觀察者對其原因感到猜測。

The Block2025/04/01 13:14
多種山寨幣在幣安上突然崩盤,ACT數分鐘內暴跌50%