xAI 推出 Grok 4.1:「更具人性」的大腦,強化語音與視覺創造力

作者: Veronika Radoslavskaya

xAI 推出 Grok 4.1

科技巨擘伊隆·馬斯克(Elon Musk)旗下的人工智慧公司 xAI,正式發布了 Grok 4.1,這是一次劃時代的重大更新,從根本上改變了 AI 與人類互動的方式。當業界普遍將焦點放在原始運算能力時,Grok 4.1 則以優先考量「情商」和可靠性而脫穎而出。這個新模型扮演了關鍵的「推理引擎」角色,不僅升級了 xAI 的語音功能,也為其不斷發展的視覺工具提供了強大的動力。

Grok 4.1 最引人注目的改進,在於它能夠理解細微差別、諷刺語氣以及情感潛台詞,展現出更強的「人性化」元素。在評估 AI 同理心的 EQ-Bench3 評估中,新模型取得了 1,586 分的成績,這證明它比先前的版本有了實質性的進步。

這一升級對「語音模式」(Voice Mode)產生了立竿見影的影響。透過語音與 AI 互動的使用者將會察覺到顯著的轉變:它不再是冰冷的問答機器,而更像是一個能「察言觀色」的對話夥伴。由於該模型現在能夠處理微妙的意圖和語氣,語音互動變得更加流暢自然。

雖然 Grok 4.1 本質上是一種基於文本的智慧,但它在 xAI 的多模態願景中扮演著核心角色。該模型充當「創意總監」,利用其破紀錄的創意寫作能力(得分高達 1,708 Elo),來解讀使用者的請求,並為外部視覺工具編寫高度詳細的提示詞。

目前,這項能力正驅動著該平台的圖像生成功能(透過 Flux 實現),並支援新興的「圖像轉影片動畫」(image-to-video animation)功能。儘管完整的文本轉影片生成仍在內部預覽階段,但 Grok 4.1 改進後的推理能力,讓使用者能以更高的精準度將靜態圖像轉化為短動畫片段,有效地彌合了文本與動態視覺之間的鴻溝。

至關重要的是,該模型的真實性得到了顯著提高。xAI 採用了先進的訓練技術,成功將現實世界查詢中的「幻覺」(捏造事實)發生率,從 12.09% 大幅削減至僅 4.22%。在嚴格的 FActScore 基準測試中,錯誤率降低了近三分之二,降至 3% 以下,解決了生成式 AI 最受使用者詬病的問題之一。

這些內部指標得到了公眾輿論的佐證。在 LMArena 的「文本競技場」(Text Arena)——一個盲測的眾包排行榜上——Grok 4.1 穩居全球第一的寶座,領先其最接近的競爭對手 31 分。該模型目前正在向 X 平台和行動應用程式的使用者推出,預計將在全球範圍內帶來嶄新的 AI 體驗。

发现错误或不准确的地方吗?

我们会尽快处理您的评论。