xAI 推出 Grok 4.1：「更具人性」的大腦，強化語音與視覺創造力

11:21, 18 十一月

作者： Veronika Radoslavskaya

xAI 推出 Grok 4.1

科技巨擘伊隆·馬斯克（Elon Musk）旗下的人工智慧公司 xAI，正式發布了 Grok 4.1，這是一次劃時代的重大更新，從根本上改變了 AI 與人類互動的方式。當業界普遍將焦點放在原始運算能力時，Grok 4.1 則以優先考量「情商」和可靠性而脫穎而出。這個新模型扮演了關鍵的「推理引擎」角色，不僅升級了 xAI 的語音功能，也為其不斷發展的視覺工具提供了強大的動力。

Grok 4.1 最引人注目的改進，在於它能夠理解細微差別、諷刺語氣以及情感潛台詞，展現出更強的「人性化」元素。在評估 AI 同理心的 EQ-Bench3 評估中，新模型取得了 1,586 分的成績，這證明它比先前的版本有了實質性的進步。

這一升級對「語音模式」（Voice Mode）產生了立竿見影的影響。透過語音與 AI 互動的使用者將會察覺到顯著的轉變：它不再是冰冷的問答機器，而更像是一個能「察言觀色」的對話夥伴。由於該模型現在能夠處理微妙的意圖和語氣，語音互動變得更加流暢自然。

雖然 Grok 4.1 本質上是一種基於文本的智慧，但它在 xAI 的多模態願景中扮演著核心角色。該模型充當「創意總監」，利用其破紀錄的創意寫作能力（得分高達 1,708 Elo），來解讀使用者的請求，並為外部視覺工具編寫高度詳細的提示詞。

目前，這項能力正驅動著該平台的圖像生成功能（透過 Flux 實現），並支援新興的「圖像轉影片動畫」（image-to-video animation）功能。儘管完整的文本轉影片生成仍在內部預覽階段，但 Grok 4.1 改進後的推理能力，讓使用者能以更高的精準度將靜態圖像轉化為短動畫片段，有效地彌合了文本與動態視覺之間的鴻溝。

至關重要的是，該模型的真實性得到了顯著提高。xAI 採用了先進的訓練技術，成功將現實世界查詢中的「幻覺」（捏造事實）發生率，從 12.09% 大幅削減至僅 4.22%。在嚴格的 FActScore 基準測試中，錯誤率降低了近三分之二，降至 3% 以下，解決了生成式 AI 最受使用者詬病的問題之一。

這些內部指標得到了公眾輿論的佐證。在 LMArena 的「文本競技場」（Text Arena）——一個盲測的眾包排行榜上——Grok 4.1 穩居全球第一的寶座，領先其最接近的競爭對手 31 分。該模型目前正在向 X 平台和行動應用程式的使用者推出，預計將在全球範圍內帶來嶄新的 AI 體驗。

xAI