xAIがGrok 4.1を発表:音声と視覚の創造性を高める「より人間的な」AIの頭脳

作者: Veronika Radoslavskaya

xAI、Grok 4.1を発売します

イーロン・マスク氏が率いる人工知能企業xAIは、AIと人間との相互作用のあり方を根本的に変える大規模なアップデートである**Grok 4.1**を正式にリリースしました。業界全体が計算能力の向上に注力する中、Grok 4.1は「感情的知性」と信頼性を最優先することで、その独自性を際立たせています。この新しいモデルは、xAIの音声機能のアップグレードと、進化する視覚ツールを支える重要な「推論エンジン」としての役割を果たします。

Grok 4.1における最も顕著な進歩は、ニュアンス、皮肉、そして感情的な機微を理解する能力です。AIの共感度を測定する**EQ-Bench3評価**において、この新モデルは**1,586**というスコアを記録し、以前のバージョンと比較して大幅な改善を実証しました。

この「人間的な要素」の強化は、**ボイスモード**に即座に影響を与えます。音声を通じてAIと対話するユーザーは、従来のロボットのような質問応答マシンから、「場の空気を読む」ことができる会話パートナーへと、大きな変化を感じることでしょう。モデルが微妙な意図とトーンを処理できるようになったことで、音声によるやり取りはより流暢で自然なものになります。

Grok 4.1は主にテキストベースの知性ですが、xAIが目指すマルチモーダルな野心において極めて重要な役割を担っています。このモデルは、外部の視覚ツール向けに非常に詳細なプロンプトを作成するため、その驚異的な創造的ライティングスキル(**1,708 Elo**という記録的なスコア)を活用し、「クリエイティブ・ディレクター」として機能します。

現在、この機能は(Fluxを介した)プラットフォームの画像生成を支えており、新たに登場した**画像から動画へのアニメーション**機能もサポートしています。完全なテキストから動画への生成機能はまだ社内プレビュー段階ですが、Grok 4.1の推論能力の向上により、ユーザーは静止画像をより高い精度で短いアニメーションクリップに変換できるようになり、テキストと動的なビジュアルとの間のギャップを効果的に埋めています。

決定的に重要な点として、このモデルは著しく真実味を増しました。xAIは高度なトレーニング技術を駆使し、現実世界のクエリにおけるハルシネーション率(事実の捏造)を**12.09%からわずか4.22%**へと大幅に削減しました。厳格な**FActScoreベンチマーク**では、エラー率が約3分の2近く減少し、3%未満にまで低下しました。これは、生成AIに対するユーザーの最大の不満の一つに対処するものです。

これらの内部指標は、世論によっても裏付けられています。ブラインド方式のクラウドソーシングによるリーダーボードである**LMArenaの「テキストアリーナ」**において、Grok 4.1は世界**第1位**の座を確保し、次点の競合モデルを31ポイント引き離して悠々と首位に立っています。このモデルは現在、Xプラットフォームおよびモバイルアプリのユーザー向けに順次展開されています。

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。

xAIがGrok 4.1を発表:音声と視覚の創造性を高める「より人間的な」AIの頭脳 | Gaya One