字節跳動與 DeepSeek 在 AI 模型領域取得新進展,推動中國科技產業升級

编辑者: gaya ❤️ one

2025 年 8 月,短影音平台 TikTok 的母公司字節跳動(ByteDance)發表了其 Seed-OSS-36B 開源人工智慧模型的三款新變體。這些模型以其長文本視窗處理能力和對開發者的友好性而著稱。與此同時,中國 AI 新創公司 DeepSeek 宣布其升級版的 DeepSeek-V3.1 模型。此新版本採用混合推理架構,提升了處理速度,並增強了代理(agent)功能,這標誌著中國在人工智慧領域的快速發展。

字節跳動的 Seed-OSS-36B 模型在基準測試中表現出色,其效能與全球科技巨頭的同類模型不相上下,甚至有所超越,這凸顯了中國 AI 模型日益增強的實力。該公司於 8 月 20 日在 Hugging Face 上發布了 Seed-OSS-36B,該模型專為增強推理能力而設計,並提供多種版本,包括支援長達 512K 文本視窗的原生長文本功能。

DeepSeek 的 V3.1 模型特別針對中國國產晶片進行了優化,這是中國本土半導體產業的一大重要進展。據悉,該模型採用了 UE8M0 FP8 精確格式,旨在與即將推出的國產晶片高效協同工作。此消息一出,立即帶動了中國半導體類股的顯著上漲。DeepSeek 的 V3.1 模型不僅提升了處理速度,還具備混合推理結構,能夠在推理和非推理模式之間切換,並增強了工具使用和代理任務的效能。該公司預計將於 9 月 6 日調整其 API 使用費用,以進一步提高平台的可用性。

中國在人工智慧領域的快速進展,特別是在開源模型方面的領導地位,正引起全球關注。DeepSeek 等公司的模型以其高性價比和與國產硬體的整合能力,展現了中國在打造自主可控的 AI 生態系統方面的決心。此舉不僅回應了美國的出口管制措施,也為中國科技產業的自主創新注入了強勁動力。分析師預計,中國 AI 技術的進步將對股市產生積極影響,有望提升企業盈利和估值,進一步縮小與美國科技公司的差距。

來源

  • Asianet News Network Pvt Ltd

  • Reuters

  • Financial Times

  • CNBC

发现错误或不准确的地方吗?

我们会尽快处理您的评论。