人工智慧時代的語言挑戰:英語主導地位與多語言模型發展

编辑者: Vera Mo

人工智慧與語言主導地位

人工智慧(AI)在全球快速發展,對各個領域產生深遠影響。然而,由於歷史、經濟和技術等多重因素,英語在AI的訓練數據中長期佔據主導地位 。目前,生成式AI系統約90%的訓練數據來自英語資料來源 。

英語主導地位的影響

這種對英語資料的依賴,可能會對非英語使用者產生不利影響 。在英語資料上訓練的AI系統,在處理其他語言時表現可能不佳,導致潛在的偏見和排斥. 例如,大型語言模型(LLM)可能更適合英語使用者,但在處理越南語或納瓦特爾語等使用人數較少的語言時,效果會大打折扣。

多語言AI模型的發展

為了解決這些語言差異,目前正在積極開發多語言AI模型 。微軟等公司正在投入資源開發多語言大型語言模型,重點關注代表性不足的歐洲語言. 這些努力包括與Hugging Face合作,透過GitHub提供多語言資料,並設立補助金計畫,以10種代表性不足的歐洲語言建立內容.

挑戰與未來展望

儘管多語言AI模型取得了進展,但在AI中實現真正的語言包容性仍然面臨挑戰. 英語在AI發展中的主導地位,持續為非英語使用者製造障礙,並可能加劇現有的不平等現象. 隨著AI越來越融入社會,確保其好處惠及所有人,無論其語言為何,至關重要.

AI在克服語言障礙方面的潛力

網路研究顯示,AI在克服語言障礙方面具有潛力 。例如,Google 翻譯等工具促進了不同語言之間的溝通,提高了AI的可及性。此外,歐盟正在採取措施,支援AI的語言多樣性,鼓勵建立多語言資料集,並開發不同語言的AI應用程式 。

結論

隨著AI的興起,英語的主導地位對全球語言不平等產生了重大影響 。開發多語言AI模型和支援語言多樣性,對於解決這些不平等現象並確保AI的好處對所有人開放至關重要 。

來源

  • Financial Post

  • University of Western Australia

  • ITPro

发现错误或不准确的地方吗?

我们会尽快处理您的评论。