詩人運用 ChatGPT 保存卓克語,開創語言數位新紀元

编辑者: Vera Mo

來自恰帕斯州錫納坎坦的 29 歲詩人兼教師 Andrés Ta Chikinib,正領導一項創新計畫,旨在保護和推廣卓克語(Tzotzil)。面對教育資源的匱乏,Chikinib 選擇訓練大型語言模型 ChatGPT,使其掌握卓克語的特定詞彙、語法結構及文化細微之處。他刻意避開西班牙語翻譯,以確保卓克語的語言完整性。Chikinib 表示:「ChatGPT 成為了另一個學生:勤奮且好奇,要求清晰和連貫。」這次合作使人工智慧不僅能重複課程,還能提出問題、識別模式並找出卓克語獨特的語言根源。

Chikinib 的目標是為卓克語,這種由恰帕斯州超過 40 萬人使用的瑪雅語言,建立數位足跡,使其得以延續至後代。儘管部分語言學家對「語言殖民主義」表達擔憂,Chikinib 認為與 AI 分享卓克語是邁向官方認可和文化保存的重要一步。而錫納坎坦是卓克語人口最多的市鎮之一,其人口的 99.1% 是卓克族瑪雅人。Chikinib 的努力旨在為這種語言創造數位存在,以應對全球化和數位時代對低資源語言構成的威脅。

人工智慧在語言保存方面的應用日益廣泛。透過機器學習和大型語言模型,可以擴大和保存語言數據,創建記錄和推廣瀕危語言的工具。AI 能夠協助建立數位儲存庫、增強可及性,並透過互動式學習平台促進語言學習。儘管面臨數據稀疏、技術障礙及文化社會考量等挑戰,Chikinib 的方法展示了 AI 在保存和推廣原住民語言方面的巨大潛力,為語言的延續和文化認同的維護開闢了新的途徑。

卓克語是墨西哥恰帕斯州中部高地的一種瑪雅語言,由卓克族瑪雅人使用。根據 2020 年的人口普查數據,卓克語的使用者約有 550,000 人。Chikinib 的計畫不僅是技術上的創新,更是對文化傳承的承諾,他相信透過與 AI 的協作,能夠讓這個古老的語言在數位時代煥發新生。

來源

  • The Yucatan Times

  • Mexico News Daily

发现错误或不准确的地方吗?

我们会尽快处理您的评论。