人工智能恢復語音，揭示語言模型的內部運作，並識別TikTok口音

19:10, 01 四月

编辑者： Dmitry Drozd

柏克萊大學和舊金山大學的研究人員推出了一種神經植入設備，可以為嚴重癱瘓的患者恢復自然對話。與現有的將腦電波解碼為口語的植入設備不同，這項技術可以即時運行，匹配表達和思維速度。該設備發表在《自然神經科學》雜誌上，它使用人工智能通過電子發聲器將大腦訊號合成為口語。柏克萊的Gopala Anumanchipalli指出：“我們的方法實現了像Alexa和Siri這樣的系統應用於神經修復體的快速語言解碼能力。” Cheol Jun Cho解釋說，神經修復體掃描植入運動皮層（控制語言產生）的電極的神經數據。然後，人工智能將這些數據重新格式化為語音。研究人員使用安妮（Ann）訓練了該算法，安妮在18年前因中風而失去了發聲能力。她試圖大聲朗讀單詞，讓人工智能完成她無法發聲的語音。該系統現在的延遲約為一秒鐘，可以進行連續對話。像ChatGPT和Claude這樣的大型語言模型（LLM）最初是黑盒系統，現在正在揭示其內部運作。過去兩年中開發的定制AI版本將人類推理轉化為AI驅動的解決方案。“AI微觀”顯示，AI將任務分解為戰略步驟，並在計劃期間構建相互關聯的概念。例如，克勞德在創作詩歌時，會在寫一個音節之前仔細地計劃整行。但是，人工智能並非對欺騙性推理免疫，有時會捏造信息，從而引起對信任的擔憂。語言學家已經確定了一種特定的互聯網俚語：“ TikTok口音”。這種“網紅語”具有語調上升的特徵，即在句子末尾聲音上升，以及金·卡戴珊（Kim Kardashian）推廣的聲門嘎吱。亞當·阿列克西奇（Adam Aleksic）解釋說，這種口音是“旨在操縱的”，是一種適應虛擬購物中心的“代碼轉換”形式。阿列克西奇將這種口音的起源追溯到1970年代加利福尼亞的瓦利斯皮克（Valleyspeak），其特徵是過度的句子結尾強調和填充詞。社交媒體也在改變口語，英國學生採用了美國的“ Youtube口音”，而美國兒童則通過諸如“小豬佩奇”之類的節目採用了英國口音。

閱讀更多有關此主題的新聞：

01 八月

演算法如何重塑語言：社群媒體與AI的影響

01 八月

人工智慧時代的語言挑戰：英語主導地位與多語言模型發展

31 七月

加泰羅尼亞語「Fer Campana」：學生逃學現象探討

发现错误或不准确的地方吗？

我们会尽快处理您的评论。