柏克萊大學和舊金山大學的研究人員推出了一種神經植入設備,可以為嚴重癱瘓的患者恢復自然對話。與現有的將腦電波解碼為口語的植入設備不同,這項技術可以即時運行,匹配表達和思維速度。該設備發表在《自然神經科學》雜誌上,它使用人工智能通過電子發聲器將大腦訊號合成為口語。柏克萊的Gopala Anumanchipalli指出:“我們的方法實現了像Alexa和Siri這樣的系統應用於神經修復體的快速語言解碼能力。” Cheol Jun Cho解釋說,神經修復體掃描植入運動皮層(控制語言產生)的電極的神經數據。然後,人工智能將這些數據重新格式化為語音。研究人員使用安妮(Ann)訓練了該算法,安妮在18年前因中風而失去了發聲能力。她試圖大聲朗讀單詞,讓人工智能完成她無法發聲的語音。該系統現在的延遲約為一秒鐘,可以進行連續對話。 像ChatGPT和Claude這樣的大型語言模型(LLM)最初是黑盒系統,現在正在揭示其內部運作。過去兩年中開發的定制AI版本將人類推理轉化為AI驅動的解決方案。“AI微觀”顯示,AI將任務分解為戰略步驟,並在計劃期間構建相互關聯的概念。例如,克勞德在創作詩歌時,會在寫一個音節之前仔細地計劃整行。但是,人工智能並非對欺騙性推理免疫,有時會捏造信息,從而引起對信任的擔憂。 語言學家已經確定了一種特定的互聯網俚語:“ TikTok口音”。這種“網紅語”具有語調上升的特徵,即在句子末尾聲音上升,以及金·卡戴珊(Kim Kardashian)推廣的聲門嘎吱。亞當·阿列克西奇(Adam Aleksic)解釋說,這種口音是“旨在操縱的”,是一種適應虛擬購物中心的“代碼轉換”形式。阿列克西奇將這種口音的起源追溯到1970年代加利福尼亞的瓦利斯皮克(Valleyspeak),其特徵是過度的句子結尾強調和填充詞。社交媒體也在改變口語,英國學生採用了美國的“ Youtube口音”,而美國兒童則通過諸如“小豬佩奇”之類的節目採用了英國口音。
人工智能恢復語音,揭示語言模型的內部運作,並識別TikTok口音
编辑者: D D
閱讀更多有關此主題的新聞:
发现错误或不准确的地方吗?
我们会尽快处理您的评论。