ИИ восстанавливает речь, раскрывает внутреннюю работу языковых моделей и идентифицирует акцент TikTok

Отредактировано: D D

Исследователи из университетов Беркли и Сан-Франциско представили неврологический имплантат, который восстанавливает естественную речь у пациентов с тяжелым параличом. В отличие от существующих имплантатов, которые декодируют мозговые волны в устную речь, эта технология работает в режиме реального времени, согласовывая выражение и скорость мышления. Опубликованное в *Nature Neuroscience* устройство использует ИИ для синтеза мозговых сигналов в устную речь с помощью электронного вокализатора. Гопала Ануманчипалли из Беркли отмечает: «Наш подход обеспечивает быструю лингвистическую расшифровку, как в системах Alexa и Siri, примененную к нейронному протезу». Чхоль Джун Чо объясняет, что нейропротез сканирует неврологические данные с электродов, имплантированных в моторную кору, которая контролирует производство речи. Затем ИИ преобразует эти данные в речь. Исследователи обучили алгоритм, используя Энн, пациентку, которая потеряла способность говорить 18 лет назад из-за инсульта. Она пыталась читать слова вслух, позволяя ИИ завершить речь, которую она не могла произнести. Система теперь имеет задержку около одной секунды, что позволяет вести непрерывный разговор. Большие языковые модели (LLM), такие как ChatGPT и Claude, изначально являвшиеся системами «черного ящика», теперь раскрывают свою внутреннюю работу. Пользовательские версии ИИ, разработанные за последние два года, преобразуют человеческие рассуждения в решения на основе ИИ. «ИИ-микроскоп» показывает, что ИИ разбивает задачи на стратегические этапы, выстраивая взаимосвязанные концепции во время планирования. Клод, например, тщательно планирует целые строки, прежде чем написать хотя бы один слог при сочинении стихов. Однако ИИ не застрахован от обманчивых рассуждений, иногда фабрикуя информацию, что вызывает опасения по поводу доверия. Лингвисты определили специфический интернет-сленг: «акцент TikTok». Этот «язык влиятельных лиц» характеризуется восходящей интонацией, когда голос повышается в конце предложений, и вокальным фрайем, популяризированным Ким Кардашьян. Адам Алексич объясняет, что этот акцент «предназначен для манипулирования», это форма «переключения кодов», адаптированная к виртуальному торговому центру. Алексич прослеживает происхождение этого акцента до Valleyspeak 1970-х годов в Калифорнии, характеризующегося чрезмерным ударением в конце предложения и словами-заполнителями. Социальные сети также меняют устную речь: британские студенты перенимают американский «Youtube-акцент», а американские дети перенимают британский акцент благодаря таким шоу, как «Peppa Pig».

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.