Футуристический институт стремится сохранить (и воссоздать) голоса людей с помощью искусственного интеллекта.
Исследователи, участвующие в инициативе «Банк голосов», надеются изменить жизнь всех людей, потерявших голос в результате болезни или несчастного случая. Потеря голоса на самом деле не похожа на кратковременное понижение звука или хрипоту. Потеря голоса — это отчасти потеря личности.
Все началось с сотрудничества между Северо-восточным университетом Бостона и Гласные D.. Важно предоставить тем, кто потерял способность говорить, способ сохранить чувство своей идентичности после рака горла или дегенеративного заболевания. Этот проект позволит им «говорить», используя синтетическую форму, очень похожую на их собственный голос.
Это первый центр такого типа, которым руководит проф. Рупал Патель, основатель и генеральный директор VocaliD.
Компания уже предлагает такую услугу для частных лиц, говорит Пател, но многим людям не хватает оборудования достаточного качества, чтобы правильно сэмплировать вокал. Создание «голосового банка» позволяет будущим пациентам сохранить свой голос, когда у них еще есть шанс.
«Часто пациенты приходят к нам в последний момент», кости. «У них недостаточно времени, чтобы сохранить голос, потому что они во власти болезней, операций и многого другого. И это очень расстраивает».
Голосовой банк
Результатом стало сотрудничество с Northeastern для распространения технологии среди общественности. Сердцем проекта является Клиника сохранения голоса, центр, где пациенты с риском потери голоса могут зарегистрировать его, чтобы защитить.
Подход намного сложнее, чем те, которые основаны на традиционных синтезах речи: алгоритм машинного обучения восстанавливает лигатуры, фонемы и даже ритм относительно дыхания. В специальной кабине записываются небольшие истории, стихи или разговоры на разные темы. Кто-то даже пошутил, что потерял голос - самоуничижительный способ справиться с большим страхом.
«То, что нужно, это около двух или трех часов разговора. Из этих записей наш искусственный интеллект может генерировать голосовой движок с таким же звуком. Это как вернуть голос тем, кто его потерял».
Восстановленный голос может быть использован как синтез речи для конвертации письменных текстов и может быть интегрирован завтра с программным обеспечением, которое генерирует слова, изображения или действия из ментальных путей.
Очень быстрое улучшение
Технология, говорит Патель, быстро совершенствуется и вскоре сможет воспроизводить речь, неотличимую от человеческой речи.
Команда также сможет «состарить» голос, чтобы адаптировать его к возрасту человека, в то время как «вырастить» голос мальчика, превратив его во взрослый, пока невозможно.