Футуристический институт стремится сохранить (и воссоздать) голоса людей с помощью искусственного интеллекта.
Исследователи, участвующие в инициативе «Голосовой банк», надеются, что смогут изменить жизнь всех людей, потерявших голос в результате болезни или несчастного случая. Потеря голоса — это не то же самое, что временное снижение звука или осиплость голоса. Потеря голоса отчасти является потерей идентичности.
Все началось с сотрудничества между Северо-восточным университетом Бостона и Гласные D.. Очень важно предложить тем, кто потерял способность говорить, способ сохранить чувство своей идентичности после рака горла или дегенеративного заболевания. Этот проект позволит им «говорить», используя синтетическую форму, очень похожую на их собственный голос.
Это первый центр такого типа, которым руководит проф. Рупал Патель, основатель и генеральный директор VocaliD.
Компания уже предлагает такую услугу для частных лиц, говорит Патель, но у многих людей нет доступа к высококачественному оборудованию, чтобы правильно прослушивать свой голос. Создание «голосового банка» позволяет будущим пациентам сохранить свой голос, пока у них еще есть такая возможность.
«Пациенты часто приходят к нам в последнюю минуту» кости. «У них нет достаточно времени, чтобы сохранить свой голос, потому что они находятся во власти болезней, операций и многого другого. И это очень расстраивает».
Голосовой банк
Результатом стало сотрудничество с Northeastern для распространения технологии среди общественности. Сердцем проекта является Клиника сохранения голоса, центр, где пациенты с риском потери голоса могут зарегистрировать его, чтобы защитить.
Подход гораздо сложнее, чем подходы, основанные на традиционном синтезе речи: алгоритм машинного обучения восстанавливает лигатуры, фонемы и даже ритм относительно дыхания. В специальной кабине записываются небольшие истории, стихи или разговоры на разные темы. Кто-то даже пошутил, что потерял голос - самоуничижительный способ справиться с большим страхом.
«Что вам нужно, так это два или три часа выступления. На основе этих записей наш искусственный интеллект способен генерировать речевой механизм, который звучит одинаково. Это все равно, что вернуть голос тем, кто его потерял».
Восстановленный голос может быть использован как синтез речи для конвертации письменных текстов и может быть интегрирован завтра с программным обеспечением, которое генерирует слова, изображения или действия из ментальных путей.
Очень быстрое улучшение
Технология, говорит Патель, быстро совершенствуется и вскоре сможет воспроизводить речь, неотличимую от человеческой речи.
Команда также сможет «состарить» голос, чтобы адаптировать его к возрасту человека, тогда как «вырастить» детский голос во взрослый пока невозможно.