Вскоре мы могли проверять телефон или слушать музыку, просто шевеля губами, не говоря ни слова. Группа исследователей из Корнеллского университета Он разработал сонарные очки, которые могут отслеживать движения лица и интерпретировать их как команды.
Как работают сонарные очки
Руйдонг Чжан, аспирант Корнеллского университета, является инициатором этого инновационного проекта. Сонарные очки используют крошечные микрофоны и динамики, чтобы распознавать слова, которые мы молча «произносим», и передавать команды на наше устройство. Система основана на другом изобретении команды — беспроводной гарнитуре, а также на предыдущих моделях, в которых использовались камеры.
Благодаря этой новой форме больше не нужно носить гарнитуру или находиться в кадре камеры. Ченг Чжан, доцент кафедры информатики в Корнелле, объясняет, что системе требуется несколько минут обучающих данных, например, чтения ряда чисел, чтобы изучить модели произношения пользователя. После готовности эхолот отправляет и принимает звуковые волны на лицо пользователя, обнаруживая движения губ и анализируя профили эха в режиме реального времени с помощью алгоритма глубокого обучения. с точностью 95%.
Практические приложения, посвященные конфиденциальности
Система обрабатывает данные на вашем смартфоне по беспроводной сети, позволяя аксессуару оставаться небольшим и ненавязчивым. Текущая версия обеспечивает около 10 часов автономной работы при акустическом обнаружении, а поскольку данные не покидают телефон, проблем с конфиденциальностью нет.
Конфиденциальность также является важным фактором при рассмотрении возможных вариантов использования этой технологии в реальной жизни. Чжан предполагает, что сонарные очки можно использовать для управления воспроизведением музыки (без помощи рук и не глядя) в тихой библиотеке или для диктовки сообщения во время громкого концерта, где стандартные варианты не работают.
Одна из самых интересных перспектив предполагает использование этой технологии людьми с некоторыми нарушениями речи, которые смогут использовать очки, чтобы молча «диктовать» текст речевому синтезатору, который затем будет произносить слова вслух. «Мы верим, что очки станут важной платформой персональных компьютеров для понимания деятельности человека в повседневных ситуациях», — говорит Ченг Чжан.
Поистине выдающийся скачок вперед в носимых технологиях.