Исследователи из Калифорнийского университета в Сан-Диего недавно создали систему машинного обучения, которая предсказывает, какие птицы собираются петь.
Если вы не найдете больших практических возможностей, я начну с того, что скажу вам, что прогнозирующий синтез речи в реальном времени для голосовых протезов уже был бы отличным вариантом. Но понимание пения птиц может пойти гораздо дальше.
Песня птиц, чрезвычайно понятный мир
Пение птиц - это сложная форма общения, которая включает в себя ритм, тон и, что наиболее важно, выученное поведение.
По мнению исследователей, обучение искусственного интеллекта понимать (и уметь предвидеть) пение птиц — это ценный шаг на пути к замене биологических человеческих вокалов.
В качестве животной модели в моторном протезировании использовались приматы. Аналогичной модели голосовых протезов не существует. Возможно, именно поэтому они более ограничены с точки зрения технологии нейронного интерфейса, охвата мозга и дизайна поведенческих исследований.
«Придумать» пение птиц непросто, но это важный шаг
Певчие птицы представляют собой интересную модель сложного выученного вокального поведения. Пение птиц имеет ряд уникальных сходств с человеческой речью. Его изучение уже дало прекрасную общую информацию о механизмах и схемах, лежащих в основе обучения, выполнения и поддержания голосовых моторных навыков.
Но перевод вокализаций в реальном времени - непростая задача. Современные системы все еще медленны по сравнению с нашими естественными образцами мысли и речи.
Подумайте об этом, потому что это прекрасно: передовые системы обработки естественного языка все еще с трудом успевают за человеческим мышлением.
Мы все еще слишком быстры для машины
Когда мы взаимодействуем с нашим Google Assistant или Alexa, пауза часто бывает более длительной, чем мы ожидаем при разговоре с реальным человеком. Это потому, что ИИ обрабатывает нашу речь, определяя значение каждого слова в зависимости от его возможностей, а затем выясняя, к каким реакциям или программам нужно получить доступ, чтобы ответить.
Конечно, уже удивительно, что эти облачные системы работают с такой скоростью. Но они пока недостаточно хороши, чтобы создать интерфейс реального времени, позволяющий людям, лишенным голоса, говорить со скоростью мысли.
Исследование пения птиц
Сначала команда имплантировала электроды в мозг дюжины птиц (зебровых амадин), а затем начала регистрировать активность мозга во время пения птиц.
Но недостаточно научить ИИ распознавать нейронную активность птиц во время их пения: даже мозг птицы слишком сложен, чтобы полностью отобразить, как работают коммуникации между его нейронами.
Поэтому исследователи обучили другую систему преобразовывать песни в режиме реального времени в узнаваемые шаблоны, с которыми может работать ИИ.
Это очень интересно, потому что дает решение нерешенной проблемы.
Обработка пения птиц в реальном времени впечатляет. и воспроизведение этих результатов с помощью человеческого языка было бы историческим.
Но эта первая работа еще не готова. И он еще не может быть адаптирован к другим системам речи. Это может не сработать, кроме пения птиц.
Но если бы это было так, это был бы один из первых гигантских технологических прорывов в области мозговых компьютерных интерфейсов после возрождения глубокого обучения в 2014 году.