"Здравствуйте! Это я." Но действительно ли это ты? В мире, где искусственный интеллект может клонировать человеческие голоса с пугающей точностью, этот вопрос уже не так очевиден. Microsoft только что подняла занавес ВАЛЛ-И 2, Я дам ссылку на документ здесь. Вещи? Это ИИ, способный воспроизводить голос человека так, чтобы он был неотличим от реальности. Технологический прогресс, обещающий чудеса, но таящий в себе подводные камни, заставляющие трепетать даже его создателей.
Искусственный интеллект обретает свой голос
VALL-E 2 — это не обычный голосовой синтезатор, который звучит как простудившийся робот. И это даже не одна из самых продвинутых систем на рынке (я имею в виду слухи об Elevenlabs). Нет, господа, это еще серьезнее. Речь идет об ИИ, достигшем «человеческого равенства» в области синтеза речи.
Но что делает ВАЛЛ-И 2 таким особенным? Ну, для начала, это маленькое технологическое чудо способно клонировать голос. после прослушивания всего трех секунд аудио. Три. Секунды. Время сказать: «Привет, как дела?» и бац: ИИ уже узнал секреты вашего голоса и может воспроизвести его по своему желанию. Как будто он обладал абсолютным слухом к человеческим голосам, способным уловить каждый малейший нюанс и прекрасно его воспроизвести.
VALL-E 2 превосходит предыдущие системы по надежности речи, естественности и сходству динамиков
Исследователи Microsoft
Вокальный гений… слишком гений?
Не думайте, что ВАЛЛ-И 2 просто повторяет простые предложения, как высокотехнологичный попугай. О, нет. Он также может управлять сложными и повторяющимися предложениями, которые обычно вызывают проблемы в системах синтеза речи. Как будто у него есть докторская степень по лингвистике и степень магистра актерского мастерства, и все это заложено в алгоритм.
Теперь представьте, что эта власть передается в руки общественности. Звучит захватывающе, правда? Ну, не так быстро. Создатели VALL-E 2 настолько впечатлены (и обеспокоены) возможностями своего существа. который решил держать ее в клетке «исключительно в качестве исследовательского проекта». Никакого публичного доступа, никакой интеграции в коммерческие продукты. Они создали дракона и теперь не знают, как с ним справиться.
И вы можете их понять. В эпоху, когда телефонное мошенничество стало обычным явлением, ИИ, способный с такой точностью клонировать голоса, может стать очень мощным оружием в чужих руках. Представьте, что вам позвонила ваша дочь и попросила срочно отправить ей немного денег. Звучит как она, говорит как она, но... действительно ли это она?
Темная сторона вокального совершенства
Исследователи Microsoft, конечно, не наивны. Они прекрасно осознают потенциальные риски, связанные с такой передовой технологией:
Неправильное использование модели может создавать потенциальные риски, такие как подмена голосовой идентификации или выдача себя за конкретного говорящего.
Другими словами, VALL-E 2 можно использовать для обмана систем безопасности, основанных на распознавании голоса, или для создания невероятно убедительных звуковых дипфейков. Эта штука открывает любой голосовой замок.
Он может клонировать чей-либо голос.
Грань между полезным использованием и злоупотреблением тонка, как волос. И, надеюсь, пока мы не найдём способ безопасно перемещаться по этим коварным водам. в алгоритмике, ВАЛЛ-И 2 останется запертым (? Может быть) в исследовательских лабораториях, как джинн, слишком могущественный, чтобы его можно было освободить из своей лампы.
Мы надеемся найти ключ к этой проблеме, ведь эта технология действительно могла бы помочь (приведу пример) людям с афазией или другими патологическими нарушениями, связанными с речью. Или подумайте о возможностях в сфере образования, развлечений, журналистики. Это было бы невероятно.
Голос будущего
Голос, который я слышу сейчас в своей голове, шепчет мне: что нас ждет завтра? Является ли VALL-E 2 лишь началом новой эры, в которой искусственные голоса будут неотличимы от человеческих? Или это тревожный звонок, напоминающий нам о необходимости проявлять осторожность в использовании искусственного интеллекта?
Технология клонирования человеческих голосов совершила квантовый скачок, и пути назад уже нет. Мы стоим на пороге нового мира, в котором голос больше не будет неопровержимым доказательством личности.
И на самом деле, в конце концов, я даже не знаю, действительно ли эта мысль моя. В таком мире, как наш, никогда нельзя быть слишком уверенным.