Анимированный аватар с человеческим голосом — открывает ли Microsoft ящик Пандоры?

Анимированный аватар

Инструмент, создающий фотореалистичные аватары и анимирующий их для произнесения фраз от заданного человека, стал одним из самых неожиданных продуктов на мероприятии Microsoft Ignite 2023, пишет TechCrunch.

Преобразование текста в речь Azure AI Speech — это новая функция, которая в настоящее время доступна в общедоступной предварительной версии.

Она позволяет пользователям создавать видеоконтент, в котором аватар может говорить. Пользователи достигают этого, загружая изображения, напоминающие желаемый прототип, и предоставляя сценарий для произнесения.

Инструмент Microsoft использует модель для анимации аватара и отдельную модель для преобразования текста в речь.

Его можно либо заранее создать, либо натренировать на голосе человека — вербализовать сценарий.

В блоге Microsoft рассказывается о потенциале этого инструмента и его эффективности при создании обучающих видеороликов, представлений о продуктах и ​​отзывов клиентов.

«Вы можете использовать аватар для создания диалоговых агентов, виртуальных помощников, чат-ботов и многого другого», — пишет Microsoft. Предлагая многоязычные возможности, эти аватары могут использовать модели искусственного интеллекта, такие как GPT-3.5 от OpenAI, для ответа на устные запросы клиентов.

Тем не менее, Microsoft устранила возможность злоупотреблений этим инструментом, признав риски, связанные с аналогичными технологиями в предыдущих случаях, известных как Deepfake.

Хорошим примером является неправомерное использование технологий генерации аватаров стартапом искусственного интеллекта Synthesia для пропаганды и фейковых новостей, пишет TechCrunch.

Чтобы справиться с этическими дилеммами, Microsoft накладывает определенные ограничения.

Первоначально подписчики Azure будут иметь доступ только к предварительно созданным аватарам, тогда как пользовательские аватары остаются функцией «ограниченного доступа», требующей регистрации и ограниченной конкретными случаями использования.

Введение этой функции также вызывает этические проблемы, особенно отражающие недавнюю обеспокоенность, поднятую во время забастовки SAG-AFTRA по поводу использования искусственного интеллекта для создания виртуальных подобий актеров.

Чтобы предотвратить юридические осложнения, Microsoft требует «выраженного согласия» посредством записанного заявления, прежде чем пользователи смогут синтезировать свои голоса для личных аватаров.

Доступ к инструменту в настоящее время ограничен через регистрационную форму, при этом пользователи должны следовать определенным рекомендациям, ограничивающим использование Personal Voice определенными приложениями, лишенными пользовательского контента или открытого контента, сообщает TechCrunch.

Добавить комментарий