Google только что представила Lyria 3 в Gemini, новой модели генерации музыки на основе искусственного интеллекта, позволяющей пользователям превращать текстовую подсказку или фотографию в персонализированные 30-секундные треки с автоматически сгенерированными текстами и обложками.
Модель самостоятельно обрабатывает все параметры, от жанра и темпа до вокального стиля и текста песен, при этом пользователи могут вводить текст, фотографии или видео в качестве отправной точки.
Компания DeepMind работает над Lyria с 2023 года, но это первый случай, когда технология становится доступна основной потребительской аудитории через приложение Gemini.
Каждый трек помечается водяным знаком SynthID от Google, а Gemini также позволяет пользователям загружать любые аудиофайлы, чтобы проверить, были ли они созданы с помощью ИИ.
Создатели контента на YouTube также получают доступ к Lyria 3 через Dream Track for Shorts, что позволяет легко настраивать звуковые дорожки для сопровождения видеороликов.
Платформы для создания музыки с использованием ИИ, такие как Suno и Udio, незаметно стали невероятно хороши, создавая полноценные треки, способные обмануть большинство слушателей, но всё ещё далеки от «мейнстрима». Встраивание Lyria в Gemini — это совсем другое дело, предоставляющее миллионам пользователей, которые, вероятно, никогда даже не слышали о специализированных моделях создания музыки, возможность создания музыки с помощью ИИ всего лишь одним нажатием кнопки
