
Привет, подписчики! Невозможно даже на неделю отойти от новостной ленты, чтобы не пропустить что-то важное. Сфера искусственного интеллекта продолжает взрывать мозг. Собрали для вас дайджест главных новинок последних дней, которые уже меняют правила игры.
1. Мультимодальность от OpenAI (и не только)
Компания OpenAI официально запустила возможности, о которых мы так долго говорили. Теперь их флагманская модель умеет не только читать текст, но и «видеть» экран вашего смартфона в реальном времени, решать уравнения по фотографии и даже распознавать эмоции по голосу. Прямая конкуренция с голосовыми ассистентами выходит на новый уровень — теперь это похоже на общение с живым собеседником, а не с роботом.
2. Генерация видео становится реальностью
На прошлой неделе сразу два игрока (Kling и Luma Dream Machine) представили обновления своих видеогенераторов. Теперь качество синтеза видео почти не отличить от реальной съемки. Главный тренд — управление эмоциями персонажей и сложная анимация объектов. Маркетологи и создатели контента уже вовсю тестируют эти инструменты для быстрого прототипирования рекламы.
3. Open Source не сдается
Пока СМИ пишут о гигантах, сообщество разработчиков выпустило новую версию мощной opensource-модели, которая всего на 10% уступает GPT-4 по качеству, но при этом может работать на вашем домашнем ПК. Это означает, что ИИ становится доступным для всех, а приватность данных снова выходит на первый план.
Мысль недели: ИИ перестает быть просто «чат-ботом». Он превращается в полноценного цифрового агента, который видит, слышит и действует. Готовы ли вы к такому будущему?