НейроНовости главные апдейты ИИ за прошедшую неделю

🎩 НейроНовости | главные апдейты ИИ за прошедшую неделю

🤖✴️ OpenAI выпустила гайд по промптам для GPT-5.2
Главный принцип - проще формулировка, выше результат: меньше глаголов, больше ясности. Плюс появился механизм «сжатия», который упаковывает длинные диалоги и позволяет агентам работать дольше без потери контекста.

🎥 ✴️Google превратила камеру смартфона в генератор музыки
Приложение Lyria Camera анализирует картинку через Gemini и сразу генерирует подходящий саундтрек с помощью Lyria RealTime. Навёл камеру - получил музыку под сцену в реальном времени.

✴️ Вышел Qwen Code v0.5.0
Обновление для разработчиков: интеграция с VSCode, TypeScript SDK, умные сессии, поддержка русскоязычного интерфейса и совместимость с моделями рассуждения. Инструмент стал заметно стабильнее и удобнее.

✴️ Kling добавил стартовые и конечные кадры в VIDEO O1
Теперь можно жёстко задавать начало и конец сцены (3-10 секунд), точнее контролировать темп и получать более плавные переходы. Плюс появился режим 720p с теми же фичами, что и в 1080p.

🗣Kling 2.6 получил Voice Control
Модель умеет извлекать тембр из аудио и точно воспроизводить голос персонажа в видео. Это даёт стабильную озвучку, реализм и узнаваемость диалогов.

🕺Kling VIDEO 2.6 теперь с Motion Control
Полный контроль движений: тело, руки, мимика и сложные действия без размытия. Можно загружать референсы движения до 30 секунд и тонко управлять сценой через текст.

🎞Вышла видеомодель Wan 2.6
Первая китайская видеомодель с ролевыми функциями: синхронизация аудио и видео, мультикамерные сцены и генерация до 1080p. Поддерживает референсные видео для согласованности персонажей.

🖼OpenAI представила ChatGPT Images
Новая флагманская модель генерации изображений: точнее следует инструкциям, лучше редактирует и работает в 4 раза быстрее. Уже доступна в ChatGPT и API как GPT Image 1.5.

👨‍💻OpenAI выпустила GPT-5.2 Codex
Модель для сложной разработки: лучше понимает большие кодовые базы, уверенно редактирует несколько файлов и справляется с многошаговыми задачами.

🎨Black Forest Labs показали FLUX.2 [max]
Модель с упором на эстетику, продуктовые изображения и Grounded Generation с поиском в интернете. Подходит для кино, концепт-арта и визуального сторителлинга.

🎧Meta выпустила SAM Audio
Аудиомодель, которая умеет изолировать и редактировать звук на уровне объектов — голоса, музыку и эффекты можно вытаскивать и править отдельно. Ускоряет монтаж и ремикширование.

⚡️ Google представила Gemini 3 Flash
Быстрая и дешёвая модель, которая в 3 раза быстрее 2.5 Pro и показывает топовые результаты в логике и коде. Уже доступна бесплатно и заменила старую Flash-версию во всех продуктах Google.

🎮Вышла LongCat-Video-Avatar
Open-source модель для реалистичных видео-аватаров, хорошо работающая с длинными роликами и несколькими персонажами. Лидер тестов по «человечности» аватаров.

🌎Tencent показал HY World 1.5 (WorldPlay)
Модель для интерактивной генерации 3D-миров в реальном времени с устойчивой геометрией. Можно буквально «гулять» по миру, созданному по тексту или изображениям.

📹ByteDance выпустил Seedance 1.5 Pro
Видеомодель с естественными диалогами, улучшенной синхронизацией губ и точным управлением камерой. Доступна в CapCut Desktop с бесплатными пробными генерациями.

📊LovartAI научили собирать презентации
Пишете тему агент сам ищет данные, читает PDF и делает готовую презентацию с дизайном. Максимум автоматизации, минимум ручной работы.

✴️ Higgsfield запускает Cinema Studio
Полноценная ИИ-киностудия: контроль камеры, согласованность сцен, инструменты для сериалов и фильмов. Поддержка 4K, кинообъективов и режиссёрских движений.

🔥 Больше в телеграм канале жми

0 / 2000

Ваш комментарий