
📱 НейроНовости недели: самое главное из мира ИИ за последние 7 дней!
✴️ Qwen Image Edit
Теперь можно менять ракурс на фото, как будто управляешь камерой: двигай её вперёд-назад, поворачивай объектив, ставь широкоугольник или сверху вниз - и сцена перестраивается с сохранением света и композиции.
🎨 Lovart - Edit Elements
Появилось редактирование текста и объектов прямо внутри картинки: живой текст без регенерации, отдельные слои, перемещение и смешивание элементов - всё как в продакшн-редакторе.
✴️ Meta обучила ИИ понимать 1600 языков
Omnilingual ASR распознаёт речь даже на редких диалектах, частота ошибок - ниже 10%, код открыт, а покрытие можно расширять своими примерами. Плюс Meta выложила крупнейший корпус речи на 350 языках.
🌐 Marble - генерация 3D-миров из ничего
Загружаешь фото, видео или пишешь пару слов - и Marble создаёт полноценное реалистичное 3D-пространство для игр, шоукейсов, визуализаций и виртуальных миров.
✴️ OpenAI выпустила GPT-5.1
Модель стала умнее и дружелюбнее: Instant - супербыстрая, Thinking - более человечная в объяснениях, а пользовательские тона превращают ChatGPT в полностью персонализированный стиль общения. ChatGPT получил групповые чаты. Можно обсуждать идеи и проекты вместе: создаёте общий чат, кидаете ссылку друзьям - и ChatGPT помогает всей группе сразу.Групповые чаты пока доступны в Японии, Новой Зеландии, Южной Корее и Тайване. В США они пока недоступны.
🖥 Также OpenAI выпустила гайд по промптам для GPT-5.1
Большое руководство по созданию профессиональных подсказок: стили, контроль длины кода, использование инструментов и практические шаблоны для продакшн-агентов.
✴️ Scribe V2 Realtime от ElevenLabs
Транскрипция с почти нулевой задержкой и поддержкой 90+ языков - идеально для звонков, митингов и стриминга даже в шумных условиях.
✴️ Kling 2.5 Turbo с начальным и финальным кадром
Теперь можно фиксировать первый и последний кадры, задавая точную траекторию движения. Меньше артефактов, больше стабильности и контроль над динамикой сцены.
📱 YouWare: создавай приложения с телефона
Полноценное приложение без кода и без ноутбука - прямо на смартфоне. А кнопка Boost обновляет дизайн в один клик, превращая прототип в аккуратный интерфейс.
✴️ Gemini Live расширил аудиовозможности
Теперь встроенное аудио доступно всем: более выразительные голоса, контроль темпа и стиля - голосовое общение стало живее и полезнее.
⭐️ NotebookLM: стили видеоревью + Deep Research
Теперь можно выбирать визуальный стиль обзоров (минимализм, BW, поп-арт), а также запускать глубокое исследование источников прямо в документе.
🤡 Synthesia добавила реалистичные аватары
Аватары теперь жестикулируют, ходят, взаимодействуют со сценой и ведут себя как актёры - реалистичные обучающие ролики без камеры и студии.
➡️ NotebookLM научился исследовать изображения
Загружаешь фото, скриншоты или диаграммы - NotebookLM извлекает суть, объясняет и делает структурированные материалы на основе визуального контента.
✏️ PixVerse добавил функцию "Изменить"
В одно нажатие можно удалить, заменить или добавить объект прямо на видео - быстрый монтаж, который раньше требовал After Effects.
🐉 Baidu представила ERNIE 5.0 - омнимодальную модель на 2.4 триллиона параметров.
Конкурирует с Gemini-2.5-Pro и GPT-5-High, создаёт текст, видео, изображения на уровне топовых моделей и уже заняла #1 в Китае.