Top.Mail.Ru
📱 НейроНовости недели: самое главное из мира ИИ за последние 7 дней! ✴️ Qwen Image Edit Теперь можно менять - изображение

📱 НейроНовости недели: самое главное из мира ИИ за последние 7 дней!

✴️ Qwen Image Edit
Теперь можно менять ракурс на фото, как будто управляешь камерой: двигай её вперёд-назад, поворачивай объектив, ставь широкоугольник или сверху вниз - и сцена перестраивается с сохранением света и композиции.

🎨 Lovart - Edit Elements
Появилось редактирование текста и объектов прямо внутри картинки: живой текст без регенерации, отдельные слои, перемещение и смешивание элементов - всё как в продакшн-редакторе.

✴️ Meta обучила ИИ понимать 1600 языков
Omnilingual ASR распознаёт речь даже на редких диалектах, частота ошибок - ниже 10%, код открыт, а покрытие можно расширять своими примерами. Плюс Meta выложила крупнейший корпус речи на 350 языках.

🌐 Marble - генерация 3D-миров из ничего
Загружаешь фото, видео или пишешь пару слов - и Marble создаёт полноценное реалистичное 3D-пространство для игр, шоукейсов, визуализаций и виртуальных миров.

✴️ OpenAI выпустила GPT-5.1
Модель стала умнее и дружелюбнее: Instant - супербыстрая, Thinking - более человечная в объяснениях, а пользовательские тона превращают ChatGPT в полностью персонализированный стиль общения. ChatGPT получил групповые чаты. Можно обсуждать идеи и проекты вместе: создаёте общий чат, кидаете ссылку друзьям - и ChatGPT помогает всей группе сразу.Групповые чаты пока доступны в Японии, Новой Зеландии, Южной Корее и Тайване. В США они пока недоступны.

🖥 Также OpenAI выпустила гайд по промптам для GPT-5.1
Большое руководство по созданию профессиональных подсказок: стили, контроль длины кода, использование инструментов и практические шаблоны для продакшн-агентов.

✴️ Scribe V2 Realtime от ElevenLabs
Транскрипция с почти нулевой задержкой и поддержкой 90+ языков - идеально для звонков, митингов и стриминга даже в шумных условиях.

✴️ Kling 2.5 Turbo с начальным и финальным кадром
Теперь можно фиксировать первый и последний кадры, задавая точную траекторию движения. Меньше артефактов, больше стабильности и контроль над динамикой сцены.

📱 YouWare: создавай приложения с телефона
Полноценное приложение без кода и без ноутбука - прямо на смартфоне. А кнопка Boost обновляет дизайн в один клик, превращая прототип в аккуратный интерфейс.

✴️ Gemini Live расширил аудиовозможности
Теперь встроенное аудио доступно всем: более выразительные голоса, контроль темпа и стиля - голосовое общение стало живее и полезнее.

⭐️ NotebookLM: стили видеоревью + Deep Research
Теперь можно выбирать визуальный стиль обзоров (минимализм, BW, поп-арт), а также запускать глубокое исследование источников прямо в документе.

🤡 Synthesia добавила реалистичные аватары
Аватары теперь жестикулируют, ходят, взаимодействуют со сценой и ведут себя как актёры - реалистичные обучающие ролики без камеры и студии.

➡️ NotebookLM научился исследовать изображения
Загружаешь фото, скриншоты или диаграммы - NotebookLM извлекает суть, объясняет и делает структурированные материалы на основе визуального контента.

✏️ PixVerse добавил функцию "Изменить"
В одно нажатие можно удалить, заменить или добавить объект прямо на видео - быстрый монтаж, который раньше требовал After Effects.

🐉 Baidu представила ERNIE 5.0 - омнимодальную модель на 2.4 триллиона параметров.
Конкурирует с Gemini-2.5-Pro и GPT-5-High, создаёт текст, видео, изображения на уровне топовых моделей и уже заняла #1 в Китае.

0 / 2000
Ваш комментарий
Тебя ждёт миллион инвесторов
Регистрируйся бесплатно, чтобы учиться у лучших, следить за инсайтами и повторять успешные стратегии
Мы используем файлы cookie, чтобы улучшить ваш опыт на нашем сайте
Нажимая «Принять», вы соглашаетесь на использование файлов cookie в соответствии с Политикой конфиденциальности. Можно самостоятельно управлять cookie через настройки браузера: их можно удалить или настроить их использование в будущем.
НейроНовости недели самое главное из мира ИИ за | Базар