Alibaba и компания Qwen

Краткий обзор: Компания Qwen, входящая в состав Alibaba, выпустила Qwen3.5-397B-A17B, открытую языковую модель обработки изображений с «гибридной архитектурой», которая обеспечивает значительное повышение производительности при выводе данных, конкурируя с такими гигантами, как GPT-5.2 от OpenAI и Gemini 3 Pro от Google.

Qwen-3.5 использует разреженную архитектуру MoE, активируя только 17 байт параметров из 397 байт для каждого запроса, что обеспечивает баланс между высокими возможностями и низкой задержкой.

Данная модель близка к лидерам рынка по всем параметрам и даже превосходит их в таких областях, как поиск с помощью агентов, распознавание документов и следование инструкциям.

Компания Alibaba утверждает, что его использование на 60% дешевле, а производительность при обработке больших объемов данных как минимум в 8 раз выше, чем у его непосредственного предшественника, Qwen3-Max.

Данная версия предназначена для обработки непрерывных многомодальных рассуждений, необходимых агентам, хотя, судя по всему, она пока не очень хорошо справляется с управлением торговым автоматом.

Почему это важно: китайские лаборатории добились значительных успехов, и благодаря Qwen3.5, сочетающему в себе производительность, близкую к передовой, снижение затрат на 60% и открытые веса, гонка явно смещается в сторону эффективности и масштабируемости. Если этот импульс сохранится, баланс в области ИИ может зависеть не столько от общего размера, сколько от того, кто сможет создавать мощные модели по самой низкой цене.

Краткий обзор: Компания Qwen, входящая в состав Alibaba, выпустила Qwen3.5-397B-A17B, открытую языковую модель - изображение

0 / 2000

Ваш комментарий