Краткий обзор: Компания Qwen, входящая в состав Alibaba, выпустила Qwen3.5-397B-A17B, открытую языковую модель обработки изображений с «гибридной архитектурой», которая обеспечивает значительное повышение производительности при выводе данных, конкурируя с такими гигантами, как GPT-5.2 от OpenAI и Gemini 3 Pro от Google.
Qwen-3.5 использует разреженную архитектуру MoE, активируя только 17 байт параметров из 397 байт для каждого запроса, что обеспечивает баланс между высокими возможностями и низкой задержкой.
Данная модель близка к лидерам рынка по всем параметрам и даже превосходит их в таких областях, как поиск с помощью агентов, распознавание документов и следование инструкциям.
Компания Alibaba утверждает, что его использование на 60% дешевле, а производительность при обработке больших объемов данных как минимум в 8 раз выше, чем у его непосредственного предшественника, Qwen3-Max.
Данная версия предназначена для обработки непрерывных многомодальных рассуждений, необходимых агентам, хотя, судя по всему, она пока не очень хорошо справляется с управлением торговым автоматом.
Почему это важно: китайские лаборатории добились значительных успехов, и благодаря Qwen3.5, сочетающему в себе производительность, близкую к передовой, снижение затрат на 60% и открытые веса, гонка явно смещается в сторону эффективности и масштабируемости. Если этот импульс сохранится, баланс в области ИИ может зависеть не столько от общего размера, сколько от того, кто сможет создавать мощные модели по самой низкой цене.
