Агент видит ваш экран и кликает сам. Конец ручной автоматизации. В 2023 году автоматизация браузера выглядела так: Selenium, скрипты, хрупкие xpath-селекторы, которые ломались при каждом редизайне. Команды тратили месяцы на поддержку. Стоимость одного сценария — $10–50k. Сегодня картина другая. Мультимодальный агент открывает браузер, видит экран как изображение, понимает что на нём и выполняет задачу — кликает, заполняет формы, извлекает данные. Без xpath. Без SDK. Без знания структуры сайта. Это стало возможным благодаря vision-моделям, которые научились читать интерфейсы как человек, и reasoning-моделям, которые умеют планировать многошаговые задачи. Anthropic Computer Use, OpenAI Operator, Google Project Mariner — все крупные лаборатории запустили это в 2024–2025. Для рынка это структурный удар по трём категориям: RPA-вендоры (UiPath, Automation Anywhere), no-code автоматизация (Zapier, Make) и аутсорсинг рутинных операций. Всё, что делает человек в браузере по инструкции — теперь делает агент. Ключевые цифры: — 95% — точность выполнения задач у лучших агентов на WebArena — −90% — стоимость автоматизации vs традиционный RPA — $12B — объём RPA-рынка под прямой угрозой к 2026 году Выигрывают: AI-лаборатории, облачные провайдеры, вертикальные AI-агенты. Под давлением: UiPath, Automation Anywhere, Zapier, BPO-аутсорсинг. Вывод: мультимодальные агенты — это не улучшение автоматизации, это её замена. RPA-компании торгуются с мультиплеем роста, которого уже нет. UiPath потерял 60% капитализации с пика — и это ещё не дно. Следите за вертикальными агентами поверх этой инфраструктуры — там следующие единороги. Видите ли внедрение браузерных агентов в реальных компаниях — или пока стадия пилотов? Как оцениваете риски для RPA-вендоров в ваших портфелях? #AIагенты #автоматизация #RPA #инвестиции #технологии