ИИ пошел за новыми данными и нашел их в корпоративных чатах.
Компании начали продавать архивы рабочих переписок, писем и задач для обучения ИИ. И это не мелкий заработок.
Так, основательница cielo24 (сервис создания субтитров) Шанна Джонсон на закрытии своего бизнеса выручила «сотни тысяч долларов» за данные за 13 лет: Slack, почта, Jira, Google Drive. Слила весь офисный бэкстейдж и внутряк.
Спрос ажиотажный: за год через платформу SimpleClosure провели около 100 сделок на $1+ млн, разброс $10–100 тыс. за набор данных в рамках одной сделки. Разработчики ИИ буквально охотятся за такими архивами. Публичный интернет уже выдоен досуха, а реальные рабочие процессы – идеальная тренировка для ИИ-сотрудников.
Особенно ценятся данные из финансов и медицины, так как там больше «мяса». Чем сложнее связи (например, задача + код), тем материал дороже.
Правда, сотрудники не подписывались на то, что их рабочие переписки станут топливом для нейросетей.
Формально, данные «анонимизируют», но пока нормального способа защитить приватность пока нет.