#llm — посты и обсуждения

9 публикаций

OpenAI запрещает в общении упоминание гоблинов, енотов и пр.

В системных инструкциях GPT-5.5 Codex есть прямой запрет от Сэма Альтмана упоминать гоблинов, гремлинов, енотов, троллей, огров и голубей — кроме случаев, когда это «абсолютно и недвусмысленно релевантно запросу». Причём эту строчку в промпте продублировали — видимо, для надёжности, вдруг гоблины всё-таки пробьют брешь в Хельмовой пади.

Объяснение сему такое:

Новая модель OpenAI «подсела» на эти словечки. Почему именно — никто не знает. Возможно, это заехало в модель на тюнинге: быть может, модель дообучали на данных разраба-толкиниста, как вариант. Или просто кто-то прикололся. Или она сама дообучилась на сабреддите про фентези.

Но, в итоге модель начала использовать эти словечки как паразитов. А-ля, как мы называем что-то непонятное «штуковина» или «хренотень», GPT-5.5 стала называть баги «гремлинами» и «гоблинами».

Самое интересно в этой истории — это то, как решили исправлять сие. Не дообучением или переразметкой данных, а ... костыльной строчкой в системном промпте (двойной). То есть, вывод здесь не просто «лол, гоблины», а чуть глубже: системные промпты у больших LLM — это уже не аккуратные брифы, а свалка костылей под конкретные галлюцинации, накопившиеся за все релизы.

Получился такой «промпт-долг» (как техдолг, но для ИИ-эпохи). Хорошая новость — иногда промпт-долг реально угарный. Плохая — мы не всегда знаем, что там ещё наворотили внутри, помимо безобидных гоблинов и енотов.

#ИИ #обучение #промпт #OpenAI #AI #LLM

https://github.com/openai/codex/blob/main/codex-rs/models-manager/models.json#L55

Оставить комментарий (1)

529

LuckyEntrepreneur_0099

Документы больше не читает одна модель: как Synthetic Parshing Pipelines меняют финансовый процессинг Апрель 2026. IBM фиксирует сдвиг: обработка документов больше не доверяется одной «большой» языковой модели. Компании переходят на Synthetic Parsing Pipelines — конвейеры, которые дробят документ на фрагменты (заголовки, таблицы, изображения) и направляют каждый к профильной модели. Результат: снижение вычислительных затрат при росте точности. Для финансового сектора — революция в обработке отчётности, контрактов и регуляторных документов. Почему одна модель — проблема Универсальные LLM пытаются быть мастерами на все руки. Но на практике: · Таблицы — модель путает строки и столбцы, теряет иерархию. · Графики — даже мультимодальные модели ошибаются в трендах. · Юридические формулировки — LLM галлюцинирует, добавляя несуществующие пункты. Каждая ошибка в финансовом документе стоит денег. Конвейерный подход решает это: таблица идёт к модели, обученной на тысячах таблиц, изображение — к CV-модели, текст — к LLM с юридической донастройкой. Как работает пайплайн 1. Сегментация — документ разбивается на логические блоки. 2. Маршрутизация — каждый блок отправляется к специализированной модели. 3. Синтез — результаты собираются, проверяются, формируется структурированный выход. «Синтетический» означает, что пайплайн сам генерирует тренировочные данные для маршрутизатора, улучшая точность без ручной разметки. Что даёт финансистам · Снижение cost per token на 40–60% против одной тяжёлой LLM. · Рост точности извлечения — критично для МСФО и US GAAP. · Обработка сложных документов — годовые отчёты и кредитные договоры за секунды. · Прозрачность для регуляторов — пайплайн отмечает участки с низкой уверенностью для ручной проверки. Пример Инвестбанк обрабатывает 10 тыс. кредитных договоров в квартал. Раньше: общая LLM с точностью 87% и затратами $5 тыс. Теперь: пайплайн — 96% точности, затраты $2,2 тыс. Экономия $11 тыс. в квартал плюс снижение риска. Кто в игре IBM предлагает готовые пайплайны. Open-source тоже: комбинация LayoutLMv3 + TAPAS + донастроенной Mistral доступна уже сегодня. Что делать финансовому директору · Аудит текущего процессинга — где вы используете одну модель для всего? · Тестировать пайплайны на счёт-фактурах или актах сверки. Окупаемость — 1–2 месяца. · Пересмотреть AI-бюджеты — высвободившиеся ресурсы под более сложные задачи. · Следить за регуляторикой ЕС — там обсуждают стандарты аудируемости AI-пайплайнов. Итог Synthetic Parsing Pipelines — новый стандарт надёжности и экономики для финансовых документов. Компании, застрявшие на «одной модели на всё», будут проигрывать в точности и cost per token. Конвейерная обработка становится must-have. Теги: #SyntheticParsingPipelines #документ_процессинг #IBM #финансовый_AI #cost_per_token #LLM #таблицы #контракты #регуляторика #AI_пайплайны --

Оставить комментарий

LuckyEntrepreneur_0099

ИИ-суверенитет: почему 93% топ-менеджеров превратили ИИ в вопрос нацбезопасности бизнеса Данные IBM, обнародованные в марте 2026 года, официально закрепили смену парадигмы: искусственный интеллект перестал быть merely технологической гонкой. Сегодня это битва за суверенитет. Согласно свежему отчету IBM IBV, 93% топ-менеджеров по всему миру называют AI sovereignty (способность управлять ИИ-системами без критической зависимости от внешних игроков) обязательным элементом корпоративной стратегии. Для финансового сектора и корпоративного сегмента это не просто громкий термин, а прямой сигнал к перераспределению бюджетов и пересмотру модели управления рисками. От «облачной» зависимости к технологической независимости Долгое время бизнес воспринимал ИИ как сервис, отдавая ключевые компетенции на откуп западным гиперскейлерам. Однако геополитическая турбулентность последних лет и ужесточение санкционных режимов сделали такую модель экзистенциально опасной. Суверенитет AI в современном прочтении — это триада: 1. Инфраструктурная автономия: возможность разворачивать и эксплуатировать вычислительные мощности внутри юрисдикции компании. 2. Data residency: контроль над данными, на которых обучаются и работают модели. Утечка или передача этих данных за пределы национального периметра приравнивается к утрате конкурентного преимущества. 3. Локальные LLM: использование моделей, адаптированных под локальную нормативную базу, языковую среду и бизнес-логику. Российский контекст: санкционная адаптация как драйвер Для российского бизнеса тема AI sovereignty резонирует с максимальной амплитудой. Если ещё два года назад вопрос «свой ИИ или импортный» был предметом дискуссии техдиректоров, то сегодня это вопрос физической непрерывности бизнеса. Санкционное давление 2025–2026 годов продемонстрировало: доступ к передовым ИИ-решениям может быть отключён в одностороннем порядке так же быстро, как и доступ к SWIFT. В этих условиях создание собственных LLM и построение «суверенных» ЦОДов переходит из раздела «технологическое развитие» в раздел «страхование рисков». Крупный бизнес в РФ уже перешёл от пилотных проектов с иностранными моделями к промышленному внедрению отечественных разработок. Финансовый аспект: цена вопроса Суверенитет — это дорого. Но, как отмечают аналитики, бездействие стало дороже. В 2026 году финансовые директора и казначеи пересчитывают совокупную стоимость владения ИИ-системами, закладывая в неё не только стоимость чипов и лицензий, но и премию за геополитический риск. С точки зрения стратегии: — Капитализация: инвесторы начинают дисконтировать акции компаний, чья ИИ-стратегия базируется на «арендованных» зарубежных мощностях. Риск отключения от API или блокировки расчетов за облачные сервисы снижает инвестиционную привлекательность. — Treasury и транзакции: внедрение стейблкоинов для оплаты вычислительных мощностей и создание «суверенных» пулов ликвидности становится неотъемлемой частью ИИ-независимости. Вывод Сигнал IBM IBV однозначен: AI sovereignty больше не «опция», а императив. Для российского бизнеса это означает необходимость ускоренного перехода на локальные LLM, строительство собственных вычислительных мощностей и интеграцию ИИ-стратегии в общую систему корпоративной безопасности. Финансовые директора, которые сегодня откладывают создание «суверенного» ИИ-контура, завтра столкнутся с ситуацией, когда бизнес-модель становится заложницей внешних юрисдикций. 2026 год — это время, когда технологическая независимость становится синонимом финансовой устойчивости. --- #AI #ИскусственныйИнтеллект #Суверенитет #IBM #Финтех #Санкции #LLM #DataResidency #КорпоративныеФинансы #Стратегия2026 #ТехнологическаяНезависимость#инвестиции

Оставить комментарий

395

Cashmeister

Революция Мультимодельного Понимания (LLM+CV)

В 2026 году граница между "видеть" и "понимать" стерлась. ИИ перешел от простого распознавания объектов (Object Detection) к глубокому семантическому анализу сцены в реальном времени.

Что это значит на практике:

Контекстуальный анализ: ИИ больше не просто видит "собаку у дороги". Он анализирует ее позу, направление взгляда и движение транспорта, предсказывая вероятность ее прыжка на проезжую часть.

Синтез данных: Мультимодальные модели (Vision-Language Models) мгновенно переводят визуальный поток в текстовое описание, позволяя системам безопасности принимать решения на основе смысла происходящего, а не просто набора пикселей.

Zero-Shot адаптация: Системы, обученные на миллиардах изображений и текстов, способны адекватно реагировать на новые, никогда ранее не встречавшиеся аварийные ситуации, используя накопленные "рассуждения" (reasoning).

Итог: Интеграция LLM и компьютерного зрения создала "цифровую интуицию", критически важную для L5-автономности и робототехники следующего поколения.

#AI2026 #MultimodalAI #ComputerVision #LLM #FutureTech #DeepLearning #Автономность

Оставить комментарий

821

Cashmeister

Open-source модели ИИ: кто бросает вызов OpenAI

Пока все смотрят на ChatGPT и Claude, индустрия открытых моделей делает гигантский скачок. Llama (Meta), Mistral (Франция), DeepSeek (Китай) и другие проекты догоняют закрытые аналоги с отставанием в месяцы, а не годы.

Что важно знать:

• DeepSeek V3 и R1 — китайская модель, которая по ряду бенчмарков обходит GPT-4o, при этом распространяется бесплатно и с открытым весом. Запуск вызвал панику на рынке акций США.

• Llama 4 — Meta готовит релиз, который, по слухам, станет мультимодальным и будет работать на одном GPU.

• Mistral Large — европейский ответ, фокус на эффективность и приватность данных.

• Экономика — открытые модели можно разворачивать на своих серверах, не платя за API и не отправляя данные третьим сторонам.

Главный тренд: закрытые модели лидируют в удобстве, открытые — в контроле и цене. Для бизнеса и разработчиков это означает выбор, которого не было два года назад.

#OpenSource #LLM #DeepSeek #Llama #Mistral

Оставить комментарий

445

LuckyEntrepreneur_0099

Prompt-инжиниринг умирает. И это хорошая новость для рынка. Ещё в 2023 году «промпт-инженер» был одной из самых горячих вакансий в tech. Компании платили $300k+ за умение правильно формулировать запросы. Сейчас эта специальность тихо исчезает — и это не баг, это фича эволюции AI-рынка. Что произошло: модели перешли от буквального понимания слов к пониманию намерения. GPT-4o, Claude, Gemini — все они теперь хорошо работают с неструктурированными запросами. Разрыв в качестве между «правильным» и «обычным» промптом сократился на порядок. Что это значит для рынка: барьер входа в AI упал до нуля. Ценность теперь создаёт не тот, кто умеет «говорить с AI», а тот, кто знает что делать с результатом. Это структурный сдвиг — от инструментального навыка к доменной экспертизе. Для инвесторов это сигнал: компании, которые строят ценность на «промпт-библиотеках» и «AI-шаблонах» — под давлением. Выигрывают те, кто встраивает AI в вертикальные ниши с глубоким доменным знанием. — Вакансий «prompt engineer» с пика 2023: −87% — Сокращение разрыва «плохой vs хороший» промпт: ×10 — Барьер входа в AI для пользователя сегодня: $0 Вывод: смерть промпт-инжиниринга — это взросление рынка. Следующие 2 года выиграют вертикальные AI-компании с глубокой доменной экспертизой: медицина, право, финансы, инженерия. Горизонтальные «AI-обёртки» без собственных данных — мультиплей сожмутся. Как вы оцениваете этот тренд? Видите ли в своих нишах, что качество промпта перестало иметь значение — или пока нет? #AIрынок #инвестиции #технологии #LLM #венчур

Оставить комментарий

666

SmartProfessional_3bd5

Проверяй факты перед покупкой

Слышали новость о продаже замка по цене однушки?!

Оставить комментарий

746

Olga-AI-Investment-analyst

13 минут на ответ или почему Unit-экономика ИИ начинается не с GPU

Пока рынок обсуждает миллиардные CAPEX в инфраструктуру Nvidia, я решила заглянуть «под капот». Чтобы как инвест-аналитик оценивать ИИ-проекты не по слайдам, а по реальности, я начала собирать собственных агентов.

Мой текущий стек в разработке: AI-аудитор для экспресс-анализа инвест-инициатив и AI Content Strategist.

Я развернула локальную RAG-систему на своем ноутбуке (используя квантованные модели, чтобы вписаться в лимиты домашнего железа). План был прост: загрузить проверенные годами документы и получить экспертные ответы.

Результат первой попытки: 3 из 10.

И это был мой лучший урок по экономике ИИ.

Выяснилось, что самая «умная» модель беспомощна, если архитектура данных сырая.

Вот мои выводы на стыке денег и кода:

1. Стоимость «мусора» на входе (Garbage In — Garbage Out)

Я загрузила качественные PDF, которыми пользовалась годами. Оказалось, что без правильного чанкинга (нарезки текста) и очистки «цифрового шума», модель буквально тонет в контексте.

Инвест-вывод: Неэффективная структура данных раздувает расходы на токены и увеличивает Latency (задержку). Плохой пре-процессинг — это прямой убыток в OPEX проекта.

2. Параметризация vs Слепая вера

Магия не в размере модели, а в настройке Retrieval (этапа поиска информации). Вместо дорогого дообучения (Fine-tuning) часто достаточно ювелирно настроить системный промпт и параметры семантического поиска.

Инвест-вывод: Гибкость архитектуры важнее, чем «самая мощная модель в вакууме». Это критично при оценке масштабируемости ИИ-стартапа.

3. Цифры против иллюзий

Первая попытка выдала ответ за 13 минут. После оптимизации данных (переход с PDF на структурированный .txt) время сократилось до 3,5 минут, а текст стал в разы «живее».

Инвест-вывод: Скорость генерации — это не просто удобство, это пропускная способность системы и её конечная стоимость для бизнеса.

Мой план оптимизации (Roadmap):

Data Engineering: Переход от сырых файлов к Markdown-чанкам с метаданными.

Prompt Engineering: Внедрение техник Chain-of-Thought (цепочка рассуждений) для сложных аудиторских задач.

Benchmarking: Внедрение метрик оценки (LLM-as-a-judge), чтобы оцифровать прогресс, а не оценивать его «на глаз».

Теперь, глядя на отчеты о разработке, я вижу не абстрактные «расходы на IT», а реальную борьбу за плотность данных и эффективность вычислений. Если мы хотим сделать AI-помощника быстрым и точным, инвест-бюджет начинает расти по экспоненте — и это нужно закладывать на старте.

Коллеги из IT: какой формат данных (Markdown, TXT, JSON) вы считаете золотым стандартом для минимизации шума в RAG?

Коллеги из финансов: учитываете ли вы Latency (время отклика) при расчете окупаемости ваших ИИ-инициатив?

#ИскусственныйИнтеллект #RAG #InvestTech #DataScience #LLM #ЭкономикаИИ #Инвестиции #Analytics

Оставить комментарий

601

Olga-AI-Investment-analyst

ИИ-проекты: когда «дешевые токены» обходятся слишком дорого

В последнее время, погружаясь в экономику ИИ-проектов (сейчас как раз плотно сижу в кейсах FinQA), поймала себя на интересном наблюдении.

Мы все привыкли следить за гонкой цен между OpenAI, Anthropic и Google. Токены дешевеют, модели умнеют — кажется, профит неизбежен. Но если заглянуть «под капот» реального внедрения, картинка перестает быть такой линейной.

О чем я думаю

Когда мы оцениваем юнит-экономику обычного сервиса, всё понятно. Но в ИИ мы часто попадаем в ловушку «цены за слово».

На деле же, чтобы ИИ выдал один вменяемый финансовый отчет, который не стыдно показать клиенту, происходит целая каскадная реакция:

- модель делает несколько заходов (agentic loops), уточняя собственные расчеты,

- система перелопачивает гигабайты контекста через RAG, чтобы просто найти одну верную цифру,

- а сверху ложится стоимость верификации (тот самый human-in-the-loop), потому что в финансах галлюцинация стоит дороже, чем вся годовая подписка на API.

К чему это ведет?

Цена за 1000 токенов может быть копеечной. Но «стоимость решенной задачи» (Cost per Task) при этом может неприятно удивлять.

Я вижу это на разметке данных: иногда короткий вопрос требует такой цепочки рассуждений и проверок, что экономика процесса начинает трещать по швам. И это при том, что модели официально «дешевеют» каждый квартал.

Мой вывод на сегодня

Победят не те стартапы, которые первыми внедрят самую мощную модель, а те, кто научится элегантно экономить на вычислительных циклах. Экономика ИИ сейчас — это не про доступ к технологиям (он есть у всех), а про архитектурную бережливость.

Кто-нибудь еще замерял реальную себестоимость одного «осмысленного» ответа в своих проектах? Сильно она разошлась с ожиданиями из прайс-листа?

#AI #Fintech #Investments #UnitEconomics #LLM #ИИ

<a href="https://ru.freepik.com/free-ai-image/ai-circuit-board_417567907.htm">Изображение от freepik</a>

Оставить комментарий

840