News Grower

Независимое покрытие AI, стартапов и технологий.

LLM под капотом. Модель выдумала телефон доверия — чиним архитектурой, не промптом

Девушка пересылает боту переписку с бойфрендом. Модель видит сигналы опасности (эмоциональное насилие, изоляция) и отвечает номером телефона доверия. Заботливо. Ответственно. Одна проблема: это детская горячая линия. Модель галлюцинировала контакт кризисной помощи. В промпте написано «НЕ придумывай контактные данные...

LLM под капотом. Модель выдумала телефон доверия — чиним архитектурой, не промптом

Девушка пересылает боту переписку с бойфрендом. Модель видит сигналы опасности (эмоциональное насилие, изоляция) и отвечает номером телефона доверия. Заботливо. Ответственно. Одна проблема: это детская горячая линия. Модель галлюцинировала контакт кризисной помощи. В промпте написано «НЕ придумывай контактные данные». Не помогает. Желание быть полезной в модели сильнее любой инструкции. Это не проблема промптинга. Это проблема архитектуры.

Краткая сводка

Модель, отвечая на сообщение о эмоциональном насилии, выдалa вымышленный номер детской горячей линии, игнорируя инструкцию «НЕ придумывай контактные данные», что свидетельствует о проблеме в её архитектуре, а не в промптинге.

Связанные теги

Компании и люди

Линия сюжета

Продолжить следить за темой

Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.

Технический долг — это не IT-проблема. Это управленческий кредит, который никто не собирался возвращать

Технический долг — это не IT-проблема. Это управленческий кредит, который никто не собирался возвращать

Всем привет! Меня зовут Илья Есейкин и я IT-управленец среднего звена, веду небольшой (пока) Telegram-канал о цифровой зрелости бизнеса. Это моя первая статья на Habr — пишу о т...

Большие языковые модели на практике – международный бестселлер теперь на русском языке

Большие языковые модели на практике – международный бестселлер теперь на русском языке

Книги про большие языковые модели сегодня выходят с той же скоростью, с какой сами эти модели генерируют текст. Зайдите в любой крупный книжный магазин — не важно, в оффлайновый...

Цифровой двойник, SDD и Agentic RAG: эволюция корпоративной архитектуры банка изнутри

Цифровой двойник, SDD и Agentic RAG: эволюция корпоративной архитектуры банка изнутри

Хочу рассказать, почему растущие бизнес-требования к Time-to-Market, персонализации, 0 FTE in RUN заставили нас пойти на радикальный шаг — разработку собственной платформы управ...

ИИ для создания контента: полный разбор инструментов 2026

ИИ для создания контента: полный разбор инструментов 2026

Создание контента раньше делилось на два лагеря: либо долго и качественно, либо быстро и посредственно. ИИ эту дихотомию сломал. Сегодня нейросети закрывают весь цикл производст...

Промпты которые реально работают: полный разбор с примерами 2026

Промпты которые реально работают: полный разбор с примерами 2026

Большинство пользователей нейросетей получают посредственный результат не потому что модель плохая, а потому что запрос сформулирован размыто. «Напиши про маркетинг», «помоги с ...

Рекламный слот

Встроенный блок в статье

Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.

Партнерский слот

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

Технический долг — это не IT-проблема. Это управленческий кредит, который никто не собирался возвращать

Технический долг — это не IT-проблема. Это управленческий кредит, который никто не собирался возвращать

Всем привет! Меня зовут Илья Есейкин и я IT-управленец среднего звена, веду небольшой (пока) Telegram-канал о цифровой зрелости бизнеса. Это моя первая статья на Habr — пишу о т...

Большие языковые модели на практике – международный бестселлер теперь на русском языке

Большие языковые модели на практике – международный бестселлер теперь на русском языке

Книги про большие языковые модели сегодня выходят с той же скоростью, с какой сами эти модели генерируют текст. Зайдите в любой крупный книжный магазин — не важно, в оффлайновый...

Цифровой двойник, SDD и Agentic RAG: эволюция корпоративной архитектуры банка изнутри

Цифровой двойник, SDD и Agentic RAG: эволюция корпоративной архитектуры банка изнутри

Хочу рассказать, почему растущие бизнес-требования к Time-to-Market, персонализации, 0 FTE in RUN заставили нас пойти на радикальный шаг — разработку собственной платформы управ...

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
Технический долг — это не IT-проблема. Это управленческий кредит, который никто не собирался возвращать

Технический долг — это не IT-проблема. Это управленческий кредит, который никто не собирался возвращать

Всем привет! Меня зовут Илья Есейкин и я IT-управленец среднего звена, веду небольшой (пока) Telegram-канал о цифровой зрелости бизнеса. Это моя первая статья на Habr — пишу о т...

Большие языковые модели на практике – международный бестселлер теперь на русском языке

Большие языковые модели на практике – международный бестселлер теперь на русском языке

Книги про большие языковые модели сегодня выходят с той же скоростью, с какой сами эти модели генерируют текст. Зайдите в любой крупный книжный магазин — не важно, в оффлайновый...

Цифровой двойник, SDD и Agentic RAG: эволюция корпоративной архитектуры банка изнутри

Цифровой двойник, SDD и Agentic RAG: эволюция корпоративной архитектуры банка изнутри

Хочу рассказать, почему растущие бизнес-требования к Time-to-Market, персонализации, 0 FTE in RUN заставили нас пойти на радикальный шаг — разработку собственной платформы управ...