News Grower

Независимое покрытие AI, стартапов и технологий.

Как меняются метрики контроля при переходе от чат‑ботов к агентным системам

Когда LLM перестаёт быть просто чат-интерфейсом и начинает сама планировать шаги, вызывать инструменты и общаться с другими агентами, ломаются и привычные способы контроля. В статье — о том, почему для агентных систем уже недостаточно мерить качество ответа, какие новые метрики нужны для оценки их работы и как меняю...

Автор: SiYa_renko (OTUS) Оригинальный источник
Как меняются метрики контроля при переходе от чат‑ботов к агентным системам

Когда LLM перестаёт быть просто чат-интерфейсом и начинает сама планировать шаги, вызывать инструменты и общаться с другими агентами, ломаются и привычные способы контроля. В статье — о том, почему для агентных систем уже недостаточно мерить качество ответа, какие новые метрики нужны для оценки их работы и как меняются требования к безопасности, трассировке и эксплуатации таких архитектур.

Связанные теги

Компании и люди

Линия сюжета

Продолжить следить за темой

Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.

Вторая версия моего DIY-гаджета: Игра на реакцию для двух игроков на ATmega32

Вторая версия моего DIY-гаджета: Игра на реакцию для двух игроков на ATmega32

Собрал вторую версию DIY брелока "Игра на реакцию"Пару месяцев назад на канале выходила статья про первую версию. Это был мини-брелок для двух игроков на базе ATmega328P. Если п...

Найм — это не про выбор лучшего кандидата (и никогда им не был)

Найм — это не про выбор лучшего кандидата (и никогда им не был)

Если вы думаете, что на собеседовании выбирают «лучшего кандидата», — скорее всего, вы неправильно понимаете, как устроен процесс найма. И это нормально. Потому что снаружи всё ...

Тихая сторона крипторынка: что на самом деле стоит за «магией» торговых ботов

Тихая сторона крипторынка: что на самом деле стоит за «магией» торговых ботов

На дворе 2026 год. В мире неспокойно. Военные конфликты, санкционные войны, передел рынков, борьба за ресурсы. Кажется, что мировая финансовая система уже давно живёт в режиме п...

«Telegram обошёл блокировку РКН» — нет, не Telegram

«Telegram обошёл блокировку РКН» — нет, не Telegram

Пока СМИ писали про победу команды Дурова над РКН, анонимные разработчики из опенсорс-комьюнити уже две недели сидели в чатах, реверсили DPI и писали патч, который и использовал...

Как может выглядеть новое поколение сетей связи 6G, «накачанное» нейросетями

Как может выглядеть новое поколение сетей связи 6G, «накачанное» нейросетями

Реализация стандарта 6G находится на ранних этапах — Международный союз электросвязи, консорциум 3GPP и коммерческие компании все еще занимаются разработкой спецификации. Но рег...

Рекламный слот

Встроенный блок в статье

Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.

Партнерский слот

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

Вторая версия моего DIY-гаджета: Игра на реакцию для двух игроков на ATmega32

Вторая версия моего DIY-гаджета: Игра на реакцию для двух игроков на ATmega32

Собрал вторую версию DIY брелока "Игра на реакцию"Пару месяцев назад на канале выходила статья про первую версию. Это был мини-брелок для двух игроков на базе ATmega328P. Если п...

Найм — это не про выбор лучшего кандидата (и никогда им не был)

Найм — это не про выбор лучшего кандидата (и никогда им не был)

Если вы думаете, что на собеседовании выбирают «лучшего кандидата», — скорее всего, вы неправильно понимаете, как устроен процесс найма. И это нормально. Потому что снаружи всё ...

Тихая сторона крипторынка: что на самом деле стоит за «магией» торговых ботов

Тихая сторона крипторынка: что на самом деле стоит за «магией» торговых ботов

На дворе 2026 год. В мире неспокойно. Военные конфликты, санкционные войны, передел рынков, борьба за ресурсы. Кажется, что мировая финансовая система уже давно живёт в режиме п...

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
Вторая версия моего DIY-гаджета: Игра на реакцию для двух игроков на ATmega32

Вторая версия моего DIY-гаджета: Игра на реакцию для двух игроков на ATmega32

Собрал вторую версию DIY брелока "Игра на реакцию"Пару месяцев назад на канале выходила статья про первую версию. Это был мини-брелок для двух игроков на базе ATmega328P. Если п...

Найм — это не про выбор лучшего кандидата (и никогда им не был)

Найм — это не про выбор лучшего кандидата (и никогда им не был)

Если вы думаете, что на собеседовании выбирают «лучшего кандидата», — скорее всего, вы неправильно понимаете, как устроен процесс найма. И это нормально. Потому что снаружи всё ...

Тихая сторона крипторынка: что на самом деле стоит за «магией» торговых ботов

Тихая сторона крипторынка: что на самом деле стоит за «магией» торговых ботов

На дворе 2026 год. В мире неспокойно. Военные конфликты, санкционные войны, передел рынков, борьба за ресурсы. Кажется, что мировая финансовая система уже давно живёт в режиме п...