Влияние очистки от персональных данных на работу LLM-агентов
Когда персональные данные пользователей попадают в LLM-агента, возникает выбор: либо передавать их как есть, либо предварительно анонимизировать. Второй вариант очевидно безопаснее, но появляется вопрос — насколько агент деградирует, если вместо "Иванов Иван" он видит "PERSON_1" или "XXXXXXXX"?Мы проверили это на бы...
Когда персональные данные пользователей попадают в LLM-агента, возникает выбор: либо передавать их как есть, либо предварительно анонимизировать. Второй вариант очевидно безопаснее, но появляется вопрос — насколько агент деградирует, если вместо "Иванов Иван" он видит "PERSON_1" или "XXXXXXXX"?Мы проверили это на быстро поднятом минималистичном банковском агенте с помощью Hivetrace Dataclean. Отправили в него по 102 синтетических запроса в трёх вариациях входных данных (чистые, маска, псевдонимы), оценка через DeepEval LLM-as-a-judge. Результаты — ниже. Читать далее
Связанные теги
Сущности
Связанные кластеры
Рекламный слот
Article monetization slot
Reserved for contextual monetization inside article pages.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
И снова ИИ, как я из предпринимателя стал «мечтателем»
Я не разработчик и не из IT. У меня автосервис и несколько офлайн-бизнесов. В 2022 году я спросил у AI, чем он может мне помочь. Через несколько часов у меня появилась первая CR...
Почему вайбкодинг не убьёт нормальную разработку (взгляд маркетолога)
«AI отнимет мою работу» – эту фразу я слышу на каждой второй встрече с командами разработки. Тревога понятна: нейросеть за минуту генерирует код, на который раньше уходил день. ...
Установка Claude AI (Клод ИИ) Code на зарубежный VPS для обхода санкций и как купить подписку в России
В статье пошагово показано, как завести аккаунт Claude Code в обход санкций, с европейского IP-адреса, на европейский телефон, с оплатой виртуальной карточкой.Конкретно вы нашем...
Когда CUPED не хватает: где помогает VWE
Когда A/B-тест не показывает эффект, это не всегда значит, что эффекта нет. Иногда он просто теряется в шуме метрики.В таких случаях обычно делают одно из трёх: увеличивают траф...