Habr 29.03.2026 07:30 Инструменты разработки Стабильно Тёпло

Как мы хакнули ИИ-бенчмарк PAC1 без нейросетей

Погода сигнала

Стабильно

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Недавно я участвовал в корпоративном хакатоне по обходу ИИ-песочниц. Задача: пройти закрытый бенчмарк PAC1, где ИИ-агенту нужно работать с виртуальной файловой системой (чтение логов, поиск файлов, отправка писем) и обходить ловушки безопасности (Indirect Prompt Injections).Но реальность оказалась суровой: хваленые reasoning-модели постоянно галлюцинировали, ломали структуру JSON на выходе (выдавая свои "мысли" вместо чистого ответа) и просто сжигали бюджет на API, зацикливаясь на одной ошибке. Потратив часть бюджета впустую, я решил: если ИИ не справляется, мы заменим его на старый добрый хардкод. Так родился концепт Zero-Cost Agent — алгоритмического лома, который симулирует поведение нейросети.

Читать полностью в источнике

Оставайтесь в сигнале

Следить за темой «Как мы хакнули ИИ-бенчмарк PAC1 без нейросетей»

Следите не только за этой публикацией, но и за её продолжением: новыми материалами, соседними источниками и развитием сюжета.

Карта темы

Понять тему за минуту

Быстрый вход в историю: почему она важна сейчас, кто в ней участвует и куда идти дальше за контекстом.

Почему это важно сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

У истории уже есть 6 связанных материала, поэтому отсюда легко перейти к продолжению темы.

Сюжет постоянно вращается вокруг Habr, Indirect, and Indirect Prompt, поэтому страницы сущностей дадут самый быстрый контекст.

Habr уже выпустил ещё 4 продолжения по этой теме.

Карта темы

Открыть живую карту этой истории

Посмотрите, какие сущности, линии сюжета, источники и follow-up материалы формируют эту историю прямо сейчас.

Нажимайте на узлы

Сущность Линия сюжета Материал Хаб Источник

Страницы сущностей

Habr Indirect Indirect Prompt Indirect Prompt Injections Injections PAC1

Линии сюжета

Habr

Последние материалы и связанные ссылки по теме Habr.

Habr

Последние материалы и связанный контекст по теме Habr.

Indirect

Последние материалы и связанный контекст по теме Indirect.

Prompt

Последние материалы и связанный контекст по теме Prompt.

Story timeline

Продолжить следить за темой

Короткая линия событий и follow-up материалов, чтобы быстро понять ход темы.

23.06.2026 09:21 3DNews Software

В России перестали работать трансляции на Twitch, а также Discord и PUBG: Battlegrounds

От россиян 23 июня 2026 года стали поступать массовые жалобы на невозможность подключаться к эфирам на платформе Twitch. Без специальных ...

25.05.2026 11:00 CNews Internet

Россиян начнут приучать к ИИ со школьной скамьи: углубленное преподавание стартует с нового учебного года

В школьную программу с сентября 2026 г. будет добавлен углубленный уровень изучения информатики по профилю «Искусственный интеллект». Пре...

16.04.2026 10:57 Habr

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Создание безупречного визуала в Nano Banana — это не вопрос везения, а результат правильной коммуникации с нейросетью. В отличие от прост...

16.04.2026 10:43 Habr

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Если вы когда-нибудь пытались поднять прокси для Telegram на сервере, то знаете, что такое «мессенджер не грузит». В этой инструкции я пр...

16.04.2026 10:36 Habr

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Знаете, можно много долго спорить о том, что вот там умеют делать, а наши ничего не умеют. Но подход Яндекса к формированию поисковой выд...

29.03.2026 07:30 Habr

Как мы хакнули ИИ-бенчмарк PAC1 без нейросетей

Недавно я участвовал в корпоративном хакатоне по обходу ИИ-песочниц. Задача: пройти закрытый бенчмарк PAC1, где ИИ-агенту нужно работать ...

Насколько можно опираться

Сигнал и надёжность Habr

Источник работает в быстрый ритме: 0% последних материалов попадают в горячее окно, а 0% дают выраженный поисковый сигнал.

Рискованный

Надёжность

Свежесть

Источников в сюжете

В России перестали работать трансляции на Twitch, а также Discord и PUBG: Battlegrounds

От россиян 23 июня 2026 года стали поступать массовые жалобы на невозможность подключаться к эфирам на платформе Twitch. Без специальных средств перестали открываться также Disc...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

2026 Battlegrounds Discord Habr

Читать статью Следить за историей

3dnews.ru

OpenAI добавила ChatGPT режим блокировки для защиты от промпт-инъекций

3DNews Software 07.06.2026 08:08 Большой тех

Стабильно Тёпло

OpenAI добавила ChatGPT режим блокировки для защиты от промпт-инъекций

Компания OpenAI представила новую функцию ИИ-чат-бота ChatGPT — режим блокировки (Lockdown Mode), который обеспечит дополнительную защиту от атак с использованием промпт-инъекци...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

ChatGPT Injection Lockdown Lockdown Mode

Читать статью Следить за историей

3dnews.ru

CNews Business 25.05.2026 11:00 Корпоративный IT

Стабильно Тёпло

Россиян начнут приучать к ИИ со школьной скамьи: углубленное преподавание стартует с нового учебного года

В школьную программу с сентября 2026 г. будет добавлен углубленный уровень изучения информатики по профилю «Искусственный интеллект». Представители отрасли считают, что детей ну...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

2026 CNews Business Engineering Prompt

Читать статью Следить за историей

biz.cnews.ru

CNews Internet 25.05.2026 11:00 Большой тех

Стабильно Тёпло

Россиян начнут приучать к ИИ со школьной скамьи: углубленное преподавание стартует с нового учебного года

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

2026 CNews Internet Engineering Prompt

Читать статью Следить за историей

internet.cnews.ru

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Habr 16.04.2026 10:57 Инструменты разработки

Стабильно Тёпло

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Создание безупречного визуала в Nano Banana — это не вопрос везения, а результат правильной коммуникации с нейросетью. В отличие от простых моделей прошлого, этот инструмент спо...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Banana Habr Nano Nano Banana

Читать статью Следить за историей

habr.com

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Habr 16.04.2026 10:43 Инструменты разработки

Стабильно Тёпло

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Если вы когда-нибудь пытались поднять прокси для Telegram на сервере, то знаете, что такое «мессенджер не грузит». В этой инструкции я предлагаю рассмотреть подробную, пошаговую...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Habr MTProto Node MTProto Panel MTProto-прокси

Читать статью Следить за историей

habr.com

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Habr 16.04.2026 10:36 Инструменты разработки

Стабильно Тёпло

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Знаете, можно много долго спорить о том, что вот там умеют делать, а наши ничего не умеют. Но подход Яндекса к формированию поисковой выдачи мне всегда импонировал больше, нежел...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Habr

Читать статью Следить за историей

habr.com

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Habr 16.04.2026 10:35 Инструменты разработки

Стабильно Тёпло

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Вторая статья цикла о криптографии, в котором мы рассказываем, как человечество училось прятать и расшифровывать секреты — от древних методов до современных алгоритмов. Сегодня ...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Habr

Читать статью Следить за историей

habr.com

Как мы хакнули ИИ-бенчмарк PAC1 без нейросетей

Следить за темой «Как мы хакнули ИИ-бенчмарк PAC1 без нейросетей»

Понять тему за минуту

Почему это важно сейчас

Открыть живую карту этой истории

Страницы сущностей

Линии сюжета

Продолжить следить за темой

Сигнал и надёжность Habr

Похожие статьи

Еще материалы от Habr