От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования
Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура,...
Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.
Связанные теги
Компании и люди
Линия сюжета
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
Эксперимент «Резиновая рука»
В 1998 году два исследователя факультета психиатрии Питтсбургского университета и факультета психологии Университета Карнеги-Меллон – Мэтью Ботвинник и Джонатан Коэн провели экс...
5 ошибок при разработке продукта с LLM под капотом – разбор реальных болей живого проекта
Привет, Хабр!Примерно год назад наша команда загорелась идеей создать продукт, который позволил бы «поговорить с кодом». Мы, как и многие, находились под впечатлением от возможн...
strace: отладка Linux-приложений через системные вызовы
Когда процесс зависает, молчит в логах и при этом продолжает жить своей странной жизнью, обычные инструменты наблюдения быстро упираются в потолок. В таких ситуациях strace поле...
От чатов к процессам: как бот склеивает TG и MAX и помогает жить по ITIL 4
Привет, я Максим Королев из Петрович-Теха. В прошлой статье про «Дежурного» я рассказывал, как мы ушли от «толстых» обработчиков aiogram к архитектуре CORE + два адаптера — Tele...
Большой законопроект об ИИ в России: первые границы для нейросети?
Звонить в банк, интернет-провайдеру или в службу доставки бывает утомительно: бесконечно вежливый ИИ-ассистент, не понимая контекста, без усталости гоняет ответы по скриптам. В ...
Почему человеческие младенцы стали такими зависимыми в процессе эволюции?
Обычно под словом «эволюция» подразумевается развитие или приобретение прикольных и полезных качеств. И если мы, люди, столь развиты и продвинуты, то почему наши новорожденные д...
Рекламный слот
Article monetization slot
Reserved for contextual monetization inside article pages.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
Эксперимент «Резиновая рука»
В 1998 году два исследователя факультета психиатрии Питтсбургского университета и факультета психологии Университета Карнеги-Меллон – Мэтью Ботвинник и Джонатан Коэн провели экс...
5 ошибок при разработке продукта с LLM под капотом – разбор реальных болей живого проекта
Привет, Хабр!Примерно год назад наша команда загорелась идеей создать продукт, который позволил бы «поговорить с кодом». Мы, как и многие, находились под впечатлением от возможн...
strace: отладка Linux-приложений через системные вызовы
Когда процесс зависает, молчит в логах и при этом продолжает жить своей странной жизнью, обычные инструменты наблюдения быстро упираются в потолок. В таких ситуациях strace поле...
От чатов к процессам: как бот склеивает TG и MAX и помогает жить по ITIL 4
Привет, я Максим Королев из Петрович-Теха. В прошлой статье про «Дежурного» я рассказывал, как мы ушли от «толстых» обработчиков aiogram к архитектуре CORE + два адаптера — Tele...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
Эксперимент «Резиновая рука»
В 1998 году два исследователя факультета психиатрии Питтсбургского университета и факультета психологии Университета Карнеги-Меллон – Мэтью Ботвинник и Джонатан Коэн провели экс...
5 ошибок при разработке продукта с LLM под капотом – разбор реальных болей живого проекта
Привет, Хабр!Примерно год назад наша команда загорелась идеей создать продукт, который позволил бы «поговорить с кодом». Мы, как и многие, находились под впечатлением от возможн...
strace: отладка Linux-приложений через системные вызовы
Когда процесс зависает, молчит в логах и при этом продолжает жить своей странной жизнью, обычные инструменты наблюдения быстро упираются в потолок. В таких ситуациях strace поле...
От чатов к процессам: как бот склеивает TG и MAX и помогает жить по ITIL 4
Привет, я Максим Королев из Петрович-Теха. В прошлой статье про «Дежурного» я рассказывал, как мы ушли от «толстых» обработчиков aiogram к архитектуре CORE + два адаптера — Tele...