От линейного текста к семантическому графу: строим knowledge‑extraction‑пайплайн для учёбы
Меня зовут Аскольд Романов, я руковожу продуктовой командой в Яндекс Образовании. Сегодня я хочу поделиться историей своего проекта K2-18. Это опенсорс‑инструмент, который трансформирует учебный текст в семантический граф знаний с образовательными метриками. Я назвал его в честь экзопланеты, в&nb...
Меня зовут Аскольд Романов, я руковожу продуктовой командой в Яндекс Образовании. Сегодня я хочу поделиться историей своего проекта K2-18. Это опенсорс‑инструмент, который трансформирует учебный текст в семантический граф знаний с образовательными метриками. Я назвал его в честь экзопланеты, в атмосфере которой (предположительно) нашли водяной пар: тоже история про извлечение скрытой структуры из наблюдаемых данных. В этой статье — как устроен инструмент, какие решения за ним стоят и что с этим графом можно делать.Моя основная задача в Образовании — внедрение AI‑технологий в образовательные процессы, и K2-18 вырос из этой работы напрямую. Мне нужно было решить конкретную задачу: как превратить учебный контент в структуру, с которой LLM сможет эффективно работать для построения различных образовательных сценариев.Идея родилась не на пустом месте. Я закончил ВМиК МГУ и аспирантуру там же с научным фокусом на компьютерной лингвистике. Сейчас, когда LLM научились читать текст, понимать его структуру и контекст, оказалось, что знания, опыт и контекст текущей работы позволяют решить эту задачу системно. Конечно, семантические графы — это не новая идея. Но мне всегда хотелось сделать знания в учебных курсах действительно структурированными, а не скрытыми за линейными страницами учебника — так, чтобы и студенту, и преподавателю было легко ориентироваться и развиваться в своем темпе. По сути, это и есть один из продуктивных сценариев применения ИИ в образовании: помогать лучше структурировать знания и выстраивать более персонализированное обучение.
Связанные теги
Компании и люди
Линия сюжета
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
Фишинг 2025–2026: от социальной инженерии к промышленным конвейерам PhaaS
Современный ландшафт киберугроз демонстрирует окончательную трансформацию фишинга из набора разрозненных мошеннических писем в зрелую сервисную индустрию, функционирующую по кан...
Почему начальство, да и компании в целом не признают провалы и когда выгоднее сказать “как есть”
Кажется, что в публичное информационное поле от некоторых компаний просачивается только абсурд. Проект провалился, это очевидно всем участникам, но никто из руководства не произ...
«Потребительская корзина»: игра на табло покупателя
Однажды на онлайн-барахолке мне на глаза попался так называемый «дисплей покупателя» — алфавитно-цифровое табло, которое стоит на кассе и показывает текущий товар в чеке и сумму...
Я посадил AI-агента на свой VPS и перестал открывать SSH
Я посадил AI-агента на свой VPS и перестал открывать SSH. На сервере крутится дюжина Docker-контейнеров — клиентские проекты, SaaS, мониторинг, базы. Раньше любая мелочь требова...
CI/CD перестал быть преимуществом и стал условием роста дохода в ИТ
Три года назад CI/CD можно было считать дополнительным плюсом в резюме. Сегодня это уже не «приятный бонус», а один из признаков того, что специалист работает в зрелой инженерно...
Три разработки студентов ИМШ, которые могут изменить ИТ-индустрию
Привет, Хабр. Сегодня делимся кейсами студентов Инженерно-математической школы (или просто ИМШ) — совместного образовательного проекта VK и НИУ ВШЭ в сфере машинного обучения, р...
Рекламный слот
Встроенный блок в статье
Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
Фишинг 2025–2026: от социальной инженерии к промышленным конвейерам PhaaS
Современный ландшафт киберугроз демонстрирует окончательную трансформацию фишинга из набора разрозненных мошеннических писем в зрелую сервисную индустрию, функционирующую по кан...
Почему начальство, да и компании в целом не признают провалы и когда выгоднее сказать “как есть”
Кажется, что в публичное информационное поле от некоторых компаний просачивается только абсурд. Проект провалился, это очевидно всем участникам, но никто из руководства не произ...
«Потребительская корзина»: игра на табло покупателя
Однажды на онлайн-барахолке мне на глаза попался так называемый «дисплей покупателя» — алфавитно-цифровое табло, которое стоит на кассе и показывает текущий товар в чеке и сумму...
Я посадил AI-агента на свой VPS и перестал открывать SSH
Я посадил AI-агента на свой VPS и перестал открывать SSH. На сервере крутится дюжина Docker-контейнеров — клиентские проекты, SaaS, мониторинг, базы. Раньше любая мелочь требова...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
Фишинг 2025–2026: от социальной инженерии к промышленным конвейерам PhaaS
Современный ландшафт киберугроз демонстрирует окончательную трансформацию фишинга из набора разрозненных мошеннических писем в зрелую сервисную индустрию, функционирующую по кан...
Почему начальство, да и компании в целом не признают провалы и когда выгоднее сказать “как есть”
Кажется, что в публичное информационное поле от некоторых компаний просачивается только абсурд. Проект провалился, это очевидно всем участникам, но никто из руководства не произ...
Книга: «Архитектура медальона. Проектирование с помощью Delta Lake и Spark»
Привет, Хаброжители! Книга предлагает практическое руководство по внедрению архитектуры медальона (bronze, silver, gold уровни) для эффективной работы с большими данными, чтобы ...
«Потребительская корзина»: игра на табло покупателя
Однажды на онлайн-барахолке мне на глаза попался так называемый «дисплей покупателя» — алфавитно-цифровое табло, которое стоит на кассе и показывает текущий товар в чеке и сумму...