Нестандартные применения LLM и синтетических данных: от антивируса для завода до сжатия данных языковыми моделями
Привет, Хабр! Меня зовут Вадим Кондаратцев, я руковожу ИИ-направлением в Friflex и небольшой ИИ-лабораторией в МГТУ им. Баумана. Последние 10 лет работаю на стыке ML, HPC и Edge Computing, преподаю машинное обучение и примерно раз в день запускаю что-нибудь на суперкомпьютере.Это расширенная версия моего доклада на ...
Привет, Хабр! Меня зовут Вадим Кондаратцев, я руковожу ИИ-направлением в Friflex и небольшой ИИ-лабораторией в МГТУ им. Баумана. Последние 10 лет работаю на стыке ML, HPC и Edge Computing, преподаю машинное обучение и примерно раз в день запускаю что-нибудь на суперкомпьютере.Это расширенная версия моего доклада на CrossConf 2025 про мой опыт применения синтетических данных в проектах, которые связаны с интеграцией систем машинного обучения в промышленности и науке. Если интересно посмотреть, какая бывает синтетика и что она позволяет покрыть, прошу под кат.
Связанные теги
Компании и люди
Линия сюжета
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
Пользователь у руля: кооперативы, общины и профсоюзы — какими бывают социально ориентированные подходы к хранению данных
С конца нулевых в ИТ-кругах ведутся разговоры о социально ориентированных облачных хранилищах, призванных усилить контроль пользователей над своими данными. Мы в Beeline Cloud р...
[Перевод] Что происходит с подписочной моделью в приложениях: уроки, тренды и ориентиры на 2026 год
Перевод статьи Лорелея Уитмен, RevenueCat Ключевые выводы из крупнейшего в мире набора данных о подписочных приложенияхКраткое содержаниеРынок подписочных приложений быстро меня...
CSV в Spark: Искусство правильной загрузки данных
В этой статье мы разберём, как правильно загружать CSV в Apache Spark — распределённую вычислительную систему, ставшую стандартом для обработки больших данных. Это первый и самы...
Автоматизация создания тестов: связка NotebookLM + Gemini + Google Apps Script
Предположим, что вам нужно делать тесты для учащихся или студентов (или даже для себя). Предположим, что их нужно делать много. Действительно много. Можно использовать традицион...
Крис оказался гораздо ближе чем казалось: интересные детали и пасхалки Resident Evil: Requiem [SPOILERS ALERT]
!WARNING! Статья заражена спойлерами ко всей франшизе Resident Evil сильнее, чем Раккун-Сити Т-вирусом. Будем разбирать детали и возможные твисты без жалости, держу в курсе.Пока...
CodeClone 2.0.0b1: когда детектора клонов уже мало
В прошлой статье я показывал CodeClone как инструмент для поиска структурного дублирования в Python-коде. Не только буквальной копипасты, но и повторяющихся функций, похожих бло...
Рекламный слот
Article monetization slot
Reserved for contextual monetization inside article pages.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
Пользователь у руля: кооперативы, общины и профсоюзы — какими бывают социально ориентированные подходы к хранению данных
С конца нулевых в ИТ-кругах ведутся разговоры о социально ориентированных облачных хранилищах, призванных усилить контроль пользователей над своими данными. Мы в Beeline Cloud р...
[Перевод] Что происходит с подписочной моделью в приложениях: уроки, тренды и ориентиры на 2026 год
Перевод статьи Лорелея Уитмен, RevenueCat Ключевые выводы из крупнейшего в мире набора данных о подписочных приложенияхКраткое содержаниеРынок подписочных приложений быстро меня...
CSV в Spark: Искусство правильной загрузки данных
В этой статье мы разберём, как правильно загружать CSV в Apache Spark — распределённую вычислительную систему, ставшую стандартом для обработки больших данных. Это первый и самы...
Автоматизация создания тестов: связка NotebookLM + Gemini + Google Apps Script
Предположим, что вам нужно делать тесты для учащихся или студентов (или даже для себя). Предположим, что их нужно делать много. Действительно много. Можно использовать традицион...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
Пользователь у руля: кооперативы, общины и профсоюзы — какими бывают социально ориентированные подходы к хранению данных
С конца нулевых в ИТ-кругах ведутся разговоры о социально ориентированных облачных хранилищах, призванных усилить контроль пользователей над своими данными. Мы в Beeline Cloud р...
[Перевод] Что происходит с подписочной моделью в приложениях: уроки, тренды и ориентиры на 2026 год
Перевод статьи Лорелея Уитмен, RevenueCat Ключевые выводы из крупнейшего в мире набора данных о подписочных приложенияхКраткое содержаниеРынок подписочных приложений быстро меня...
CSV в Spark: Искусство правильной загрузки данных
В этой статье мы разберём, как правильно загружать CSV в Apache Spark — распределённую вычислительную систему, ставшую стандартом для обработки больших данных. Это первый и самы...
Автоматизация создания тестов: связка NotebookLM + Gemini + Google Apps Script
Предположим, что вам нужно делать тесты для учащихся или студентов (или даже для себя). Предположим, что их нужно делать много. Действительно много. Можно использовать традицион...