LoRA не помогла: как мы дообучали Mistral 7B на русском и что в итоге сработало
Каждый раз после созвона происходит одно и то же самое: кто-то открывает чат и пишет «итак, что мы решили?». Дальше — пятнадцать минут на то, чтобы восстановить то, что только что обсуждали час.Я ML-инженер, и эта боль мне была знакома лично. Когда появилась идея автоматизировать протоколирование встреч, казалось, ч...
Каждый раз после созвона происходит одно и то же самое: кто-то открывает чат и пишет «итак, что мы решили?». Дальше — пятнадцать минут на то, чтобы восстановить то, что только что обсуждали час.Я ML-инженер, и эта боль мне была знакома лично. Когда появилась идея автоматизировать протоколирование встреч, казалось, что задача решаемая: берешь Whisper для распознавания речи, хорошую LLM для суммаризации — и готово.Реальность оказалась другой. Готовых русскоязычных решений нужного качества не было. Mistral 7B — одна из лучших открытых моделей на тот момент — на русском ошибался в склонениях, плохо следовал русскоязычным промптам и терял смысл в длинных диалогах. Стало понятно: придётся дообучать самим.
Связанные теги
Компании и люди
Линия сюжета
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
Анатомия памяти в .NET: Типы данных, способы хранения, выделение памяти и работа GC
В этой статье мы заглянем под капот CLR (Common Language Runtime) и разберём как хранятся разные типы данных. Также поговорим о том, что такое стек и куча, и как они взаимодейст...
Рынок IT-аутстаффинга в РФ деградирует. И это уже сложно игнорировать
Я все чаще ловлю себя на мысли, что рынок IT-аутстаффинга в России заметно деградировал. Причем это не абстрактное ощущение из серии «раньше было лучше», а вполне конкретные наб...
Гонка вооружений. Почему античиты всегда проигрывают?
ДИСКЛЕЙМЕР:Автор не призывает к игре с сторонним ПО. Вся информация, приведенная в статье - приведена лишь в образовательных и ознакомительных целях. Информация была взята из от...
[Перевод] Terrafab, Starship, IPO: три обещания Маска, которые вызывают вопросы
Изначально идея орбитального дата-центра от Маска казалась амбициозной, но технически сомнительной. Теперь, когда появились подробности о том, как он планирует реализовать этот ...
«Кино для Руководителей» «Мне бы в небо»
"Кино для Руководителей" сегодня понедельник, а значит будем его сглаживать хорошим кино, которое ещё и для пользы дела. Фильм "Мне бы в небо" с Джорджем Клуни зацепил меня снач...
Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё
Представьте: вам дают 10 терабайт текста и говорят — запихни это в файл на 70 гигабайт. Так, чтобы потом по любому вопросу можно было восстановить нужный кусок. Не точно, но бли...
Рекламный слот
Встроенный блок в статье
Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
Анатомия памяти в .NET: Типы данных, способы хранения, выделение памяти и работа GC
В этой статье мы заглянем под капот CLR (Common Language Runtime) и разберём как хранятся разные типы данных. Также поговорим о том, что такое стек и куча, и как они взаимодейст...
Рынок IT-аутстаффинга в РФ деградирует. И это уже сложно игнорировать
Я все чаще ловлю себя на мысли, что рынок IT-аутстаффинга в России заметно деградировал. Причем это не абстрактное ощущение из серии «раньше было лучше», а вполне конкретные наб...
Гонка вооружений. Почему античиты всегда проигрывают?
ДИСКЛЕЙМЕР:Автор не призывает к игре с сторонним ПО. Вся информация, приведенная в статье - приведена лишь в образовательных и ознакомительных целях. Информация была взята из от...
[Перевод] Terrafab, Starship, IPO: три обещания Маска, которые вызывают вопросы
Изначально идея орбитального дата-центра от Маска казалась амбициозной, но технически сомнительной. Теперь, когда появились подробности о том, как он планирует реализовать этот ...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
Анатомия памяти в .NET: Типы данных, способы хранения, выделение памяти и работа GC
В этой статье мы заглянем под капот CLR (Common Language Runtime) и разберём как хранятся разные типы данных. Также поговорим о том, что такое стек и куча, и как они взаимодейст...
Рынок IT-аутстаффинга в РФ деградирует. И это уже сложно игнорировать
Я все чаще ловлю себя на мысли, что рынок IT-аутстаффинга в России заметно деградировал. Причем это не абстрактное ощущение из серии «раньше было лучше», а вполне конкретные наб...
Парсинг тарифов интернета и ТВ. Selenium + BeautifulSoup: трудности динамического контента и защиты от ботов
На этапе тестирования я отобрал 6 городов (Москва, Санкт-Петербург, Новосибирск, Екатеринбург, Казань, Красноярск) и двух крупнейших провайдеров России - Ростелеком и Дом.ру. В ...
Гонка вооружений. Почему античиты всегда проигрывают?
ДИСКЛЕЙМЕР:Автор не призывает к игре с сторонним ПО. Вся информация, приведенная в статье - приведена лишь в образовательных и ознакомительных целях. Информация была взята из от...