Habr 10.04.2026 07:30 Инструменты разработки Стабильно Тёпло

Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества

Погода сигнала

Стабильно

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Автор: Maslennikovig Оригинальный источник

Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества

GPT-5.4 пишет лучше всех — 97 баллов из 100. Но $0.10 за вызов. При 10 000 генераций в месяц — $1000. А мы нашли модель, которая справляется на 91% и стоит $0.0008. Те же 10 000 генераций — $8. Разница — $992 каждый месяц. Мы строим продукт, где LLM генерирует образовательный контент для клиентов. Публичные бенчмарки (MMLU, HumanEval, LMSYS) не помогают — они не тестируют генерацию длинных текстов на русском и не учитывают стоимость. Поэтому мы за свои $95 построили собственный battle test и прогнали через него 18 моделей. Что обнаружили: 7 из 18 моделей вставляют китайские иероглифы в русский текст. Одна копирует инструкции из промпта прямо в заголовки. А LLM-судья поставил сам себе 127 баллов из 100. В статье: полная методология, таблицы с результатами, формула value score (цена/качество), и открытый лидерборд.

Читать полностью в источнике

Оставайтесь в сигнале

Следить за темой «Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества»

Следите не только за этой публикацией, но и за её продолжением: новыми материалами, соседними источниками и развитием сюжета.

Карта темы

Понять тему за минуту

Быстрый вход в историю: почему она важна сейчас, кто в ней участвует и куда идти дальше за контекстом.

Почему это важно сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

У истории уже есть 6 связанных материала, поэтому отсюда легко перейти к продолжению темы.

Сюжет постоянно вращается вокруг Gpt 5, GPT-5.4, and Habr, поэтому страницы сущностей дадут самый быстрый контекст.

Habr уже выпустил ещё 4 продолжения по этой теме.

Карта темы

Открыть живую карту этой истории

Посмотрите, какие сущности, линии сюжета, источники и follow-up материалы формируют эту историю прямо сейчас.

Нажимайте на узлы

Сущность Линия сюжета Материал Хаб Источник

Страницы сущностей

Gpt 5 GPT-5.4 Habr LLM-агентов Production

Линии сюжета

Gpt 5

Последние материалы и связанный контекст по теме Gpt 5.

GPT-5.4

Последние материалы и связанный контекст по теме GPT-5.4.

GPT-5.4

Последние материалы и связанные ссылки по теме GPT-5.4.

Habr

Последние материалы и связанные ссылки по теме Habr.

Story timeline

Продолжить следить за темой

Короткая линия событий и follow-up материалов, чтобы быстро понять ход темы.

22.05.2026 15:39 3DNews Software

Cisco выяснила, почему безупречные на первый взгляд отчёты ИИ о киберинцидентах нельзя принимать на веру

Команда Cisco Talos Incident Response проверила, насколько точно большие языковые модели (LLM) способны составлять технические отчёты о к...

12.05.2026 18:41 3DNews Software

OpenAI вооружила европейские компании ИИ-моделью GPT-5.5-Cyber для защиты от хакеров

OpenAI открыла европейским компаниям доступ к своим последним ИИ-моделям, включая специализированную GPT-5.5-Cyber, для поиска уязвимосте...

09.05.2026 11:38 3DNews Software

ИИ-модель OpenAI GPT-5.5 оказалась в 1,5–2 раза дороже предшественницы

В мире высоких технологий, как оказалось, дорожают не только чипы памяти, но и модели искусственного интеллекта: с выпуском GPT-5.5 компа...

05.05.2026 20:43 3DNews Breaking

В ChatGPT сменилась базовая модель — теперь это быстрая GPT-5.5 Instant, которая меньше галлюцинирует

Во вторник компания OpenAI выпустила новую базовую модель под названием GPT-5.5 Instant, которая заменит GPT-5.3 Instant в качестве основ...

05.05.2026 09:35 Anti-Malware News

AppSec Solutions разработала ИИ-файрвол для защиты LLM-систем

AppSec Solutions сообщила о разработке ИИ-файрвола — продукта для защиты систем с искусственным интеллектом и фильтрации запросов к больш...

10.04.2026 07:30 Habr

Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества

GPT-5.4 пишет лучше всех — 97 баллов из 100. Но $0.10 за вызов. При 10 000 генераций в месяц — $1000. А мы нашли модель, которая справляе...

Насколько можно опираться

Сигнал и надёжность Habr

Источник работает в быстрый ритме: 0% последних материалов попадают в горячее окно, а 8% дают выраженный поисковый сигнал.

Рискованный

Надёжность

Свежесть

Источников в сюжете

Американский стартап в 1000 раз ускорил протипирование печатных плат — жидкий металл меняет разводку печатных плат почти мгновенно

«Ещё не успел остыть ваш кофе, а новая разводка печатной платы уже к вашим услугам — тестируйте», — уверяет только что вышедший из скрытого режима американский стартап Itera. Эт...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

1000 Hardware Itera

Читать статью Следить за историей

3dnews.ru

Власти США начали считать протесты против ИИ и ЦОД проявлением «антитехнологического экстремизма»

3DNews Software 26.05.2026 16:11 Большой тех

Рост Горячо

Власти США начали считать протесты против ИИ и ЦОД проявлением «антитехнологического экстремизма»

Власти США начали рассматривать протесты против строительства ЦОД и критику ИИ как возможные проявления «антитехнологического экстремизма». Это следует из более чем 1000 страниц...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

1000 DHS Software

Читать статью Следить за историей

3dnews.ru

Honor представила смарт-часы Watch 6 Plus с автономностью до 17 дней и ценой от $191

3DNews Hardware 25.05.2026 17:54 Большой тех

Рост Горячо

Honor представила смарт-часы Watch 6 Plus с автономностью до 17 дней и ценой от $191

Компания Honor представила в Китае смарт-часы Watch 6 Plus. Новинка обеспечивает комплексное отслеживание и отчётность по частоте сердечных сокращений, артериальному давлению и ...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

1000 Hardware Honor Plus

Читать статью Следить за историей

3dnews.ru

Cisco выяснила, почему безупречные на первый взгляд отчёты ИИ о киберинцидентах нельзя принимать на веру

3DNews Software 22.05.2026 15:39 Большой тех

Стабильно Тёпло

Cisco выяснила, почему безупречные на первый взгляд отчёты ИИ о киберинцидентах нельзя принимать на веру

Команда Cisco Talos Incident Response проверила, насколько точно большие языковые модели (LLM) способны составлять технические отчёты о киберинцидентах. Результаты исследования ...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Cisco Cisco Talos Cisco Talos Incident Incident

Читать статью Следить за историей

3dnews.ru

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Habr 16.04.2026 10:57 Инструменты разработки

Стабильно Тёпло

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Создание безупречного визуала в Nano Banana — это не вопрос везения, а результат правильной коммуникации с нейросетью. В отличие от простых моделей прошлого, этот инструмент спо...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Banana Habr Nano Nano Banana

Читать статью Следить за историей

habr.com

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Habr 16.04.2026 10:43 Инструменты разработки

Пик Тёпло Рост в поиске

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Если вы когда-нибудь пытались поднять прокси для Telegram на сервере, то знаете, что такое «мессенджер не грузит». В этой инструкции я предлагаю рассмотреть подробную, пошаговую...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 920 и 27 внешнего сигнала.

Habr MTProto Node MTProto Panel MTProto-прокси

Читать статью Следить за историей

habr.com

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Habr 16.04.2026 10:36 Инструменты разработки

Стабильно Тёпло

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Знаете, можно много долго спорить о том, что вот там умеют делать, а наши ничего не умеют. Но подход Яндекса к формированию поисковой выдачи мне всегда импонировал больше, нежел...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Habr

Читать статью Следить за историей

habr.com

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Habr 16.04.2026 10:35 Инструменты разработки

Стабильно Тёпло

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Вторая статья цикла о криптографии, в котором мы рассказываем, как человечество училось прятать и расшифровывать секреты — от древних методов до современных алгоритмов. Сегодня ...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Habr

Читать статью Следить за историей

habr.com

Дополнительное покрытие этой темы

Похожие публикации и близкие по смыслу материалы по этой же теме.

Архитектура мультиканального Discord/Telegram voice-бота на Spring Boot: архитектура, грабли и production-решения

Habr 08.04.2026 13:36 Инструменты разработки

Пик Тёпло Рост в поиске

Архитектура мультиканального Discord/Telegram voice-бота на Spring Boot: архитектура, грабли и production-решения

Как я собрал мультиканального voice-бота на Spring Boot, который объединяет Discord, Telegram и веб-панель в одной системе. Разбираю архитектуру, работу с голосом (TTS, запись к...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 917 и 27 внешнего сигнала.

Discord JDA LavaPlayer Memory Leaks

Читать статью Следить за историей

habr.com

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

Habr 08.04.2026 10:45 Инструменты разработки

Стабильно Тёпло

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

LangChain обещает: переключите модель одной строкой, подключите RAG за две. У меня в production мультиагентная система с RAG, CRM и тремя мессенджерами — и я построил её без Lan...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

CRM Habr LangChain Production

Читать статью Следить за историей

habr.com

vLLM Production Stack. Часть 1: Базовые возможности vLLM

Habr 27.03.2026 16:09 Инструменты разработки

Пик Тёпло Рост в поиске

vLLM Production Stack. Часть 1: Базовые возможности vLLM

Статья будет о том, как быстро начать работать с vLLM и vLLM Production Stack: от первого запуска модели до базовых режимов инференса через OpenAI-совместимый API. Разберем прак...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 922 и 27 внешнего сигнала.

CPU Habr Non Thinking OpenAI-совместимый API

Читать статью Следить за историей

habr.com

Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества

Следить за темой «Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества»

Понять тему за минуту

Почему это важно сейчас

Открыть живую карту этой истории

Страницы сущностей

Линии сюжета

Продолжить следить за темой

Сигнал и надёжность Habr

Похожие статьи

Еще материалы от Habr

Дополнительное покрытие этой темы