Habr 24.03.2026 10:47 Инструменты разработки Стабильно Тёпло

GigaChat-3.1: Большое обновление больших моделей

Погода сигнала

Стабильно

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Автор: chameleon-lizard (Сбер) Оригинальный источник

GigaChat-3.1: Большое обновление больших моделей

В ноябре мы выложили в open source preview-версии GigaChat-3-Ultra (702B MoE) и GigaChat-3-Lightning (10B MoE). С тех пор мы провели большую работу над нашими моделями, и сегодня выпускаем обновлённые GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. По нашим замерам, Ultra обходит non-reasoning Qwen3-235B-A22B и DeepSeek-V3-0324 в математике и general reasoning, а Lightning на аренах с судьёй GPT-4.1 играет на уровне GPT-4o — при 1,8 млрд активных параметров. Модели, как и раньше, лежат на HuggingFace и GitVerse под MIT.Но этот пост — не только про числа в таблицах. Переезд на новую архитектуру дался нам нелегко: переход от Dense-моделей к MoE вскрыл несколько проблем, о которых мы раньше не думали. По дороге к релизу мы полностью победили проблему зацикливания генераций (и придумали для этого метрику на основе BPE-сжатия хвоста), перевели DPO-этап в нативный FP8, получив качество выше bf16 при вдвое меньшем потреблении памяти, нашли критичный баг в SGLang при dp > 1, который роняет качество, и выяснили, что GPT-OSS-120b — неожиданно хорошая замена проприетарным судьям на аренах. Под катом — подробности о каждом из этих сюжетов: что ломалось, какие гипотезы не сработали, и что в итоге помогло.

Читать полностью в источнике

Оставайтесь в сигнале

Следить за темой «GigaChat-3.1: Большое обновление больших моделей»

Следите не только за этой публикацией, но и за её продолжением: новыми материалами, соседними источниками и развитием сюжета.

Карта темы

Понять тему за минуту

Быстрый вход в историю: почему она важна сейчас, кто в ней участвует и куда идти дальше за контекстом.

Почему это важно сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

У истории уже есть 6 связанных материала, поэтому отсюда легко перейти к продолжению темы.

Сюжет постоянно вращается вокруг DeepSeek-V3-0324, GigaChat-3-Lightning, and GigaChat-3-Ultra, поэтому страницы сущностей дадут самый быстрый контекст.

Habr уже выпустил ещё 4 продолжения по этой теме.

Карта темы

Открыть живую карту этой истории

Посмотрите, какие сущности, линии сюжета, источники и follow-up материалы формируют эту историю прямо сейчас.

Нажимайте на узлы

Сущность Линия сюжета Материал Хаб Источник

Страницы сущностей

DeepSeek-V3-0324 GigaChat-3-Lightning GigaChat-3-Ultra GitVerse GPT-4.1 HuggingFace

Линии сюжета

GigaChat-3-Ultra

Последние материалы и связанный контекст по теме GigaChat-3-Ultra.

GitVerse

Последние материалы и связанный контекст по теме GitVerse.

GPT-4.1

Последние материалы и связанный контекст по теме GPT-4.1.

HuggingFace

Последние материалы и связанный контекст по теме HuggingFace.

Story timeline

Продолжить следить за темой

Короткая линия событий и follow-up материалов, чтобы быстро понять ход темы.

01.05.2026 21:26 3DNews Hardware

AnTuTu назвала самые мощные Android-смартфоны апреля — iQOO 15 Ultra выбился в лидеры

В начале каждого месяца разработчики популярного мобильного бенчмарка AnTuTu публикуют рейтинги самых производительных Android-смартфонов...

29.04.2026 21:30 3DNews Hardware

Motorola оценила складной смартфон Razr Fold в $1899 — продажи стартуют 15 мая

Motorola сообщила о предстоящем старте регистрации в США предзаказов на складной смартфон Razr Fold по цене $1899. Новинку можно будет за...

29.04.2026 18:16 3DNews Hardware

Motorola представила смартфон Moto G87 c Dimensity 6400 и 200-Мп камерой за €399

Помимо складных смартфонов Razr 70, Razr 70 Ultra и Razr 70 Plus компания Motorola сегодня представила модель G87 — новый смартфон в сост...

29.04.2026 17:59 3DNews Hardware

Motorola выпустила глобальную версию Razr 70 Plus со Snapdragon 8s Gen 3, парой 50-Мп камер и батареей на 4500 мА·ч

Серия складных смартфонов Razr впервые расширилась до трёх моделей за пределами Северной Америки. В этом году к выпущенным глобально Razr...

29.04.2026 17:34 3DNews Breaking

Motorola представила смартфоны-раскладушки Razr 70 и Razr 70 Ultra — изменений мало, но цены выше

Компания Motorola представила сегодня множество новых смартфонов. Одними из новинок стали складные модели Razr 70 и Razr 70 Ultra. К сожа...

24.03.2026 10:47 Habr

GigaChat-3.1: Большое обновление больших моделей

В ноябре мы выложили в open source preview-версии GigaChat-3-Ultra (702B MoE) и GigaChat-3-Lightning (10B MoE). С тех пор мы провели боль...

Насколько можно опираться

Сигнал и надёжность Habr

Источник работает в быстрый ритме: 0% последних материалов попадают в горячее окно, а 8% дают выраженный поисковый сигнал.

Рискованный

Надёжность

Свежесть

Источников в сюжете

Hisense представила игровой 5K-монитор GX Ultra с частотой обновления 180 Гц

Завтра, 8 мая, Hisense начнёт продажи игрового монитора GX Ultra — его отличают экран с разрешением 5K (5120 × 2880 пикселей) и подсветкой Mini LED. С учётом скидки его стоимост...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

2880 5120 6999 GX Ultra

Читать статью Следить за историей

3dnews.ru

Apple урезает семейство Mac: мощные версии исчезают из-за нехватки памяти

3DNews Hardware 06.05.2026 12:04 Большой тех

Пик Горячо Рост в поиске

Apple урезает семейство Mac: мощные версии исчезают из-за нехватки памяти

Компания Apple убрала из своего онлайн-магазина ещё больше конфигураций настольных компьютеров Mac в связи с продолжающимся глобальным дефицитом памяти. Модели Mac mini с 32 и 6...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 930 и 27 внешнего сигнала.

Apple Hardware Mac Mac Mini

Читать статью Следить за историей

3dnews.ru

AnTuTu назвала самые мощные Android-смартфоны апреля — iQOO 15 Ultra выбился в лидеры

3DNews Hardware 01.05.2026 21:26 Большой тех

Стабильно Тёпло

AnTuTu назвала самые мощные Android-смартфоны апреля — iQOO 15 Ultra выбился в лидеры

В начале каждого месяца разработчики популярного мобильного бенчмарка AnTuTu публикуют рейтинги самых производительных Android-смартфонов. Стоит отметить, что рейтинги строятся ...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Android AnTuTu Hardware Iqoo

Читать статью Следить за историей

3dnews.ru

Motorola оценила складной смартфон Razr Fold в $1899 — продажи стартуют 15 мая

3DNews Hardware 29.04.2026 21:30 Большой тех

Стабильно Тёпло

Motorola оценила складной смартфон Razr Fold в $1899 — продажи стартуют 15 мая

Motorola сообщила о предстоящем старте регистрации в США предзаказов на складной смартфон Razr Fold по цене $1899. Новинку можно будет заказать с 14 мая на сайте Motorola и в ма...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

1899 Best Buy Fold Hardware

Читать статью Следить за историей

3dnews.ru

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Habr 16.04.2026 10:57 Инструменты разработки

Стабильно Тёпло

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Создание безупречного визуала в Nano Banana — это не вопрос везения, а результат правильной коммуникации с нейросетью. В отличие от простых моделей прошлого, этот инструмент спо...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Banana Habr Nano Nano Banana

Читать статью Следить за историей

habr.com

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Habr 16.04.2026 10:43 Инструменты разработки

Пик Тёпло Рост в поиске

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Если вы когда-нибудь пытались поднять прокси для Telegram на сервере, то знаете, что такое «мессенджер не грузит». В этой инструкции я предлагаю рассмотреть подробную, пошаговую...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 918 и 27 внешнего сигнала.

Habr MTProto Node MTProto Panel MTProto-прокси

Читать статью Следить за историей

habr.com

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Habr 16.04.2026 10:36 Инструменты разработки

Стабильно Тёпло

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Знаете, можно много долго спорить о том, что вот там умеют делать, а наши ничего не умеют. Но подход Яндекса к формированию поисковой выдачи мне всегда импонировал больше, нежел...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Habr

Читать статью Следить за историей

habr.com

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Habr 16.04.2026 10:35 Инструменты разработки

Стабильно Тёпло

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Вторая статья цикла о криптографии, в котором мы рассказываем, как человечество училось прятать и расшифровывать секреты — от древних методов до современных алгоритмов. Сегодня ...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Habr

Читать статью Следить за историей

habr.com

Дополнительное покрытие этой темы

Похожие публикации и близкие по смыслу материалы по этой же теме.

Антиспам на нейронках: Gemini Flash в 1000 раз дешевле чем GigaChat

Habr 02.04.2026 18:02 Инструменты разработки

Пик Тёпло Рост в поиске

Антиспам на нейронках: Gemini Flash в 1000 раз дешевле чем GigaChat

Сравниваю бесплатные лимиты GigaChat, YandexGPT и Gemini Flash для реальной задачи: антиспам-бот в Telegram, 5000 сообщений в сутки. Считаю токены, потоки и рублики. Разница в л...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 915 и 27 внешнего сигнала.

1000 Flash Gemini Gemini Flash

Читать статью Следить за историей

habr.com

Попросил нейросети ChatGPT, DeepSeek и GigaChat собрать игровой ПК за 100 000 рублей. Кто справился лучше?

Habr 31.03.2026 10:17 Инструменты разработки

Стабильно Тёпло

Попросил нейросети ChatGPT, DeepSeek и GigaChat собрать игровой ПК за 100 000 рублей. Кто справился лучше?

Не так давно мы провели эксперимент: скормили нейросети сотню сборок ПК с Хабра и попросили найти типичные ошибки. Получилось занятно, потому что проблемы обнаружились почти в к...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

ChatGPT DeepSeek Gigachat Habr

Читать статью Следить за историей

habr.com

GigaChat 3 Ultra от Сбера, OpenAI закрыла Sora, ARC-AGI-3 сломал все модели, ИИ-агенты взломали корпоративные системы

Habr 28.03.2026 17:05 Инструменты разработки

Пик Тёпло Рост в поиске

GigaChat 3 Ultra от Сбера, OpenAI закрыла Sora, ARC-AGI-3 сломал все модели, ИИ-агенты взломали корпоративные системы

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. Неделя вышла насыщенной: OpenAI закрывае...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 923 и 27 внешнего сигнала.

Anthropic Arc Agi 3 Gigachat Lyria

Читать статью Следить за историей

habr.com

Краткая сводка

Сегодня опубликованы обновлённые модели GigaChat-3.1-Ultra (702 B MoE) и GigaChat-3.1-Lightning (10 B MoE), которые по внутренним замерам превосходят Qwen3‑235B‑A22B, DeepSeek‑V3‑0324 и работают на уровне GPT‑4o при 1,8 млрд активных параметров. При их выпуске решены проблемы зацикливания генераций, реализован DPO в FP8, исправлен баг SGLang и обнаружена эффективность GPT‑OSS‑120b как замены проприетарных судей.

Связанные теги

DeepSee... Habr GigaChat-3.1 GigaChat-3.1-Lightning GigaChat-3.1-Ultra GigaChat-3-Lightning GigaChat-3-Ultra MoE Non Reasoning Qwen3 235b A22b Qwen3-235B-A22B Ultra

Компании и люди

DeepSeek-V3-0324 GigaChat-3-Lightning GigaChat-3-Ultra GitVerse GPT-4.1 HuggingFace Qwen3-235B-A22B SGLang

Линия сюжета

GigaChat-3-Ultra

Последние материалы и связанный контекст по теме GigaChat-3-Ultra.

GitVerse

Последние материалы и связанный контекст по теме GitVerse.

GPT-4.1

Последние материалы и связанный контекст по теме GPT-4.1.

HuggingFace

Последние материалы и связанный контекст по теме HuggingFace.

MoE

Последние материалы и связанные ссылки по теме MoE.

SGLang

Последние материалы и связанный контекст по теме SGLang.

Ultra

Последние материалы и связанные ссылки по теме Ultra.

Рекламный слот

Встроенный блок в статье

Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.

Партнерский слот

GigaChat-3.1: Большое обновление больших моделей

Следить за темой «GigaChat-3.1: Большое обновление больших моделей»

Понять тему за минуту

Почему это важно сейчас

Открыть живую карту этой истории

Страницы сущностей

Линии сюжета

Продолжить следить за темой

Сигнал и надёжность Habr

Похожие статьи

Еще материалы от Habr

Дополнительное покрытие этой темы