News Grower

Независимое покрытие AI, стартапов и технологий.

Habr 24.03.2026 10:47 Инструменты разработки Стабильно Тёпло

GigaChat-3.1: Большое обновление больших моделей

В ноябре мы выложили в open source preview-версии GigaChat-3-Ultra (702B MoE) и GigaChat-3-Lightning (10B MoE). С тех пор мы провели большую работу над нашими моделями, и сегодня выпускаем обновлённые GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. По нашим замерам, Ultra обходит non-reasoning Qwen3-235B-A22B и DeepSee...

Погода сигнала

Стабильно

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Автор: chameleon-lizard (Сбер) Оригинальный источник
GigaChat-3.1: Большое обновление больших моделей

В ноябре мы выложили в open source preview-версии GigaChat-3-Ultra (702B MoE) и GigaChat-3-Lightning (10B MoE). С тех пор мы провели большую работу над нашими моделями, и сегодня выпускаем обновлённые GigaChat-3.1-Ultra и GigaChat-3.1-Lightning. По нашим замерам, Ultra обходит non-reasoning Qwen3-235B-A22B и DeepSeek-V3-0324 в математике и general reasoning, а Lightning на аренах с судьёй GPT-4.1 играет на уровне GPT-4o — при 1,8 млрд активных параметров. Модели, как и раньше, лежат на HuggingFace и GitVerse под MIT.Но этот пост — не только про числа в таблицах. Переезд на новую архитектуру дался нам нелегко: переход от Dense-моделей к MoE вскрыл несколько проблем, о которых мы раньше не думали. По дороге к релизу мы полностью победили проблему зацикливания генераций (и придумали для этого метрику на основе BPE-сжатия хвоста), перевели DPO-этап в нативный FP8, получив качество выше bf16 при вдвое меньшем потреблении памяти, нашли критичный баг в SGLang при dp > 1, который роняет качество, и выяснили, что GPT-OSS-120b — неожиданно хорошая замена проприетарным судьям на аренах. Под катом — подробности о каждом из этих сюжетов: что ломалось, какие гипотезы не сработали, и что в итоге помогло.

Оставайтесь в сигнале

Следить за темой «GigaChat-3.1: Большое обновление больших моделей»

Следите не только за этой публикацией, но и за её продолжением: новыми материалами, соседними источниками и развитием сюжета.

Сначала отправим письмо для подтверждения, а дальше — только содержательные дайджесты.

Карта темы

Понять тему за минуту

Быстрый вход в историю: почему она важна сейчас, кто в ней участвует и куда идти дальше за контекстом.

Почему это важно сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.
У истории уже есть 6 связанных материала, поэтому отсюда легко перейти к продолжению темы.
Сюжет постоянно вращается вокруг DeepSeek-V3-0324, GigaChat-3-Lightning, and GigaChat-3-Ultra, поэтому страницы сущностей дадут самый быстрый контекст.
Habr уже выпустил ещё 4 продолжения по этой теме.

Карта темы

Открыть живую карту этой истории

Посмотрите, какие сущности, линии сюжета, источники и follow-up материалы формируют эту историю прямо сейчас.

Нажимайте на узлы

Сущность Линия сюжета Материал Хаб Источник

Story timeline

Продолжить следить за темой

Короткая линия событий и follow-up материалов, чтобы быстро понять ход темы.

01.05.2026 21:26 3DNews Hardware

AnTuTu назвала самые мощные Android-смартфоны апреля — iQOO 15 Ultra выбился в лидеры

В начале каждого месяца разработчики популярного мобильного бенчмарка AnTuTu публикуют рейтинги самых производительных Android-смартфонов...

29.04.2026 21:30 3DNews Hardware

Motorola оценила складной смартфон Razr Fold в $1899 — продажи стартуют 15 мая

Motorola сообщила о предстоящем старте регистрации в США предзаказов на складной смартфон Razr Fold по цене $1899. Новинку можно будет за...

29.04.2026 18:16 3DNews Hardware

Motorola представила смартфон Moto G87 c Dimensity 6400 и 200-Мп камерой за €399

Помимо складных смартфонов Razr 70, Razr 70 Ultra и Razr 70 Plus компания Motorola сегодня представила модель G87 — новый смартфон в сост...

29.04.2026 17:59 3DNews Hardware

Motorola выпустила глобальную версию Razr 70 Plus со Snapdragon 8s Gen 3, парой 50-Мп камер и батареей на 4500 мА·ч

Серия складных смартфонов Razr впервые расширилась до трёх моделей за пределами Северной Америки. В этом году к выпущенным глобально Razr...

29.04.2026 17:34 3DNews Breaking

Motorola представила смартфоны-раскладушки Razr 70 и Razr 70 Ultra — изменений мало, но цены выше

Компания Motorola представила сегодня множество новых смартфонов. Одними из новинок стали складные модели Razr 70 и Razr 70 Ultra. К сожа...

24.03.2026 10:47 Habr

GigaChat-3.1: Большое обновление больших моделей

В ноябре мы выложили в open source preview-версии GigaChat-3-Ultra (702B MoE) и GigaChat-3-Lightning (10B MoE). С тех пор мы провели боль...

Насколько можно опираться

Сигнал и надёжность Habr

Источник работает в быстрый ритме: 0% последних материалов попадают в горячее окно, а 8% дают выраженный поисковый сигнал.

Рискованный

Надёжность

10

Свежесть

22

Источников в сюжете

3

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

Hisense представила игровой 5K-монитор GX Ultra с частотой обновления 180 Гц
Рост Горячо

Hisense представила игровой 5K-монитор GX Ultra с частотой обновления 180 Гц

Завтра, 8 мая, Hisense начнёт продажи игрового монитора GX Ultra — его отличают экран с разрешением 5K (5120 × 2880 пикселей) и подсветкой Mini LED. С учётом скидки его стоимост...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

Apple урезает семейство Mac: мощные версии исчезают из-за нехватки памяти
Пик Горячо Рост в поиске

Apple урезает семейство Mac: мощные версии исчезают из-за нехватки памяти

Компания Apple убрала из своего онлайн-магазина ещё больше конфигураций настольных компьютеров Mac в связи с продолжающимся глобальным дефицитом памяти. Модели Mac mini с 32 и 6...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 930 и 27 внешнего сигнала.

AnTuTu назвала самые мощные Android-смартфоны апреля — iQOO 15 Ultra выбился в лидеры
Стабильно Тёпло

AnTuTu назвала самые мощные Android-смартфоны апреля — iQOO 15 Ultra выбился в лидеры

В начале каждого месяца разработчики популярного мобильного бенчмарка AnTuTu публикуют рейтинги самых производительных Android-смартфонов. Стоит отметить, что рейтинги строятся ...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Motorola оценила складной смартфон Razr Fold в $1899 — продажи стартуют 15 мая
Стабильно Тёпло

Motorola оценила складной смартфон Razr Fold в $1899 — продажи стартуют 15 мая

Motorola сообщила о предстоящем старте регистрации в США предзаказов на складной смартфон Razr Fold по цене $1899. Новинку можно будет заказать с 14 мая на сайте Motorola и в ма...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про
Стабильно Тёпло

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Создание безупречного визуала в Nano Banana — это не вопрос везения, а результат правильной коммуникации с нейросетью. В отличие от простых моделей прошлого, этот инструмент спо...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS
Пик Тёпло Рост в поиске

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Если вы когда-нибудь пытались поднять прокси для Telegram на сервере, то знаете, что такое «мессенджер не грузит». В этой инструкции я предлагаю рассмотреть подробную, пошаговую...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 918 и 27 внешнего сигнала.

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса
Стабильно Тёпло

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Знаете, можно много долго спорить о том, что вот там умеют делать, а наши ничего не умеют. Но подход Яндекса к формированию поисковой выдачи мне всегда импонировал больше, нежел...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов
Стабильно Тёпло

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Вторая статья цикла о криптографии, в котором мы рассказываем, как человечество училось прятать и расшифровывать секреты — от древних методов до современных алгоритмов. Сегодня ...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Дополнительное покрытие этой темы

Похожие публикации и близкие по смыслу материалы по этой же теме.

Антиспам на нейронках: Gemini Flash в 1000 раз дешевле чем GigaChat
Пик Тёпло Рост в поиске

Антиспам на нейронках: Gemini Flash в 1000 раз дешевле чем GigaChat

Сравниваю бесплатные лимиты GigaChat, YandexGPT и Gemini Flash для реальной задачи: антиспам-бот в Telegram, 5000 сообщений в сутки. Считаю токены, потоки и рублики. Разница в л...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 915 и 27 внешнего сигнала.

Попросил нейросети ChatGPT, DeepSeek и GigaChat собрать игровой ПК за 100 000 рублей. Кто справился лучше?
Стабильно Тёпло

Попросил нейросети ChatGPT, DeepSeek и GigaChat собрать игровой ПК за 100 000 рублей. Кто справился лучше?

Не так давно мы провели эксперимент: скормили нейросети сотню сборок ПК с Хабра и попросили найти типичные ошибки. Получилось занятно, потому что проблемы обнаружились почти в к...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

GigaChat 3 Ultra от Сбера, OpenAI закрыла Sora, ARC-AGI-3 сломал все модели, ИИ-агенты взломали корпоративные системы
Пик Тёпло Рост в поиске

GigaChat 3 Ultra от Сбера, OpenAI закрыла Sora, ARC-AGI-3 сломал все модели, ИИ-агенты взломали корпоративные системы

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. Неделя вышла насыщенной: OpenAI закрывае...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 923 и 27 внешнего сигнала.