News Grower

Независимое покрытие AI, стартапов и технологий.

Тема

KV-кеша

KV-кеша: 4 свежих материалов из 3 источников, связанные сущности и продолжение темы на одной странице.

Материалы

4

Источники

3

Последнее обновление

28.05.2026 19:06

Оставайтесь в сигнале

Следить за темой «KV-кеша»

Получайте аккуратный дайджест, когда тема, источник или сущность действительно сдвигается.

Сначала отправим письмо для подтверждения, а дальше — только содержательные дайджесты.

Silicon Motion представила контроллер для SSD с PCIe 5.0, но без DRAM — он заточен под ИИ
Стабильно Тёпло

Silicon Motion представила контроллер для SSD с PCIe 5.0, но без DRAM — он заточен под ИИ

Компания Silicon Motion представила SSD-контроллер SM2524XT без DRAM кеш-памяти. Он поддерживает стандарт PCIe 5.0 и разработан специально для задач логического вывода и KV-кеши...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Один timestamp, один round-robin, один плавающий список tools: 7 анти-паттернов, которые убивают префикс кэша LLM
Стабильно Тёпло

Один timestamp, один round-robin, один плавающий список tools: 7 анти-паттернов, которые убивают префикс кэша LLM

Кэширование включено, а cached_tokens всё равно не растут? Часто проблема не в модели и не в провайдере. Hit rate обычно режут совсем другие вещи: timestamp в начале запроса, пл...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Один timestamp, один round-robin, один плавающий список tools: 7 анти-паттернов, которые убивают префикс кэша LLM
Стабильно Тёпло

Один timestamp, один round-robin, один плавающий список tools: 7 анти-паттернов, которые убивают префикс кэша LLM

Кэширование включено, а cached_tokens всё равно не растут? Часто проблема не в модели и не в провайдере. Hit rate обычно режут совсем другие вещи: timestamp в начале запроса, пл...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Google сократила потребление памяти ИИ-моделями в шесть раз без потери точности — с алгоритмом TurboQuant
Стабильно Тёпло

Google сократила потребление памяти ИИ-моделями в шесть раз без потери точности — с алгоритмом TurboQuant

Исследовательский отдел Google Research опубликовал работу о технологии TurboQuant — алгоритме квантизации, который сокращает разрядность KV-кеша больших языковых моделей до 3 б...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Рекламный слот

Реклама на странице темы

Зарезервированный партнерский слот для релевантных сервисов, продуктов и специальных размещений.

Нативное размещение