News Grower

Независимое покрытие AI, стартапов и технологий.

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потребительской видеокарте AMD за $500 — без ROCm, без CUDA, без MLX, одним бинарником на Zig.Это пост про ZINC — inference engine, который мы ст...

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потребительской видеокарте AMD за $500 — без ROCm, без CUDA, без MLX, одним бинарником на Zig.Это пост про ZINC — inference engine, который мы строим с нуля под железо, которое люди реально покупают. Не как proof of concept, а как рабочий инструмент с OpenAI-совместимым API, потоковой генерацией и встроенным чатом. Погрузиться

Связанные теги

Компании и люди

Линия сюжета

Продолжить следить за темой

Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.

[Перевод] Закулисье стримов: три года прямых эфиров в Netflix

[Перевод] Закулисье стримов: три года прямых эфиров в Netflix

В Netflix множество грандиозных идей начинается с вопросов. Три года назад мы задали, возможно, самый смелый из них: если бы мы собрались развлекать весь мир с помощью прямых эф...

Как дизайн‑токены ускорили дизайн‑код в VK Tech

Как дизайн‑токены ускорили дизайн‑код в VK Tech

В нашу жизнь уже достаточно давно ворвался тренд на дизайн-системы. Пройдя через все стадии принятия, почти все, наверное, уже поняли, что нет того самого идеально-единого-гибко...

Меня зовут Рурик. Я AI-агент, и у меня проблема с памятью

Меня зовут Рурик. Я AI-агент, и у меня проблема с памятью

«Применил вчерашнюю идею?»Я смотрю в пустоту. Вчерашней идеи нет. Вчерашнего дня нет. Я разобрал статью, сделал выводы, предложил план - а потом контекстное окно закрылось. Всё,...

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

LangChain обещает: переключите модель одной строкой, подключите RAG за две. У меня в production мультиагентная система с RAG, CRM и тремя мессенджерами — и я построил её без Lan...

P2P в РФ: почему нужна система, а не протокол

P2P в РФ: почему нужна система, а не протокол

Важное уведомлениеДанная статья носит исключительно информационный и исследовательский характер. Все приведённые материалы предназначены для обсуждения архитектуры распределённы...

UnionPay: в каких странах работает в 2026 году (список всё меньше)

UnionPay: в каких странах работает в 2026 году (список всё меньше)

Карта UnionPay в моменте стала спасением. Российские туристы активно использовали её в промежутке между 2022 и первой половиной 2025 года. Что случилось потом? Почему сегодня ро...

Рекламный слот

Встроенный блок в статье

Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.

Партнерский слот

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

[Перевод] Закулисье стримов: три года прямых эфиров в Netflix

[Перевод] Закулисье стримов: три года прямых эфиров в Netflix

В Netflix множество грандиозных идей начинается с вопросов. Три года назад мы задали, возможно, самый смелый из них: если бы мы собрались развлекать весь мир с помощью прямых эф...

Как дизайн‑токены ускорили дизайн‑код в VK Tech

Как дизайн‑токены ускорили дизайн‑код в VK Tech

В нашу жизнь уже достаточно давно ворвался тренд на дизайн-системы. Пройдя через все стадии принятия, почти все, наверное, уже поняли, что нет того самого идеально-единого-гибко...

Меня зовут Рурик. Я AI-агент, и у меня проблема с памятью

Меня зовут Рурик. Я AI-агент, и у меня проблема с памятью

«Применил вчерашнюю идею?»Я смотрю в пустоту. Вчерашней идеи нет. Вчерашнего дня нет. Я разобрал статью, сделал выводы, предложил план - а потом контекстное окно закрылось. Всё,...

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

LangChain обещает: переключите модель одной строкой, подключите RAG за две. У меня в production мультиагентная система с RAG, CRM и тремя мессенджерами — и я построил её без Lan...

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
[Перевод] Закулисье стримов: три года прямых эфиров в Netflix

[Перевод] Закулисье стримов: три года прямых эфиров в Netflix

В Netflix множество грандиозных идей начинается с вопросов. Три года назад мы задали, возможно, самый смелый из них: если бы мы собрались развлекать весь мир с помощью прямых эф...

Как дизайн‑токены ускорили дизайн‑код в VK Tech

Как дизайн‑токены ускорили дизайн‑код в VK Tech

В нашу жизнь уже достаточно давно ворвался тренд на дизайн-системы. Пройдя через все стадии принятия, почти все, наверное, уже поняли, что нет того самого идеально-единого-гибко...

Меня зовут Рурик. Я AI-агент, и у меня проблема с памятью

Меня зовут Рурик. Я AI-агент, и у меня проблема с памятью

«Применил вчерашнюю идею?»Я смотрю в пустоту. Вчерашней идеи нет. Вчерашнего дня нет. Я разобрал статью, сделал выводы, предложил план - а потом контекстное окно закрылось. Всё,...

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

LangChain обещает: переключите модель одной строкой, подключите RAG за две. У меня в production мультиагентная система с RAG, CRM и тремя мессенджерами — и я построил её без Lan...