Я научил виртуальную камеру быть оператором: как устроен алгоритм face tracking для Shorts/Reels
В предыдущей статье я подробно рассказывал про свой "аниме завод" — пайплайн, который автоматически превращает эпизоды в готовые Shorts. Но внутри этой системы есть один особенно важный узел, который заслуживает отдельного разбора: виртуальная камера для автоматического кадрирования.В этой статье я разберу не просто...
В предыдущей статье я подробно рассказывал про свой "аниме завод" — пайплайн, который автоматически превращает эпизоды в готовые Shorts. Но внутри этой системы есть один особенно важный узел, который заслуживает отдельного разбора: виртуальная камера для автоматического кадрирования.В этой статье я разберу не просто "функцию автокропа", а полноценный алгоритм виртуальной камеры для вертикального видео. Это тот случай, когда задача на первый взгляд кажется простой: есть горизонтальный ролик, нужно сделать 9:16, удержать человека в кадре и не превратить результат в дёрганый автофокус из начала 2010-х.Но как только начинаешь делать это не для демо, а для реального пайплайна, сразу всплывают инженерные проблемы:
Связанные теги
Компании и люди
Линия сюжета
Face
Последние материалы и связанный контекст по теме Face.
Habr
Последние материалы и связанный контекст по теме Habr.
Habr
Последние материалы и связанные ссылки по теме Habr.
Reels
Последние материалы и связанные ссылки по теме Reels.
Shorts
Последние материалы и связанный контекст по теме Shorts.
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
Пишем AI-помощника для ревью пулл-реквестов: как выбрать модель и разработать серверную часть
Привет, Хабр! Я Полина Ященко, старший инженер по разработке ПО в YADRO. Мы с командой тестируем гипотезы и активно применяем искусственный интеллект, чтобы усовершенствовать пр...
Как использовать koda-cli в своей IDE без терминала
Привет. В свежей версии CLI-ассиcтента Koda 0.3.1 мы доработали поддержку ACP (Agent Client Protocol) и хотим поделиться туториалом — как настроить интеграцию с ним прямо сейчас...
Оказание проактивных сервисных услуг и проверка HealthCare
Информационная безопасность в классическом понимании часто работает как экстренная служба: «горит — тушим, не горим — отдыхаем». Но современная ИТ-инфраструктура слишком сложна ...
4 недели после открытия MENO для всех
Четыре недели. В первой части было 120 пользователей и баги в парсинге. Во второй - 149 и новый онбординг. В третьей - 216 и первый фидбек с Запада. Сейчас - четвёртая.Коротко: ...
Зачем ИИ-генератору презентаций собственный редактор
Привет, Хабр. На связи тим-лид разработки Кэмпа. Это третья статья цикла о релизе нового генератора презентаций в Кэмпе. Ранее разбирали, почему первая версия не взлетела, и что...
Как мы построили интегрированное планирование для фармхолдинга, растущего в 6 раз быстрее рынка
Привет, Хабр! Не мне вам рассказывать, что мы живем в эпоху цифровизации производств — вы наверняка читали статьи о «тяжёлой цифре». Но история цифровизации, которой я хочу поде...
Рекламный слот
Встроенный блок в статье
Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
Пишем AI-помощника для ревью пулл-реквестов: как выбрать модель и разработать серверную часть
Привет, Хабр! Я Полина Ященко, старший инженер по разработке ПО в YADRO. Мы с командой тестируем гипотезы и активно применяем искусственный интеллект, чтобы усовершенствовать пр...
Как использовать koda-cli в своей IDE без терминала
Привет. В свежей версии CLI-ассиcтента Koda 0.3.1 мы доработали поддержку ACP (Agent Client Protocol) и хотим поделиться туториалом — как настроить интеграцию с ним прямо сейчас...
Оказание проактивных сервисных услуг и проверка HealthCare
Информационная безопасность в классическом понимании часто работает как экстренная служба: «горит — тушим, не горим — отдыхаем». Но современная ИТ-инфраструктура слишком сложна ...
4 недели после открытия MENO для всех
Четыре недели. В первой части было 120 пользователей и баги в парсинге. Во второй - 149 и новый онбординг. В третьей - 216 и первый фидбек с Запада. Сейчас - четвёртая.Коротко: ...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
Пишем AI-помощника для ревью пулл-реквестов: как выбрать модель и разработать серверную часть
Привет, Хабр! Я Полина Ященко, старший инженер по разработке ПО в YADRO. Мы с командой тестируем гипотезы и активно применяем искусственный интеллект, чтобы усовершенствовать пр...
Как использовать koda-cli в своей IDE без терминала
Привет. В свежей версии CLI-ассиcтента Koda 0.3.1 мы доработали поддержку ACP (Agent Client Protocol) и хотим поделиться туториалом — как настроить интеграцию с ним прямо сейчас...
Оказание проактивных сервисных услуг и проверка HealthCare
Информационная безопасность в классическом понимании часто работает как экстренная служба: «горит — тушим, не горим — отдыхаем». Но современная ИТ-инфраструктура слишком сложна ...
4 недели после открытия MENO для всех
Четыре недели. В первой части было 120 пользователей и баги в парсинге. Во второй - 149 и новый онбординг. В третьей - 216 и первый фидбек с Запада. Сейчас - четвёртая.Коротко: ...