Сбор и разметка мультимодального датасета для нейросетевой системы ранней детекции хромоты у свиней — на свиноводческих комплексах одного из крупнейших агрохолдингов России.
Русагро — один из крупнейших вертикально интегрированных агрохолдингов России. По итогам 2025 года занимает второе место в стране по производству свинины с показателем 571 тыс. тонн в живом весе. В состав свиноводческого дивизиона входят три ключевых производственных кластера (Тамбовский, Белгородский и Приморский), а также собственные комбикормовые заводы и мясоперерабатывающие комплексы.
В 2024–2025 годах группа активно развивает направление цифровизации производственных процессов: видеоаналитика на убойных цехах, RFID-метки, мониторинг микроклимата и поведенческой активности. AI-диагностика хромоты — один из приоритетных проектов в рамках программы повышения благополучия животных и снижения экономических потерь.
Локомоторные расстройства у свиней долгое время оставались «невидимой» статьёй потерь. Ручной обход зоотехника фиксирует хромоту слишком поздно — когда патология уже привела к падению среднесуточного привеса, репродуктивных показателей и вынужденной выбраковке.
Экономический ущерб состоит из четырёх компонентов: вынужденная выбраковка (задолго до планового убоя), потеря привеса (снижение среднесуточного прироста больной свиньи), влияние на репродукцию (падение продуктивности маток) и стоимость лечения (ветпрепараты, антибиотики, отдельный загон). По бенчмарку AHDB (Великобритания) средний ущерб от одного случая хромоты составляет от £19 до £266 в зависимости от тяжести и стадии производственного цикла.
Главное препятствие к решению — позднее обнаружение. К моменту, когда патология становится видна невооружённым глазом, экономика случая уже ушла в минус.
[мультимодальные данные · ранняя детекция · цель ≥ 97,8%]
Русагро поставил перед .v1 задачу собрать и подготовить промышленно готовый мультимодальный датасет для обучения нейросетевой системы ранней детекции хромоты. Источники данных были разрозненными: видеозаписи с камер в загонах, RFID-метки индивидуального учёта, ветеринарные журналы, журналы вынужденных выбраковок, а также пилотные данные по IMU-датчикам и инфракрасной термографии.
Привести разнородные видеопотоки к единому частоте кадров, цветовому профилю и калибровке. Восстановить пропуски RFID, согласовать временной сдвиг между источниками.
Привязать видео, RFID, IMU и термальные кадры к единой временной шкале с допуском ≤ 50 мс. Без этого продольный анализ невозможен.
15 ключевых точек скелета на каждой свинье, оценка тяжести по 5-балльной шкале, разметка событий-ошибок и причин выбраковки.
Отдельный контур разметки «история животного» — траектория состояния от первых ранних признаков до выздоровления или выбраковки.
Подготовка датасета в формате, совместимом с открытыми фреймворками компьютерного зрения: COCO-keypoints, MOT, специализированный JSON для темпоральных моделей.
Точность классификации тяжести ≥ 97,8% на независимом тестовом наборе, превышение академического SOTA PoseGait-MT 2026 (94,7%).
Пять последовательных этапов от сырых видеопотоков до промышленно готового датасета.
Развёртывание коннекторов к видеосерверам ферм, нормализация частоты кадров, разрешения и цвета, восстановление RFID-привязок, фильтрация мусорных кадров.
Многоракурсная установка (4 камеры на загон), пилот с IMU-датчиками на ушных метках, инфракрасная термография при подозрении на воспаление, отдельная когорта эпизодов восстановления.
15 ключевых точек через DeepLabCut-подобный конвейер, Mask R-CNN / YOLOv8-seg для сегментации, BoT-SORT для отслеживания между кадрами и между камерами.
Каждый эпизод размечают два независимых ветеринара по протоколу Welfare Quality, расхождения разбирает арбитр. Целевая каппа Коэна ≥ 0,75.
7,5% эпизодов восстановления, 12% сложных сценариев, явная таксономия причин ошибок. Балансировка классов тяжести 60 : 25 : 15 (норма : ранняя : выраженная).
4× IP-камеры 1080p / 30 кадров/с на загон, GigE Vision, NTP-синхронизация. Пилотный набор IMU-меток (LSM6DSOX). FLIR Lepton 3.5 для термографии. Граничные серверы NVIDIA Jetson Orin для предварительной фильтрации.
Самообслуживаемое API приёма данных, темпоральный синхронизатор ≤ 50 мс, аннотатор ключевых точек с клавиатурно-ориентированным интерфейсом, мульти-аннотаторная валидация, экспорт в COCO, MOT, специализированный JSON.
RGB-видео, инфракрасная термография (дельта температуры кожи), IMU (ускорение / гироскоп), RFID-идентификатор животного, ветеринарный журнал (свободный текст → структурированная разметка).
AI-предразметка ≥ 99,2% IoU · синхронизация ≤ 50 мс · каппа Коэна ≥ 0,75 между ветеринарами · сложные сценарии ≥ 10% поставки · recovery 5–15% · полная разметка причин ошибок.
Метрики на independent test set после обучения модели Русагро на собранном датасете.
Превышение академического бенчмарка на 3,1 процентного пункта — нетривиальный результат для производственной задачи. Основной вклад дал именно качественно размеченный мультимодальный датасет: одна модальность (только RGB) даёт потолок ~93%, добавление термографии и IMU позволяет вытянуть незаметные случаи, которые PoseGait в чистом виде пропускает.
[ИНЖЕНЕРНЫЕ И БИОЛОГИЧЕСКИЕ ВЫЗОВЫ]
Точные даты не раскрываются по условиям NDA.
Оценка эффекта от внедрения системы на свиноводческий дивизион на основе открытых отраслевых бенчмарков и публичных данных Русагро.
Куда расширяется подход после успешного запуска первой системы.
Развёртывание на 3 кластера (Тамбовский, Белгородский, Приморский). Единый ML-стек, локальные модели под микроклимат и поголовье.
Перенос конвейера на КРС (молочное стадо, мастит и хромота), овец, лошадей, бройлеров. Базовая архитектура ключевые точки + мультимодальные данные сохраняется.
Адаптация для Мираторга, Промагро, Великолукского МК, Сибагро, Черкизово. Аналогичная экономика, единый российский AI-стек.
Беларусь, Казахстан, Узбекистан — близкий технологический ландшафт ферм, общий язык документации, низкий барьер локализации.
«Хромота остаётся одним из наиболее экономически ощутимых и значимых для благополучия животных состояний в современном свиноводстве. Документированные потери на один случай колеблются от 1 590 ₽ до 22 261 ₽ в зависимости от стадии и тяжести. Технология ранней детекции — одно из наиболее результативных вмешательств, доступных производителям.» Экономическое влияние хромоты в свиноводстве
Сбор мультимодальных данных для VLA-моделей KinetIQ — 60 totes/час, 1 000+ роботов в pipeline Schaeffler.
[АГРОТЕХ · ПЛАНИРУЕТСЯ]Адаптация multimodal pipeline под крупный рогатый скот — термография вымени, поведенческие паттерны, RFID.
[АГРОТЕХ · ПЛАНИРУЕТСЯ]CV-мониторинг активности и распределения по площади для ранней детекции стресса и инфекционных вспышек.
Сбор данных, разметка ветеринарами, сценарии восстановления, мультимодальная синхронизация — оперативно соберём пилот.
Запрос сэмпл из датасетаОставьте контакты — пришлём ссылку на 10 эпизодов и краткий разбор разметки в течение 24 часов в рабочие дни.