Исследование опубликовано в журнале Scientific and Technical Information Processing. Как объяснили ученые, фотоловушки — это устройства, которые фиксируют изображения животных и других объектов в их естественной среде. В России около несколько тысяч особо охраняемых природных территорий, где используют эти проборы.
«Обычно при обнаружении объекта устройство делает от одного до семи кадров. Проблема в том, что до 70% полученных фотографий неинформативны. Это происходит как по причине ложного срабатывания камеры (например, из-за движения веток или снега), так и неудачной позы животного. При этом обработка изображений вручную происходит крайне трудоемко. Чтобы оптимизировать задачу, группа разработала алгоритм, который сочетает два процесса: выявление и узнавание объектов и их последующую классификацию», — рассказал Владислав Ефремов, один из разработчиков, аспирант МФТИ Владислав Ефремов. На первом этапе система анализирует изображения и устанавливает, содержат ли они животных. Для этой задачи исследователи протестировали несколько архитектур и выбрали нейронную сеть YOLOv5-L6. Эта модель адаптирована в том числе для таких условий, как низкая освещенность или перекрытие объекта другими предметами. При анализе тестовых данных точность этой программы составила 98,.5 %. Следующий этап работы системы посвящен определению видовой принадлежности животных. Для этих целей исследователи задействовали сверточные нейронные сети. Этот алгоритм «изучает» изображение по маленьким фрагментам и выделяет ключевые детали — линии, углы и текстуры. Таким образом, сначала искусственный интеллект находит простые элементы (например, контуры), а затем собирает их в сложные (глаза, лапы, морды животных). Такие же нейросети, в частности, лежат в основе технологии распознавания лиц. На этом этапе, по мнению исследователей, лидером стала архитектура ResNeSt-101. Она продемонстрировала точность классификации 98,.339 %. Помимо видов, программа также определяет подвиды животных. Примеры кадров с фотоловушек из заповедников (слева направо): 1) Воронежский (косули); 2) Дагестанский (волки); 3) Саяно-Шушенский (росомахи); 4) Сихотэ-Алинский (тигры) / © Scientific and Technical Information Processing «Для обучения нейронных сетей команда использовала более миллиона фотографий и 65 тысяч видеороликов, полученных с фотоловушек в различных заповедниках России. Эти данные были тщательно размечены, что позволило обучить модели с высокой точностью распознавать объекты и классифицировать их», — поделился Владислав Ефремов. В настоящее время разработанная система способна обрабатывать до миллиона изображений в сутки. При этом точность распознавания достигает 95%, что сопоставимо с результатами, которые показывают эксперты-экологи. При этом программа выполняет работу быстрее на несколько порядков. Как объяснили разработчики, предложенная нейросеть хорошо адаптируется под разные видовые составы и может быть задействована в любом из заповедников России. В будущем такие системы возьмут на себя большую часть рутинного труда экологов, позволяя им сосредоточиться на более важных задачах. Дальнейшие перспективы исследования связаны с интеграцией фотоловушек и программного комплекса посредством систем спутниковой передачи данных. Также возможна разработка мобильных приложений для полевых исследований и создание «умных» фотоловушек со встроенными «мозгами» — нейросетевыми моделями, которые автоматически удаляют неудачные фото.
Свежие комментарии