Видеонаблюдение традиционно ассоциируется с безопасностью. Но в большинстве случаев оно применяется не для ее обеспечения, то есть не для предотвращения опасных ситуаций, а для фиксации и расследования уже произошедших событий. Многообещающий тренд, который может в корне изменить порядок вещей, – видеоаналитика на основе искусственных нейронных сетей.
Извлечение полезной информации из видеопотока может помочь распознавать опасные сценарии на ранней стадии и минимизировать ущерб, а в идеале – полностью предотвращать чрезвычайные ситуации. Одновременно с этим искусственный интеллект (ИИ) существенно расширяет сферу применения видеонаблюдения за рамками систем безопасности.
Однако рекламная шумиха, уже поднятая вокруг новой технологии, мешает потенциальному пользователю отделить зерна от плевел и часто ведет к завышенным ожиданиям, а впоследствии – к полному разочарованию. Действительно ли ИИ-видеоаналитика поможет совершить технологический прорыв в видеонаблюдении? Что она умеет уже сейчас, чего не умеет и каковы перспективы ее развития? Попробуем разобраться.
Очередной «пузырь» или технологический прорыв?
Часто приходится слышать, что рынок систем видеонаблюдения все больше коммодитизируется. Множество продуктов со схожей функциональностью (или, по крайней мере, схожими обещаниями производителя) затрудняют выбор для пользователя, и одним из главных аргументов становится имя вендора и его репутация. У самих производителей остается два пути: или ввязаться в ценовую войну, делая ставку на максимальную оптимизацию затрат, или предложить что-то действительно новое и прорывное.
Тренд, который пытаются оседлать разработчики, выбравшие второй путь, – искусственный интеллект, основанный на нейронных сетях и глубоком обучении. Зародившийся несколько лет назад рынок ИИ-видеоаналитики находится в стадии взрывного роста. Новая технологическая волна добавила оптимизма небольшим, но амбициозным компаниям. Кажется, у них появился шанс прорваться к лидерству – в перспективе нескольких лет.
Однако хайп, поднятый новым модным трендом, вызывает здравые опасения умудренных опытом профессионалов рынка безопасности, как со стороны клиента, который ищет решение для своих задач, так и со стороны интегратора, который строит стратегию долгосрочного развития. Это очень похоже на очередной технологический «пузырь». Такой, который уже успел надуться вокруг видеоаналитики без нейронных сетей и громко лопнуть, когда стало ясно, что громкие обещания – всего лишь (не очень добросовестная) реклама. Но в пользу того, что ИИ в системах видеонаблюдения не «пузырь», говорит множество фактов.
Первый (и главный) – это работающие системы на реальных объектах. Они выполняют те самые обещания, которые в эпоху предыдущего «пузыря» давали горячие головы, пытающиеся научить компьютер анализировать реальность, используя классический алгоритмический подход.
Зародившийся несколько лет назад рынок ИИ-видеоаналитики находится в стадии взрывного роста. Новая технологическая волна добавила оптимизма небольшим, но амбициозным компаниям. Кажется, у них появился шанс прорваться к лидерству – в перспективе нескольких лет.
Второй – в новую технологию уже вложились не только стартапы, но и солидные разработчики VMS (Video Management Software – программное обеспечение для систем видеонаблюдения). И даже такие гиганты, как Intel, который представил и целую линейку «железных» нейроускорителей и набор программных инструментов, помогающий работать с оборудованием максимально эффективно, причем именно в области компьютерного зрения.
И наконец, третий факт: искусственный интеллект играет в шахматы, водит автомобили и прекрасно работает во многих других областях. Почему бы ему не работать в системах видеонаблюдения?
На что способен ИИ
Что же умеет делать искусственный интеллект в системах видеонаблюдения на данном этапе развития? Анализировать последовательность событий и понимать логику происходящего в поле зрения камер он пока не может, хотя, вероятно, научится в ближайшие годы. А вот обнаружение, классификация и сопровождение объектов удаются нейросетевой аналитике действительно хорошо уже сейчас.
Применительно к задачам реального мира искусственный интеллект может:
- распознавать огонь и дым для раннего обнаружения пожаров на открытых территориях (лес, открытый склад, автостоянка и др.);
- отличать людей от животных и других движущихся объектов (например, для охраны периметра заповедников от проникновения браконьеров);
- отличать человека в каске и защитной спецодежде от человека без них (для предотвращения несчастных случаев на опасном производстве или стройке);
- подсчитывать объекты специфического типа (автомобили на стоянке, людей в торговом зале, изделия, движущиеся по конвейеру) для решения бизнес-задач вне сферы безопасности.
Это лишь ряд примеров. После соответствующего обучения нейросеть может решать и другие подобные задачи. Как правило, обученная в определенных условиях нейросеть не тиражируема – в других условиях она не будет работать так же хорошо.
С другой стороны, разработчики научились быстро обучать ИИ буквально под требования конкретного проекта. Главное – наличие достаточного количества видеоматериала.
Несколько особняком стоит применение нейросетей для распознавания лиц и номерных знаков. Это пример тиражируемых нейросетей (обучаем один раз – применяем везде), что делает их коммерчески более привлекательными. И если нетиражируемые нейросети только недавно стали экономически целесообразными благодаря стремительной эволюции специализированного железа, которое используется при обучении, то применение ИИ в распознавании лиц и номеров уже давно и хорошо отработано.
Еще один тип ИИ-аналитики, на котором мы остановимся подробнее, – поведенческая видеоаналитика. Пожалуй, именно она ближе всего подводит системы видеонаблюдения к пониманию происходящего в кадре. И она имеет действительно большой потенциал.
Как работает поведенческая видеоаналитика
Технически поведенческая аналитика представляет собой комбинацию искусственного интеллекта и классического алгоритмического подхода. Обученная на множестве разнообразных сцен нейронная сеть определяет положение тела, головы и конечностей людей, попавших в поле зрения видеокамеры. Результат работы алгоритма – массив данных, описывающий позы людей в аналитическом виде.
Для определения интересующей нас позы, например поднятых вверх рук, достаточно задать условия, которым должны соответствовать полученные данные. За счет этого разработчики могут достаточно быстро создавать новые детекторы специфических поз, характерных для потенциально опасного поведения, по требованиям государственного или коммерческого заказчика. Тратить время на дополнительное обучение нейросети, как правило, не требуется, за исключением случаев очень специфических условий и ракурсов наблюдения.
Как может использоваться поведенческая видеоаналитика
Человек, поднявший руки в позицию стрельбы в образовательном учреждении, банке, магазине или общественном месте, представляет опасность. Оперативное оповещение полиции или службы безопасности предприятия необходимо для его быстрого обезвреживания и может помочь спасти жизни. Человек, присевший на корточки рядом с банкоматом, может быть техническим специалистом, инкассатором или взломщиком. В любом случае нужно оповестить об этом службу безопасности банка.
Поднятые вверх руки сотрудника отделения банка или продавца за кассой – потенциально попытка ограбления. Можно настроить автоматическую отправку тревожного сообщения вместе с видеокадром или видеофрагментом в полицию, чтобы там смогли оценить опасность ситуации и принять меры в случае необходимости. Важно, что полиция получит сигнал тревоги, даже если сотрудник не успеет воспользоваться тревожной кнопкой.
Во многих случаях требует внимания лежащий человек. Это может быть тот, кому внезапно стало плохо на улице или в метро. Или может означать использование для ночлега общедоступного помещения, не предназначенного для этого, скажем круглосуточно открытого помещения с банкоматами.
С помощью анализа поведения можно контролировать соблюдение техники безопасности. Например, следить за тем, чтобы сотрудники держались за перила, пользуясь лестницей на производственном предприятии или на стройке.
Что дальше?
Варианты применения поведенческой аналитики ограничены только фантазией заказчика.
Практически любая поза, соответствующая потенциально опасному поведению, может детектироваться. Быстрая реакция на тревогу позволит избежать материального ущерба, а в отдельных случаях и жертв.
Возможное развитие поведенческой аналитики – анализ последовательности поз одного человека или поз и взаимного положения нескольких людей. И это будет уже следующий этап развития ИИ в видеонаблюдении, переход от «детектирования» к «пониманию» поведения в динамике.
В простейшем виде такая аналитика сможет использоваться, скажем, для обнаружения отклонений от процедуры досмотра в исправительных учреждениях, когда досматриваемый должен последовательно принимать определенные позы. В более сложном – для детектирования любого ненормального поведения, например начала потасовки в общественном месте.
А в идеальном случае она сможет прогнозировать опасные ситуации по малозаметным признакам с помощью накопления статистики и применения анализа на основе больших данных.
Конечно же, пока это звучит как фантастика. Но совсем недавно фантастикой казалось и то, что искусственный интеллект делает сегодня. Мы уже проиграли ему в шахматы и го. Сможет ли искусственный интеллект обыграть человека в «Крокодила»? Вполне возможно, скоро мы сами это увидим.
Опубликовано в журнале «Системы безопасности» №3/2020