- Escrito por: Jose Francisco Diaz Lozano
- Categoría: Artículos
- Publicado:
Inteligencia Artificial: El video como catalizador del Big Bang Digital
Muchos han sido los aportes de la IA en diferentes campos, sin embargo, el sector de la seguridad electrónica está revolucionando sus soluciones de videovigilancia con la implementación de esta tecnología.
El término Inteligencia Artificial (IA) no es nuevo, y la primera vez que se utilizó fue en 1956 por el profesor John McCarthy, quien a su vez fundó los laboratorios de IA en las universidades de MIT y Stanford. Sin embargo, si hace 10 años alguien hubiera mencionado en una sala de juntas el término “Inteligencia Artificial”, es muy probable que las personas presentes hubieran asociado el término con series o películas de ciencia ficción como Star Trek o Terminator y le hubieran restado importancia al tema. En los últimos años hemos venido escuchando el término de manera repetitiva al punto de convertirse en una palabra clave en los motores de búsqueda como Google donde se presenta como un atributo destacado, asociado por ejemplo a dispositivos de consumo masivo como los teléfonos móviles, televisores, asistentes de voz o en supercomputadoras como el doctor Watson de IBM, y recientemente en la industria de la seguridad electrónica, en los sistemas de videovigilancia. Las cámaras han venido pasando de ser simples dispositivos generadores de imágenes a convertirse en poderosos sensores inteligentes que pueden procesar imágenes bien sea en el borde, o en un servidor central que permite proveer información valiosa para los usuarios.
Si bien, en los últimos años hemos visto el auge de la Inteligencia Artificial, han sido básicamente dos fuerzas las que han impulsado esta explosión acelerada en casi todos los ámbitos de nuestra sociedad.
Big Data
Alrededor de 2015, gracias al internet y las redes sociales, una gran cantidad de datos empezaron a estar disponibles. Todos los videos suministrados en YouTube y la información integrada ha sido fundamental para entrenar una IA basada en redes neuronales, reconocimiento de imágenes, e identificación de escenas. (ver fig.1)
Lo mismo ocurrió con todos los likes de Facebook y las búsquedas en Google cuyos algoritmos basados en IA nos ha demostrado su gran capacidad de predecir nuestros gustos y preferencias e incluso sugerirnos productos y servicios aun cuando el proceso de escritura tenga errores. El exceso de datos ha llevado a una investigación intensificada sobre las formas en que estos se pueden procesar, analizar y actuar, pues, es allí donde radica el verdadero poder de la IA , en su capacidad para encontrar conexiones ocultas entre bits oscuros de información y conexiones que ningún ser humano notaría jamás.
Fig. 1 - Tomado de la Revista en línea Quanta Magazine.
GPU´s
Al mismo tiempo que todo este conjunto de datos provenientes de análisis de videos en Youtube, redes sociales y motores de búsqueda estaban disponibles, las unidades de procesamiento gráfico ( GPUs) empezaron a inundar el mercado de los semiconductores gracias a su bajo costo y su increíble capacidad de procesamiento de imágenes. Las GPUs ejecutan gráficos complicados como los que se encuentran en los videojuegos, una industria que viene en un acelerado crecimiento frente a otros segmentos de la industria digital del entretenimiento (ver fig.2) y que a su vez, también han impulsado la Inteligencia Artificial y su explosión exponencial que podríamos considerar como el “Big Bang Digital” impulsado por el video, y la gran cantidad de datos que se pueden analizar y procesar simultáneamente gracias a estas GPUs y sus algoritmos de Inteligencia Artificial.
Fig. 2 - Tomado del portal Statista - El sector de los videojuegos, el de mayores ingresos.
El gigante de las GPU´s NVIDIA Corp. que ha sido fuerte en el mercado de los videojuegos y el hardware de gráficos desde hace varios años, viene impulsando la Inteligencia Artificial potencialmente pues, para finales del 2020 NVIDIA Corp. tuvo una participación del 80.6% de los ingresos globales en el mercado de procesadores de inteligencia artificial donde representaban cerca de $3.2 Billones de USD, siendo proveedor actual de varios de los fabricantes de soluciones en el mercado de la videovigilancia como Axis Communications, BCD Video, Dahua, Hanwha, Milestone o desarrolladores de software basado en IA, como Agent VI Y Neural Labs, estas poderosas GPUs pueden analizar imágenes provenientes de las cámaras para múltiples aplicaciones como seguridad ciudadana, infraestructura crítica, retail, análisis de tráfico, seguridad en campus universitarios, aeropuertos, parqueaderos y mucho más.
El video como el catalizador del Big Bang digital
El video es el catalizador del “Big Bang Digital” que hemos visto en los últimos años debido a la gran cantidad de información que se puede procesar y analizar gracias a la combinación de GPU´s e Inteligencia Artificial. Solamente YouTube tuvo cerca de 2.000 millones de usuarios en todo el mundo para finales del 2020, además, se subían un promedio de 500 horas de videos cada minuto según datos del portal statista.com, y para finales del 2021 se estiman cerca de 1.000 millones de cámaras de videovigilancia en funcionamiento en todo el mundo según IHS Markit.
En los sistemas de video vigilancia las cámaras están pasando de ser simples dispositivos generadores de imágenes a convertirse en poderosos sensores inteligentes, que podrán procesar imágenes bien sea en el borde o en un servidor central y al mismo tiempo, proveerán información valiosa para los usuarios donde el video y sus metadatos, se puedan utilizar en múltiples aplicaciones.
Los sistemas de video vigilancia basados en IA , permiten procesar grandes cantidades de imágenes rápidamente sin cesar, a diferencia de lo que puede hacer un operador de video vigilancia; sin embargo, sería un mal entendido pensar que las soluciones de IA reemplazarán el ser humano, pues la verdadera fortaleza radica en una combinación realista donde la IA sea una herramienta para aumentar la eficiencia de un operador humano, o lo que algunos autores han denominado, como Inteligencia Aumentada, refiriéndose justamente a la IA como una herramienta para ampliar las capacidades del hombre, ayudándolo a ser más rápido e inteligente en las tareas que realiza.
Para ilustrar la comprensión de la Inteligencia Aumentada a través de la Inteligencia Artificial, podemos citar ejemplos concretos como:
- Detección de intrusión: Diferenciación de humanos vs animales, árboles y otros objetos.
- Análisis de tráfico: Detección de placas y clasificación de vehículos por marcas, colores, categoría del vehículo.
- Identificación de personas: Reconocimiento facial, clasificación por edad, género, color de ropa.
Aclaremos lo conceptos de la IA
La Inteligencia Artificial es un concepto asociado con máquinas que pueden resolver tareas complejas que normalmente requieren la inteligencia humana, y que a su vez, posee dos subconjuntos que definen los alcances de las tecnologías de IA que vemos disponibles en los sistemas de videovigilancia actuales. Dado que son términos comunes en esta megatendencia es importante poder diferenciar ambos conceptos:
Machine Learning
Los algoritmos de machine learning (ML) son algoritmos matemáticos que permiten a las máquinas aprender imitando la forma en la que lo hacemos los humanos. El ML es básicamente una forma de conseguir Inteligencia Artificial.
Fig. 3 - Ilustración de Inteligencia Artificial basada en algoritmos de Machine Learning.
En concreto, para las aplicaciones de video vigilancia, podríamos ilustrar basado en la imagen de la fig.3, con la habilidad de un sistema de video para reconocer personas u objetos como vehículos, y diferenciarlos de otros elementos como animales, cambios de luz o movimientos de árboles, que, en los sistemas tradicionales generan una gran cantidad de falsas alarmas y grabación de eventos que no son relevantes para el operador, ocupando más espacio en el disco duro y haciendo más difícil la labor del operador al momento de buscar un evento. A diferencia de un sistema de video basado en un algoritmo de ML, que permite poder reconocer movimientos ocasionados por personas y/o vehículos logrando una búsqueda más rápida, optimizando el disco duro y usando los metadatos de las imágenes para análisis de tendencias posteriormente.
Deep Learning
El deep learning (DL) o aprendizaje profundo, forma parte del aprendizaje automático, de hecho, se puede describir como la nueva evolución del machine learning; se trata de un algoritmo automático que imita la percepción humana inspirada en nuestro cerebro y la conexión entre neuronas. El DL es la técnica que más se acerca a la forma en la que aprendemos los humanos.
La mayoría de los métodos de deep learning usan arquitectura de redes neuronales. Es por eso por lo que a menudo se conoce al deep learning como “redes neuronales profundas” o “deep neural networks”, que se le conoce como “deep” en referencia a las capas que tienen estas redes neuronales.
Fig. 4 - Ilustración de Inteligencia Artificial basada en algoritmos de Deep Learning.
Para las aplicaciones de videovigilancia, podríamos ilustrar basado en la imagen de la fig.4, que una aplicación de un sistema de video con DL, además de diferenciar en una escena entre personas y vehículos, puede darnos información más en detalle sobre estos como por ejemplo, diferenciar si un vehículo se puede clasificar como un carro, bus, camion, moto, o en el caso de las personas, clasificarlas por atributos como edad, género, accesorios de vestir y muchos más criterios que hacen la búsqueda más amigable para el operador y puedan generar reportes posteriores para el análisis del mismo.
El mercado de la Inteligencia Artificial en el sector de la video vigilancia de la mano de Lince Comercial
En Lince Comercial hemos entendido que la IA es una tendencia que viene transformando el mercado de la videovigilancia. Esta tecnología para el 2019 representó el 56% de las ventas del negocio de productos de seguridad electrónica y es por esto que a continuación describimos brevemente la propuesta de cada uno de nuestros partners en términos de sus ofertas de IA.
AXIS COMMUNICATIONS
AXIS Object Analytics viene preinstalado en cámaras de red de Axis compatibles y ofrece vigilancia inteligente sin coste adicional. Mediante algoritmos inteligentes basados en Machine Learning y Deep Learning, elimina la mayoría de las fuentes de costosas falsas alarmas, como vegetación movida por el viento, objetos pequeños en movimiento o las sombras que se mueven rápidamente sobre el suelo. AXIS Object Analytics viene preinstalado en cámaras de red de Axis compatibles y ofrece vigilancia inteligente sin coste adicional.
Fig. 5 - Ilustración de las funciones de clasificación y detección de objetos basadas en IA – AXIS Object Analytics.
BCD VIDEO
Con su línea de productos VSS ( Video Storage Solutions), BCD Video creó en el 2019 una línea de dispositivos de video de alto rendimiento, pre diseñados para soportar la exigente carga de trabajo que representan en términos de velocidad de escritura, manejo de altos volúmenes de datos y análisis de datos de video mediante poderosas GPU´s tipo NVIDIA TESLA T4 . Estos dispositivos tales como servidores de grabación, estaciones de trabajo y servidores de análisis de video, pueden soportar las aplicaciones de partners de Lince Comercial tales como AXIS, MILESTONE, AGENT VI.
Fig. 6 - Ilustración de las líneas de servidores de grabación de VSS en versión de montaje tipo RACK o tipo torre.
DAHUA TECHNOLOGY
Con sus dos líneas de productos WizSense y WizMind, Dahua simplifica el proceso de selección de sus productos basados en Inteligencia Artificial. En el caso de WiZsense, se trata de un potente chip de IA y un algoritmo de aprendizaje profundo que permite a los clientes centrarse en los seres humanos y los vehículos sin tener en cuenta datos irrelevantes como mascotas, animales, escombros y condiciones climáticas externas. En el caso de WizeMind, se trata de una línea de gama alta basada en un potente chip de IA y algoritmos de aprendizaje profundo que proporcionan soluciones integrales orientadas a las personas que incluyen protección de privacidad, metadatos de video enfocados en humanos, conteo de personas, mapas de calor y muchas más funciones.
Fig. 7 - Ilustración de la función SMD 3.0 de la tecnología Wizsense de DAHUA TECNOLOGY enfocada en diferencia humanos y vehículos.
HANWHA TECHWIN
A través de la serie Wisenet P/X, Hanwha Techwin incluye funciones de IA, tales como detección de personas, vehículos y reconocimiento de placas. Además, diferencia atributos en personas tales como, color de la ropa, o descripciones detalladas como accesorios, edad, género; y en el caso de vehículos, tipo de vehículo, color y placa.
Fig. 8 - Ilustración sobre la compatibilidad de las cámaras de inteligencia artificial de la serie Wisenet P con el software de gestión de vídeo (VMS) Wisenet SSM.
MILESTONE SYSTEMS
Bajo su concepto de plataforma abierta, Milestone Systems está desempeñando un papel de liderazgo permitiendo que toda su comunidad de socios puedan conectar sus tecnologías basadas en IA al VMS de Milestone.
Fig. 9 - Ejemplo de Plugin de reconocimiento facial Dahua para Milestone VMS.
NEURAL LABS
Con sus aplicaciones basadas en redes neuronales, Neural Labs ofrece una variedad de soluciones de AI aplicadas a control de acceso, peajes, estacionamiento, logística, tráfico y movilidad.
Fig. 10 - Software de reconocimiento vehicular Neural Server, combina tecnología neuronal e inteligencia artificial, para desarrollar analíticas de tráfico de manera eficiente y rápida en cualquier escenario.
Agent VI
A través de su línea de productos innoVi, Agent VI proporciona una suite de productos Innovi Remote Guarding, Investigation y Enterprise, proporcionando un amplio conjunto de capacidades de análisis de video sofisticadas, como la detección en tiempo real de eventos de interés, búsqueda rápida, análisis de video grabador y extracción de datos estadísticos. Disponible en versión en la nube SaaS o como software local.
innoVi™ se basa en una arquitectura IoT de 5 niveles:
Sensores (cámaras), dispositivos inteligentes en el borde – innoVi EdgeTM , Red, Middleware- innoVi CoreTM, usando aplicaciones frontales – innoVi PortalTM o aplicaciones de terceros
Fig. 11 - Arquitectura de funcionamiento de InnoVi™.
¿En qué segmentos tendrá mayor impacto la IA?
En el avance de la IA en la industria de la videovigilancia, están involucrados tanto los fabricantes de productos de borde como las cámaras como Axis, Dahua y Hanwha, los fabricantes de grabadores, VMS, Analíticas como Milestone, Agent VI y los fabricantes de GPU´s como NVIDIA y su propuesta NVIDIA Metropolis, que habilita un conjunto de herramientas de desarrollo que le permite a otros fabricantes aprovechar el poder de la IA proveniente del procesamiento de imágenes de video en aplicaciones tales como:
- Seguridad pública
- Salud y Hospitales
- Seguridad en el trabajo
- Infraestructura crítica
- Comercio minorista
- Administración del Tráfico
- Seguridad de campus
- Seguridad en Aeropuertos
- Parqueaderos
- Procesamiento de materiales de desperdicios
Desafíos
Ante un mercado en expansión donde la oferta tecnológica se renueva constantemente y la innovación en los productos y las funciones de la IA son tan veloces, los clientes finales, los integradores y los mayoristas tienen varios desafíos que resolver tales como:
Ciberseguridad: La proliferación de dispositivos inteligentes en nuestros edificios aporta enormes beneficios para los propietarios y ocupantes, pero también aumenta la vulnerabilidad a los ciberataques. Cada endpoint digital crea un riesgo cibernético, así que a medida que avanzamos con la digitalización de edificios, también debemos avanzar con una ciberseguridad más inteligente. A medida que aumentan estos dispositivos inteligentes como lo son ahora las cámaras con IA, aumenta el riesgo de ciberataques. Estas son algunas buenas prácticas para evitar los ciberataques:
- Actualización de firmware
- Cifrados de comunicación entre los diferentes dispositivos
- Algoritmos de protección contra intentos de contraseñas
- Deshabilitar los puertos sin uso
- Encriptación HTTPS en las cámaras para la comunicación con el servidor de grabación
- Separación de las redes video vigilancia de los otros servicios creando una VLAN que aísle el tráfico de video sobre otros servicios.
- Uso de VPN encriptadas para accesos remotos, etc.
Instalación: La ubicación de una cámara debe considerarse cuidadosamente antes de su implementación para que el análisis de video pueda funcionar como se espera. Con el fin de brindar una buena experiencia, aspectos como la calidad de imagen, el uso de iluminadores IR, las condiciones del clima, la distancia de detección, las propiedades de los objetos (color, el brillo y el mismo hardware de la cámara) deben cumplir con las expectativas de calidad esperadas de una aplicación basada en IA.
Mantenimiento: Para el adecuado funcionamiento de las analíticas de video basadas en IA es muy importante el mantenimiento de la instalación, pues elementos como telarañas, polvo, cambios en la escena, entre otros, pueden afectar el desempeño y la precisión de la analítica de video.
Múltiples tecnologías: Como cada fabricante desarrolla múltiples tecnologías que pueden resolver los desafíos de diferentes escenarios o aplicaciones, ocurre que tanto los canales integradores como los clientes finales tienen el desafío de escoger marcas y fabricantes que respondan a sus necesidades presentes y futuras. En ese orden de ideas, la elección de una solución end-to-end desarrollada por un solo fabricante ( Axis, Dahua Hanwha), o una solución multimarca de plataforma abierta ( Milestone Agen VI), dependerá no solo del presupuesto sino de las necesidades futuras que el integrador y el cliente final puedan identificar para su instalación.
El “Big Bang Digital” es una realidad gracias al video y el impulso de la IA. Según proyecciones de IHS Markit, para el 2021 tendremos cerca de 1000 millones de cámaras en funcionamiento en todo el mundo y la gran mayoría de los fabricantes ya incluyen en su oferta productos basados en IA. Por lo que podemos concluir, que recién estamos iniciando el viaje hacia el mundo de posibilidades que ofrece la IA utilizando las imágenes provenientes de los más de 1000 millones de sensores de imagen desplegados en toda la tierra.
¿Más Información?
¿Le interesa más información sobre algún producto mencionado en esta nota?
Le pondremos en contacto con un experto representante de marca quien lo ayudará.
Jose Francisco Diaz Lozano
Ingeniero electrónico con mas de 10 años de experiencia en venta consultiva en sistemas electrónicos de seguridad, análisis de tendencias y estrategias de introducción de marcas en diferentes canales.
Linkedin: www.linkedin.com/in/jose-francisco-diaz-lozano-09184546/
Solo usuarios registrados pueden realizar comentarios. Inicia sesión o Regístrate.