La visión por ordenador ayuda a automatizar muchas tareas clave en la tienda, pero para que esto funcione, debe dar prioridad a una alta precisión en el reconocimiento de imágenes como primera línea de diferenciación.
En el mercado minorista actual, vertiginoso e hipercompetitivo, la mayoría de los fabricantes y minoristas no disponen de una visibilidad precisa y oportuna de las estanterías ni de información procesable sobre su realidad minorista en la tienda. Las auditorías manuales realizadas por el personal de ventas que documenta las condiciones de los lineales en un dispositivo portátil son lentas, caras, incoherentes y dan como resultado datos subjetivos.
Las soluciones de visión por ordenador (CV) están cambiando la forma en que las marcas y los minoristas ven los lineales. Esta tecnología ofrece a los fabricantes información sobre las condiciones de los lineales en forma de imagen digital y orienta al personal de campo casi en tiempo real sobre cómo generar más valor.
Pero para que esto funcione, debe dar prioridad a una alta precisión en el reconocimiento de imágenes como primera línea de diferenciación. En este artículo, nos adentraremos entre bastidores para ver qué se necesita para ofrecer un reconocimiento preciso a nivel de SKU a velocidad y escala.
Por qué es importante la precisión
En una tienda de comestibles típica, puede haber más de 30.000 SKU y una media del 30% de ellas puede cambiar a lo largo del año con la entrada de nuevos productos y el rediseño de los envases. Además de hacer frente al enorme volumen de productos, una plataforma de reconocimiento automatizado también debe superar otros obstáculos a la precisión en el entorno minorista, como:
- Productos casi idénticos
- Envases oscuros y reflectantes, y ángulos pobres
- Condiciones visuales deficientes, como poca luz
- Productos parcialmente obstruidos
- Cambios en el ciclo de vida del producto, como nuevas variantes de diseño
Pasarlos por alto puede dar lugar a datos inexactos; por ejemplo, un cálculo incorrecto de la cuota de una marca en el lineal debido a productos parcialmente obstruidos. Cuando estos datos poco fiables se utilizan para tomar decisiones de venta, las pérdidas económicas pueden aumentar rápidamente con el tiempo.
Un enfoque cuádruple para reforzar la precisión
En Trax, estos obstáculos se superan mediante un riguroso enfoque de aplicación de la calidad de los datos basado en las siguientes medidas:
- Enorme repositorio de datos de formación
La visión por ordenador utiliza redes neuronales avanzadas y técnicas de aprendizaje profundo para tareas como la detección de objetos. Se basa en la corteza visual humana, lo que significa que, al igual que el cerebro humano, cuanto más se ve, mejor se aprende.
Con un repositorio de imágenes suficientemente grande, los algoritmos avanzados de aprendizaje profundo superan los retos que plantean las condiciones de las tiendas, como la escasa iluminación y los obstáculos. Los sistemas más precisos son los que perciben el contexto de las estanterías y detectan rápidamente no solo los productos, sino también los espacios vacíos en las estanterías.
- Imágenes de alta calidad
Durante la captura, una herramienta de prevención del desenfoque garantiza que la imagen producida sea nítida, mientras que una herramienta de instantánea avisa al usuario si la orientación es diferente a la de una imagen anterior. Para compensar la falta de luz, el flash de la cámara se activa automáticamente, y una herramienta de nivelación integrada ayuda a alertar al usuario para que oriente sus dispositivos en el ángulo y a la distancia perfectos de la estantería.
- Validación multicapa
Un motor de aprendizaje activo garantiza el reconocimiento automático de los productos a partir de las imágenes. Las muestras de imágenes en las que es más difícil reconocer o distinguir productos pasan por una capa adicional de validación con un proceso conocido como votación. En él, expertos cualificados en la materia validan los datos recogidos para comprobar si coinciden exactamente con lo que realmente aparece en la imagen. Esto significa que el sistema siempre establece niveles extremadamente altos de "confianza" en su precisión de reconocimiento, incluso en el caso de productos idénticos o nuevos diseños.
- Medición de la precisión del reconocimiento
La precisión es la base de los sistemas de aprendizaje profundo más avanzados. Esto significa que los algoritmos devuelven muchos más resultados relevantes que irrelevantes. Al mismo tiempo, debe devolver la mayoría de los resultados relevantes. Digamos que hay 100 productos en una estantería. Un algoritmo puede reconocer 80 de ellos, de los cuales 77 se reconocen con precisión. Esto significa que la precisión del reconocimiento es del 96%.
Trax garantiza la transparencia de los datos proporcionando a los usuarios paneles de control en la web que describen la precisión del rendimiento del reconocimiento, la confianza, los productos no identificados y otras métricas.
Eche un vistazo a este vídeo de la plataforma de visión por ordenador Trax en acción para ver cómo convertimos las imágenes en información con precisión.