Contexto :
Para inaugurar nuestra serie de artículos del Lixo Journal Club, hemos elegido presentar el artículo ZeroWaste: Toward Automated Waste Recycling de Bashkirova et al., que se presentó en la 2022 Conference on Computer Vision and Pattern recognition.
Este es un tipo especial de artículo, ya que no mejora una nueva arquitectura o cálculo de pérdidas, sino que publica un nuevo conjunto de datos para detectar y segmentar objetos en imágenes de instalaciones de gestión de residuos.
¿Por qué hemos elegido este artículo?
El conjunto de datos ZeroWaste es el primero de libre acceso que proporciona imágenes de instalaciones de clasificación, en particular de una cinta transportadora que contiene papel ("fibroso" en la jerga del sector). Estas imágenes son diferentes de las de conjuntos de datos conocidos como COCO o PASCAL VOC.
Los objetos de la imagen están muy distorsionados, dentados, superpuestos y entrelazados. También presentan una enorme variedad de colores y formas, una variedad que aumenta constantemente a medida que salen al mercado nuevos productos y envases cada día.
En consecuencia, este tipo de conjunto de datos presenta un importante problema de infrarrepresentación de determinadas clases. Además, su anotación es extremadamente lenta y técnica, hasta el punto de requerir la supervisión de expertos del sector de los residuos.
Por todas estas razones, estas imágenes etiquetadas son extremadamente valiosas, ya sea para mejorar un modelo existente o para probar nuevas ideas específicas.
¿En qué sentido es innovador?
El principal objetivo de este artículo es proporcionar un conjunto de datos para que los investigadores aborden los problemas de los centros de clasificación y desarrollen nuevos algoritmos para superar estos retos.
En su artículo, publican:
- un conjunto de datos totalmente etiquetados;
- un conjunto de datos sin etiquetar para el aprendizaje semisupervisado;
- un conjunto de datos enriquecido con objetos de TACO (Trash Annotation in COntext) para combatir el desequilibrio de clases.
El documento también proporciona una línea de base para la segmentación de instancias utilizando Mask-RCNN, TridentNet y DeepLabV3+.
¿Cuáles son sus límites?
Captura de imágenes
Sus modelos luchan por alcanzar el rendimiento que vemos en los artículos habituales sobre detección de objetos o segmentación de instancias. Tampoco alcanzan el rendimiento que vemos en un transportador similar. Una posible explicación es el protocolo de captura de imágenes que utilizan.
En Lixo, utilizamos una cámara más cerca del transportador con una luz más brillante para reducir el desenfoque y mejorar la calidad de la imagen. Creemos que el algoritmo de eliminación del desenfoque (SRN-Deblur) y la eliminación del ojo de pez que tuvieron que implementar para obtener sus imágenes finales disminuyen la calidad de la imagen. Estas transformaciones son la causa de la disminución del rendimiento del modelo en objetos pequeños.
Taxonomía
La segunda gran limitación es la taxonomía de clases utilizada. Desde el punto de vista de un profesional de la gestión de residuos, sería demasiado limitada: no hay suficientes clases para clasificar con precisión un flujo de residuos. En Lixo, tenemos una taxonomía de clases mucho más detallada. Por ejemplo, distinguimos cada plástico en función de su resina (PET transparente, PET coloreado, HDPE, etc.) para hacernos una idea real de la calidad del residuo y de su valor de recuperación.
Conclusión
En conclusión, nos parece estupendo que los investigadores universitarios se interesen por la gestión de residuos, y estamos muy ilusionados por ver lo que pueden aportar a este campo.
Pero su planteamiento también demuestra lo importante que es adaptarse a las necesidades de los clientes. Los clientes del sector de la gestión de residuos no sólo quieren identificar "contaminantes", sino también conocer la proporción de contaminantes en un flujo determinado. Esta proporción, ya sea en % del número total de objetos o en % de la masa, requiere que se detecte el 100% de los objetos de la imagen.
Lixo destaca por ofrecer ambas cosas (identificación de contaminantes + material objetivo) a sus clientes, ¡y creemos que esto marca una gran diferencia en el análisis de flujos de residuos!
Para más información, pulse aquí:
- ZeroWaste dataset: Towards Deformable Object Segmentation in Cluttered Scenes, Dina Bashkirova, Mohamed Abdelfattah, Ziliang Zhu, James Akl, Fadi Alladkani, Ping HuVitaly Ablavsky, Berk Calli, Sarah Adel Bargal y Kate Saenko (2021)