La tonalidad de piel es una característica subjetiva que puede ser percibida de manera diferente por las personas, lo que la hace complicada de anotar. Sin embargo, la capacidad de anotar la tonalidad de piel de manera confiable y precisa es muy importante en la visión por computadora, ya que se ha demostrado que los sistemas de visión por computadora tienen dificultades para detectar personas con tonos de piel más oscuros.
Problemas de detección en sistemas de visión por computadora
En 2018, el estudio Gender Shades destacó que los sistemas de visión por computadora tenían dificultades para detectar personas con tonos de piel más oscuros, y que su rendimiento era particularmente pobre para las mujeres con tonos de piel más oscuros. Este estudio resalta la importancia de que los investigadores y profesionales de la informática evalúen sus tecnologías en toda la gama de tonos de piel y en las intersecciones de identidades.
Anotación de la tonalidad de piel
Además de evaluar el rendimiento del modelo en la tonalidad de piel, la anotación de la tonalidad de piel permite a los investigadores medir la diversidad y la representación en los sistemas de recuperación de imágenes, la colección de conjuntos de datos y la generación de imágenes. Para todas estas aplicaciones, una colección de anotaciones de tonalidad de piel significativas e inclusivas es clave.
La escala Monk Skin Tone (MST)
El equipo de Tecnología Centrada en el Ser Humano y AI Responsable de Google Research se asoció con el Dr. Ellis Monk para lanzar públicamente la escala Monk Skin Tone (MST), una escala de tonalidad de piel que captura una amplia gama de tonos de piel. En comparación con una escala estándar de la industria como la Escala de Tipo de Piel Fitzpatrick diseñada para uso dermatológico, la MST ofrece una representación más inclusiva en toda la gama de tonos de piel y fue diseñada para una amplia gama de aplicaciones, incluyendo la visión por computadora.
Conjunto de datos MST-E
El conjunto de datos MST-E contiene 1.515 imágenes y 31 videos de 19 sujetos que abarcan la escala MST de 10 puntos, donde los sujetos e imágenes fueron obtenidos a través de TONL, una compañía de fotografía enfocada en la diversidad. El objetivo principal de este conjunto de datos es permitir que los profesionales capaciten a sus anotadores humanos y prueben anotaciones de tonalidad de piel consistentes en diversas condiciones de captura de entorno.
Desafíos para formar un consenso de anotaciones MST
Aunque la tonalidad de piel es fácil de ver para una persona, puede ser difícil de anotar sistemáticamente en múltiples personas debido a problemas con la tecnología y la complejidad de la percepción social humana. En el lado técnico, cosas como la pixelación, las condiciones de iluminación de una imagen o la configuración del monitor de una persona pueden afectar cómo se muestra la tonalidad de piel en una pantalla. En el lado de la percepción social, aspectos de la vida de una persona como su ubicación, cultura y experiencia vivida pueden afectar cómo anotan las diferentes tonalidades de piel.
Nuestro análisis
Es importante que los investigadores y profesionales de la informática evalúen sus tecnologías en toda la gama de tonos de piel y en las intersecciones de identidades. La escala MST y el conjunto de datos MST-E son herramientas valiosas para lograr una anotación de tonalidad de piel más inclusiva y significativa. Además, es importante tener en cuenta los desafíos técnicos y sociales al anotar la tonalidad de piel y trabajar para formar un consenso en la anotación de la tonalidad de piel.
Referencias.-
- [con]Neurona #18 - 24 de junio de 2023
- Snowflake en conversaciones avanzadas para adquirir la startup de búsqueda de inteligencia artificial Neeva - 18 de mayo de 2023
- La importancia de la anotación de la tonalidad de piel en la visión por computadora - 16 de mayo de 2023