La población de aves en todo el mundo está disminuyendo a una tasa alarmante, con aproximadamente el 48% de las especies de aves existentes conocidas o sospechosas de experimentar disminuciones en su población. Por ejemplo, Estados Unidos y Canadá han reportado un 29% menos de aves desde 1970.
La importancia del monitoreo efectivo de las poblaciones de aves
El monitoreo efectivo de las poblaciones de aves es esencial para el desarrollo de soluciones que promuevan la conservación. El monitoreo permite a los investigadores comprender mejor la gravedad del problema para poblaciones específicas de aves y evaluar si las intervenciones existentes están funcionando. Para escalar el monitoreo, los investigadores de aves han comenzado a analizar los ecosistemas de forma remota utilizando grabaciones de sonidos de aves en lugar de monitoreo acústico pasivo en persona. Los investigadores pueden recopilar miles de horas de audio con dispositivos de grabación remota y luego utilizar técnicas de aprendizaje automático (ML) para procesar los datos. Si bien esto es un desarrollo emocionante, los modelos de ML existentes tienen dificultades con los datos de audio de los ecosistemas tropicales debido a la mayor diversidad de especies de aves y los sonidos superpuestos de las aves.
La necesidad de datos de audio anotados de alta calidad
Se necesita datos de audio anotados para comprender la calidad del modelo en el mundo real. Sin embargo, la creación de conjuntos de datos anotados de alta calidad, especialmente para áreas con alta biodiversidad, puede ser costosa y tediosa, a menudo requiriendo decenas de horas de tiempo de analista experto para anotar una hora de audio. Además, los conjuntos de datos anotados existentes son raros y cubren solo una pequeña región geográfica, como Sapsucker Woods o la selva peruana. Miles de ecosistemas únicos en el mundo aún necesitan ser analizados.
La competencia de ML BirdCLEF 2023
En un esfuerzo por abordar este problema, durante los últimos 3 años, se han organizado competencias de ML en Kaggle en colaboración con organizaciones especializadas en ecologías de alto impacto. En cada competencia, se desafía a los participantes a construir modelos de ML que puedan tomar sonidos de un conjunto de datos específico de ecología e identificar con precisión las especies de aves por sonido. Las mejores entradas pueden entrenar clasificadores confiables con datos de entrenamiento limitados. La competencia del año pasado se centró en las especies de aves hawaianas, que son algunas de las más amenazadas del mundo.
Este año, se ha organizado la competencia de ML BirdCLEF 2023 en colaboración con el Centro de Bioacústica de Conservación K. Lisa Yang del Laboratorio de Ornitología de Cornell y NATURAL STATE, enfocada en las aves de Kenia. El premio total es de $50,000, la fecha límite de inscripción es el 17 de mayo de 2023 y la fecha límite de presentación final es el 24 de mayo de 2023. Consulte el sitio web de la competencia para obtener información detallada sobre el conjunto de datos a utilizar, los plazos y las reglas.
Kenia alberga más de 1,000 especies de aves, que cubren una amplia gama de ecosistemas, desde las sabanas del Maasai Mara hasta la selva tropical de Kakamega e incluso regiones alpinas en Kilimanjaro y el Monte Kenia. El seguimiento de este gran número de especies con ML puede ser desafiante, especialmente con datos de entrenamiento mínimos disponibles para muchas especies.
NATURAL STATE está trabajando en áreas piloto alrededor del norte del Monte Kenia para probar el efecto de varios regímenes de manejo y estados de degradación en la biodiversidad de aves en sistemas de pastizales. Al utilizar los algoritmos de ML desarrollados en el marco de esta competencia, NATURAL STATE podrá demostrar la eficacia de este enfoque en la medición del éxito y la rentabilidad de los proyectos de restauración. Además, la capacidad de monitorear de manera rentable el impacto de los esfuerzos de restauración en la biodiversidad permitirá a NATURAL STATE probar y construir algunos de los primeros mecanismos financieros enfocados en la biodiversidad para canalizar la inversión tan necesaria.
Referencias
- Cornell Lab of Ornithology. (2021). Bird Population Decline.
- Kaggle.BirdCLEF 2023 – Birdcall Identification. https://www.kaggle.com/c/birdclef-2023/overview
En Resumen
¿Cuántas especies de aves hay en Kenia y en qué ecosistemas se pueden encontrar?
En Kenia hay más de 1,000 especies de aves que se pueden encontrar en una amplia gama de ecosistemas, desde las sabanas de Maasai Mara hasta el bosque lluvioso de Kakamega, así como en regiones alpinas en Kilimanjaro y Monte Kenia.
¿Por qué es difícil rastrear la biodiversidad de aves en Kenia con ML?
Es difícil rastrear la biodiversidad de aves en Kenia con ML debido a la gran cantidad de especies de aves presentes en el país, que cubren una amplia gama de ecosistemas, desde las sabanas de Maasai Mara hasta el bosque lluvioso de Kakamega, y regiones alpinas en Kilimanjaro y Monte Kenia. Además, hay una cantidad limitada de datos de entrenamiento disponibles para muchas especies, lo que dificulta el uso de algoritmos de ML para rastrearlas. También es difícil crear conjuntos de datos anotados de alta calidad para áreas con alta biodiversidad, ya que esto puede ser costoso y tedioso, y a menudo requiere muchas horas de tiempo de análisis de expertos para anotar una sola hora de audio. Además, los modelos de ML existentes tienen dificultades para manejar datos de audio de ecosistemas tropicales debido a la mayor diversidad de especies de aves y la superposición de sonidos de aves.
¿Qué métrica se está utilizando en el concurso BirdCLEF de este año y por qué se eligió?
En el concurso BirdCLEF de este año se está utilizando la métrica de calidad de modelo sin umbral: precisión media promedio de clase. Esta métrica se eligió porque en competiciones anteriores se utilizó la puntuación F1, que requería elegir umbrales de detección específicos para los modelos, lo que requería un esfuerzo significativo y hacía difícil evaluar la calidad subyacente del modelo. La métrica de precisión media promedio de clase trata cada especie de ave como un clasificador binario separado para calcular una puntuación AUC promedio para cada una y luego promedia estas puntuaciones. Al cambiar a una métrica no calibrada, se aumenta el enfoque en la calidad central del modelo al eliminar la necesidad de elegir un umbral de detección específico.
- [con]Neurona #26 - 18 de diciembre de 2023
- [con]Neurona #25 - 10 de diciembre de 2023
- [con]Neurona #24 - 2 de diciembre de 2023