Apps para identificar razas de aves por su canto utilizando IA sin conexión

  • BirdNET y Merlin Bird ID utilizan redes neuronales para identificar cantos de más de 3.000 especies de aves.
  • BirdNET destaca por su espectrograma, opciones avanzadas y contribución a la ciencia ciudadana.
  • Merlin permite descargar paquetes regionales para usar reconocimiento de cantos y fotos sin conexión.
  • Herramientas visuales como iNaturalist o Google Lens complementan la identificación acústica de aves.

Apps para identificar razas de aves por su canto utilizando IA sin conexión

Si te gusta salir al campo con los prismáticos al cuello y cada dos por tres te preguntas qué pájaro está cantando sobre tu cabeza, las apps para identificar aves por su canto con inteligencia artificial se han convertido en una auténtica revolución. Hoy en día basta con sacar el móvil, grabar unos segundos de audio y dejar que un algoritmo haga el trabajo duro de comparación, análisis y propuesta de especies probables.

Ahora bien, no todas las aplicaciones funcionan igual ni ofrecen las mismas posibilidades, y mucho menos cuando hablamos de reconocer cantos de aves en lugares sin conexión a internet, como zonas remotas de montaña o selvas donde la cobertura brilla por su ausencia. En este artículo vamos a desgranar en profundidad qué ofrecen proyectos como BirdNET y Merlin Bird ID, cómo aprovechan la IA para escuchar a las aves, qué limitaciones tienen, qué datos recopilan y qué trucos conviene conocer para sacarles todo el jugo.

Cómo aprende una IA a reconocer aves por su canto

Detrás de estas apps hay algo más que magia: hablamos de redes neuronales entrenadas con miles de horas de grabaciones de aves procedentes de todo el mundo. En el caso de BirdNET, el proyecto está impulsado por el Laboratorio de Ornitología de Cornell (Cornell Lab of Ornithology) y la Universidad Tecnológica de Chemnitz, y su objetivo es que un ordenador pueda distinguir, a partir de un audio, entre más de 3.000 especies de aves comunes a escala global.

El proceso, simplificando mucho, consiste en transformar el audio en un espectrograma, es decir, una representación visual del sonido donde se ve cómo cambian las frecuencias a lo largo del tiempo. Esa “imagen sonora” es lo que la red neuronal analiza para detectar patrones característicos de cada especie, del mismo modo que nosotros somos capaces de reconocer un ruiseñor o un mirlo solo con escucharlos unas cuantas veces.

Para que la IA sea mínimamente fiable, hace falta alimentarla con grabaciones etiquetadas con la especie, la ubicación y la fecha. Estos datos permiten que el modelo aprenda no solo el canto en sí, sino también en qué regiones y épocas del año es más probable encontrar una determinada especie. Por ejemplo, que un gorrión común aparezca en una ciudad europea en primavera es algo bastante probable, mientras que una especie tropical en la misma ubicación tendría muchas papeletas de ser un error de identificación.

En paralelo al entrenamiento puro y duro del modelo, los desarrolladores ajustan parámetros como la sensibilidad de detección, el tratamiento del ruido de fondo, la forma de recortar los fragmentos a analizar o la integración con bases de datos externas como eBird. Todo esto repercute directamente en la experiencia del usuario cuando sale al campo y aprieta el botón de grabar.

BirdNET: inteligencia artificial al servicio de los observadores de aves

BirdNET se ha convertido en una de las apps de referencia para quienes quieren identificar aves por su canto de manera rápida y accesible. Lanzada en febrero de 2021, en muy poco tiempo se popularizó entre pajareros de todo el planeta y suma ya más de un millón de descargas solo en Google Play. Su combinación de sencillez, potencia y proyecto científico abierto la hace especialmente interesante.

Esta app funciona como la puerta de entrada al BirdNET research project, el proyecto de investigación que utiliza redes neuronales para clasificar cantos y llamadas. El usuario graba un sonido con el micrófono de su dispositivo Android o iOS y la app envía el fragmento a los servidores para comparar el patrón con su enorme base de datos de especies conocidas. A cambio, muestra una lista de aves probables y un indicador de confianza.

Más allá de ser una simple herramienta de identificación, BirdNET tiene una vertiente de ciencia ciudadana: al enviar grabaciones y observaciones, el usuario está contribuyendo a generar datos que luego pueden ser utilizados por investigadores en estudios ecológicos, análisis de distribución de especies o seguimiento de cambios en la biodiversidad.

Además, BirdNET está disponible de forma gratuita tanto en Android como en iOS, algo que ha facilitado que se use tanto por aficionados que dan sus primeros pasos con las aves como por ornitólogos experimentados que quieren una ayuda extra para revisar cantos complicados o para llevar un registro rápido de lo que oyen en el campo.

Interfaz y uso básico de BirdNET paso a paso

Una de las claves del éxito de BirdNET es que su manejo es bastante directo: no hace falta ser experto en sonido ni en tecnología para empezar a usarla. Nada más abrir la app, lo primero que solicita es acceso a la ubicación del dispositivo, algo fundamental para poder filtrar las especies probables según el lugar donde estés grabando.

En la pantalla principal aparece un espectrograma en tiempo real, que representa las frecuencias de los sonidos que el móvil está captando en ese momento. Debajo verás un botón de grabación y, normalmente, un botón de pausa. El flujo típico consiste en esperar a que el ave empiece a cantar, pulsar grabar y, cuando hayas capturado varias repeticiones del canto, detener la grabación.

Una vez has registrado el audio, BirdNET te permite seleccionar con el dedo el fragmento concreto que quieres analizar sobre el espectrograma. Esto es clave para centrarte en la parte donde se oye mejor el ave que te interesa y evitar ruidos o cantos de otras especies. Al marcar el segmento, la app ofrece dos opciones principales: analizar o guardar.

Si eliges la opción de analizar, el fragmento se envía a los servidores de BirdNET y, tras unos segundos, aparece el nombre de la especie más probable, junto con un indicador de qué tan fiable considera el sistema esa identificación. Si en el trozo de audio hay varias especies cantando, la app intenta listar todas las que es capaz de reconocer, cada una con su respectivo nivel de confianza.

La opción de guardar, en cambio, cobra protagonismo cuando estás en un lugar sin conexión o con una cobertura muy pobre. En ese caso, puedes almacenar el audio para revisarlo y analizarlo más tarde, una vez tengas internet, lo que encaja muy bien con salidas de campo a zonas remotas donde el móvil prácticamente se convierte en una cámara y una grabadora sin más.

En general, la aplicación se percibe como fluida, ligera y bastante estable, con un aspecto visual sencillo que no abruma con menús interminables. El diseño del espectrograma y la disposición de los botones invitan a experimentar sin miedo a “romper” nada, lo que anima a usarla en cualquier momento que escuches un canto interesante.

Funciones avanzadas y menú principal de BirdNET

Más allá de la pantalla principal, BirdNET esconde en su menú lateral (accesible desde las tres rayas horizontales de la esquina superior izquierda) una serie de apartados que permiten organizar mejor tus observaciones y ajustar la app a tu manera de trabajar en el campo.

En la sección Mostrar observaciones, puedes revisar todas las detecciones que has ido analizando con la app, etiquetadas con el nombre de la especie, la fecha y la ubicación aproximada. Esta función resulta especialmente útil para llevar un histórico de tus salidas o para recuperar un canto que te llamó la atención días atrás y que quieres escuchar de nuevo con calma.

Si deseas guardar una grabación fuera de la app, por ejemplo para editarla en un programa de audio o compartirla con otra persona, basta con abrir la observación que te interesa y utilizar el botón de compartir. De esta forma puedes exportar el archivo de audio a otras aplicaciones o enviarlo por correo, mensajería, etc.

Otro apartado interesante del menú es Explorar tu área. Aquí BirdNET combina la ubicación GPS de tu móvil con datos de portales como eBird para mostrar una lista de especies que es razonable encontrar a varios kilómetros a la redonda, siempre dentro del conjunto de aves que la app es capaz de identificar. En una zona concreta de los Andes occidentales de Colombia, por ejemplo, la app llega a listar más de 320 especies detectables.

Este listado orienta mucho cuando estás en un lugar nuevo y no conoces bien su avifauna: tener delante una lista de candidatas probables ayuda a entender por qué la app propone ciertas especies y otras no, y también sirve para aprender qué aves podrían estar cantando en esa región aunque todavía no las hayas escuchado en directo.

Ajustes de BirdNET: idioma, sensibilidad y espectrograma

Apps para identificar razas de aves por su canto utilizando IA sin conexión

Para quienes quieren ir un paso más allá y personalizar BirdNET, el menú de opciones adicionales permite toquetear varios parámetros clave. Estos ajustes influyen tanto en cómo ves la información en pantalla como en cómo se comporta el algoritmo de detección.

Por un lado, puedes cambiar los nombres comunes de las especies entre más de 20 idiomas. Esto es muy práctico si, por ejemplo, te mueves entre fuentes en inglés y español o quieres aprender la terminología local de un país en el que estás observando aves. El nombre científico sigue siendo el mismo, pero así puedes ver el nombre familiar que te resulte más cómodo.

En el apartado de selección de especies, la app deja escoger si quieres que el filtro de especies probables tenga en cuenta la ocurrencia semanal o anual. La opción semanal es más fina para reflejar migraciones y cambios rápidos en la presencia de ciertas aves, mientras que la anual es más genérica, algo parecido a una lista de especies que se pueden encontrar en la zona a lo largo de todo el año.

La sensibilidad de detección es otro control importante. Si la configuras muy alta, el algoritmo será capaz de detectar cantos más débiles pero también aumentan las posibilidades de que se cuele alguna especie de forma errónea. En cambio, una sensibilidad baja reduce falsos positivos pero puede dejar sin identificar aves que cantan más lejos o con poco volumen.

También puedes ajustar la fuente de entrada de audio según el dispositivo: micrófono estándar, audio sin procesar (RAW) o incluso canales asociados a reconocimiento de voz. La recomendación más habitual es usar la opción de audio no procesado, para evitar que el propio móvil aplique filtros de cancelación de ruido que podrían “comerse” parte del canto del ave.

En cuanto a la parte visual, BirdNET deja cambiar el color del espectrograma entre varias paletas (Viridis, Plasma, Magma, Parula, Jet, Gray, etc.), modificar la duración en segundos del espectrograma (de 10 a 30 s), tocar la ganancia de amplitud en un rango de -20 a 20 dB para que se escuchen mejor los sonidos suaves, configurar la frecuencia máxima entre 3 y 18 kHz y ajustar el contraste del espectrograma para resaltar más o menos las diferencias de color.

Además de estos controles, el menú principal incluye apartados como Tutorial, Privacidad y licencia, una opción para reclamar autoría (y que tu nombre se asocie a las observaciones que envías) y la sección Acerca de nosotros, donde se explica el proyecto y sus responsables.

Rendimiento de BirdNET en campo con aves colombianas

Donde realmente se ve el potencial de BirdNET es sobre el terreno, cuando lo pones a prueba en lugares con alta diversidad de aves y cantos muy variados, como ocurre en muchas regiones de Colombia. En salidas de campo en los Andes occidentales, la app ha demostrado manejarse muy bien con especies relativamente comunes y con cantos muy característicos.

Por ejemplo, la red neuronal suele reconocer sin demasiados problemas el canto de especies como el pechiamarillo (Myiozetetes cayanensis) o el turpial montañero (Icterus chrysater). También se defiende bien con llamados muy distintivos como el de la espatulilla común (Todirostrum cinereum) o el trogón collarejo (Trogon collaris), donde la forma y el ritmo del sonido son bastante peculiares.

Sin embargo, cuando entramos en grupos de aves con llamadas muy parecidas entre sí, como algunas tangaras, la cosa se complica. En estos casos no es raro que BirdNET cometa errores y proponga una especie distinta dentro del mismo grupo, algo que también le ocurre a muchos humanos cuando se enfrentan a cantos cortos y simples sin un contexto claro.

Las dificultades aumentan con especies que tienen una gran variación en su canto según la región o la población, como los cucaracheros del género Henicorhina. Los cambios en ritmo, tono y estructura dentro de la misma especie pueden llevar al modelo a confundirse. Además, hoy por hoy BirdNET todavía no cubre absolutamente todas las especies posibles ni todas las variantes de canto que se pueden encontrar en la naturaleza, algo lógico teniendo en cuenta la enorme diversidad de aves.

Pese a estas limitaciones, la experiencia general en campo es muy positiva: la app ofrece resultados útiles en muchos escenarios, ocupa poco espacio en el móvil y se integra bien en una jornada de observación sin necesidad de andar cambiando ajustes constantemente. Con cada actualización se van afinando las identificaciones y ampliando el repertorio de especies, por lo que su utilidad va en aumento.

Errores conocidos y aspectos a mejorar en BirdNET

Como cualquier herramienta compleja, BirdNET no se libra de ciertos bugs o errores puntuales. Uno relativamente habitual aparece al pulsar el botón Analizar, cuando la app devuelve un mensaje indicando que hay problemas con los servidores. Normalmente se trata de incidencias temporales que se arreglan al cabo de unos minutos o intentando el análisis más tarde.

Otro fallo que se ha observado en ocasiones es un cambio inesperado de la ubicación a un lugar completamente distinto (por ejemplo, saltar de Colombia a Canadá), lo que descoloca por completo la lista de especies que la app considera probables. Este error suele resolverse solo al poco tiempo, pero conviene estar atento a la ubicación que muestra BirdNET si de repente ves especies que no tienen nada que ver con el lugar donde estás.

Pese a todo, estos problemas no empañan la impresión general de una app bastante sólida para ser un proyecto científico en continua evolución. El equipo de desarrollo sigue puliendo detalles y, además, mantiene abierto el modelo en GitHub para que otros investigadores puedan aprovecharlo en proyectos de bioacústica, siempre y cuando cuenten con los conocimientos técnicos necesarios.

Entre las funciones que muchos usuarios echan de menos destaca la posibilidad de descargar modelos personalizados centrados en áreas geográficas concretas, algo similar a lo que hace hoy en día Merlin Bird ID con sus paquetes regionales. Esta opción permitiría usar BirdNET de manera más cómoda en lugares remotos con poca conexión, cargando previamente el modelo correspondiente a la zona de destino.

También se menciona a menudo la utilidad que tendría poder subir archivos de audio ya grabados y, además, ajustar manualmente la ubicación asociada a esos registros. Hay una versión web que permite analizar cantos, pero por ahora no resulta tan flexible a la hora de modificar coordenadas como muchos querrían.

Privacidad y datos que maneja la app BirdNET

En lo relativo a privacidad, el desarrollador de BirdNET (Stefan Kahl) describe en las tiendas oficiales qué tipos de datos pueden recopilarse y con qué fines, aunque es importante tener en cuenta que Apple no ha verificado de forma independiente esa información y remite a la política de privacidad detallada del desarrollador.

Según esa declaración, BirdNET puede recoger datos no asociados directamente con la identidad del usuario, es decir, información que no se vincula de forma personal a tu nombre o a una cuenta concreta. Estos datos se emplean exclusivamente para la funcionalidad de la app y suelen agruparse en varias categorías.

Por un lado está la ubicación precisa, necesaria para filtrar especies y elaborar listados de aves probables en tu alrededor. Sin la posición aproximada, la IA tendría que barajar muchísimas más posibilidades, con lo que aumentaría de forma notable el riesgo de identificaciones absurdas o poco realistas para tu región.

Por otro lado, se registran datos de audio relacionados con los cantos que envías a analizar. Estas grabaciones, además de servir para devolverte un resultado, ayudan a mejorar el modelo con el tiempo, especialmente cuando formas parte del programa de ciencia ciudadana y se utilizan en conjunto con otros millones de registros anónimos.

Finalmente, puede haber un identificador de usuario que permita distinguir entre diferentes dispositivos sin llegar a saber quién está detrás de cada uno. Esta información se maneja con fines técnicos y estadísticos, como analizar el uso de la app o detectar patrones de error, pero no pretende crear un perfil personal detallado del usuario.

Merlin Bird ID: el “Shazam” de las aves con uso sin conexión

Si hablamos de apps para identificar pájaros por su canto, es inevitable mencionar Merlin Bird ID, otra herramienta desarrollada también por el Laboratorio de Ornitología de Cornell. Merlin se ha ganado el apodo de “Shazam de las aves” porque su forma de funcionar le recuerda a mucha gente al famoso servicio de reconocimiento de canciones.

Merlin Bird ID ofrece tres vías principales para reconocer aves: por sonido, mediante fotografía o respondiendo a un cuestionario rápido sobre lo que estás viendo. La opción de sonido es la que más se parece a BirdNET: pulsas el botón de grabar, mantienes silencio alrededor para que el micrófono se centre en el canto y dejas que la app te proponga las especies que detecta en tiempo real.

Una vez que la app te sugiere una especie, puedes escuchar más grabaciones de ese ave para comparar si lo que se oye en tu entorno coincide o no con los ejemplos disponibles. Con especies como el ruiseñor común, el gorrión común o la oropéndola europea, la herramienta suele acertar bastante, aunque sus creadores insisten en que las identificaciones deben considerarse un punto de partida, no una verdad absoluta.

El modo de fotografía funciona de manera similar, pero en este caso lo que hace es analizar una imagen tomada con la cámara del móvil o seleccionada de la galería. Merlin compara la foto con su base de datos de imágenes y propone las aves más probables, ofreciendo además una breve ficha con la descripción, fotos adicionales y un mapa de distribución geográfica.

La tercera vía, basada en preguntas guiadas (color, tamaño, comportamiento, ubicación, fecha…), resulta especialmente útil para personas que empiezan desde cero y aún no se atreven a fiarse solo del oído o no han podido hacer una foto clara. Al ir descartando opciones, el sistema ofrece una lista de candidatas entre las que es más probable que aparezca “tu” ave.

Una de las grandes ventajas de Merlin es que permite descargar paquetes regionales de aves. Estos paquetes incluyen los cantos, llamadas, fotografías y descripciones de las especies más habituales de una zona concreta, de modo que, una vez descargados, se pueden utilizar incluso sin conexión a internet, algo clave cuando estás en la montaña o en áreas rurales con muy poca cobertura.

La identificación por imagen no es infalible, por supuesto: en pruebas reales ha llegado a reconocer correctamente especies tan distintas como un cormorán grande en Madrid o un pelícano de dorso rosado en Senegal, pero también ha dado respuestas curiosas, como considerar que no había ningún ave probable al intentar identificar la figura de un flamenco decorativo en un hotel de Las Vegas.

Otras herramientas de identificación visual: iNaturalist, Google Lens y Búsqueda Visual

Aunque este artículo se centra en apps que reconocen cantos de aves con IA, merece la pena mencionar brevemente otras herramientas que, si bien están más orientadas a la identificación visual, pueden complementar muy bien el trabajo con el oído.

iNaturalist nació en 2008 como proyecto universitario y hoy es una plataforma conjunta de la Academia de Ciencias de California y National Geographic. Su funcionamiento es sencillo: haces una foto de lo que quieres identificar (planta, animal, hongo…) y la subes a la app. El sistema sugiere especies posibles en función de la imagen y, además, dispone de una comunidad de expertos que ayudan a afinar las identificaciones.

La principal fortaleza de iNaturalist es que registra la fecha y ubicación de cada observación, contribuyendo a un mapa global de biodiversidad en tiempo real. Cada foto, desde la mariposa más rara hasta la hierba de un patio, puede acabar formando parte de repositorios científicos como GBIF, lo que convierte cada observación en un aporte útil para investigadores y conservacionistas.

En el universo Apple, la función Búsqueda Visual del iPhone añade un plus de comodidad para quienes no quieren instalar otra app. Cuando abres una foto en la app de Fotos y el sistema detecta elementos reconocibles (plantas, animales, monumentos, obras de arte…), aparece un icono específico en el botón de información, que puede ser una hoja, una huella o una “i” con estrellas según el contenido.

Al tocar ese icono, iOS muestra información resumida sobre la especie, imágenes similares y enlaces de referencia. En pruebas reales ha sido capaz de clavar la identificación de una Camellia japonica o de varias especies de mamíferos, incluidos perros concretos como un Border Collie y animales salvajes como jirafas y cebras.

En Android, el equivalente más conocido es Google Lens, que suele venir integrado en la app de Cámara de muchos móviles. Basta con hacer una foto, abrirla y pulsar el icono de Lens (un pequeño visor con un cuadrado en el centro). La herramienta escanea el objeto, lo compara con millones de imágenes y sugiere la especie o elemento que más se le parece, acompañando la propuesta de imágenes relacionadas y de una búsqueda rápida en Google.

En todos estos casos, la lógica es parecida: el sistema calcula la probabilidad de que la imagen coincida con distintas especies y muestra la que tiene mayor coincidencia. Si, por ejemplo, Lens encuentra un 95 % de parecido con un pastor alemán y un 5 % con un corgi, se quedará solo con la primera opción por considerarla la más plausible.

Combinadas con apps centradas en el sonido como BirdNET o Merlin, estas herramientas visuales ofrecen un ecosistema muy completo para naturalistas: puedes identificar por canto cuando no ves al animal, por foto cuando el ave se deja retratar, y además ir sumando tus registros a proyectos de ciencia ciudadana global.

En conjunto, estas aplicaciones basadas en inteligencia artificial han cambiado por completo la forma de relacionarnos con las aves que nos rodean. Ahora cualquiera puede salir al campo con el móvil y, en cuestión de segundos, obtener una pista bastante fiable sobre qué especie está cantando, aprender sus rasgos principales, consultar mapas de distribución y guardar la observación. Aunque todavía hay margen de mejora, especialmente en la identificación sin conexión total y en la precisión con cantos muy similares, el salto respecto a hace unos años es enorme y todo apunta a que la próxima oleada de actualizaciones seguirá refinando modelos, ampliando listados regionales y acercando aún más la ornitología a la gente de a pie.

6 aplicaciones para ser todo un experto en la identificación de aves
Artículo relacionado:
6 aplicaciones imprescindibles para identificar aves y convertirte en un experto ornitólogo