Un guau vale más que mil palabras. Tres investigadores demostraron que los ladridos y gruñidos de los perros esconden información para conocer sus emociones. La clave, por tanto, estaría más en los sonidos que emiten que en su forma de mover la cola. Y una herramienta basada en inteligencia artificial (IA) podría ser capaz de descifrar esos ruidos. Algo para nada sencillo.
Artem Abzaliev quiso afrontar el reto cuando era estudiante del doctorado en Informática e Ingeniería de la Universidad de Michigan. Su trabajo fue orientado por Radha Mihalcea, profesora colegiada de Ciencias de la Computación e Ingeniería en la misma universidad, y por Humberto Pérez Espinosa, colaborador del Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) en México. La investigación arrancó en 2015 y el año pasado los resultados fueron publicados en la revista de la Universidad de Cornell.
En el estudio participaron 74 perros de diferentes edades y sexos, principalmente de las razas chihuahua, poodle francés y schnauzer. Un equipo dirigido por Pérez Espinosa recopiló los ladridos al exponer a los animales a diversos estímulos en entornos controlados que involucraron a los dueños de las mascotas o a un experimentador.
La alegría o la rabia detrás de un ladrido
"El protocolo fue diseñado y validado por expertos en comportamiento animal. Se crearon situaciones emocionales mediante escenarios específicos, como tocar el timbre fuertemente, simular un ataque al dueño, hablar afectuosamente al perro, interactuar con juguetes, prepararse para un paseo o dejar al perro atado a un árbol", detalla a Crónica Pérez Espinosa.

La vasca "médium animal" que dice hablar con perros, y curarlos, con telepatía y a distancia

Nuestra hija Aitana, la primera modelo de IA española que gana..."4.000 euros al mes"
Las reacciones de los perros a esos estímulos fueron grabadas y segmentadas para nutrir una base de datos. La información recopilada permitió entrenar herramientas de IA para la clasificación y decodificación de las vocalizaciones caninas. Para ello, partieron de un modelo de representación de voz creado por Meta. Su nombre es Wav2Vec2 y fue entrenado con 960 horas de datos de voz humana.
Al no contar con una herramienta previa que constituyera una fuente de datos perruna, se valieron de Wav2Vec2. "Ajustamos este modelo en un nuevo conjunto de datos de vocalizaciones caninas. Se probaron dos enfoques: un modelo entrenado desde cero usando solo ladridos de perros y otro previamente entrenado en habla humana y luego ajustado con vocalizaciones caninas", explica el investigador del INAOE.
Descubrieron que el mejor enfoque era el segundo, así lo detalla el mexicano: "Nuestro estudio demuestra que Wav2Vec2, originalmente entrenado en habla humana, supera a los modelos entrenados desde cero en tareas como reconocimiento de perros e identificación de raza", señala Pérez Espinosa. Además, "mejora la contextualización, permitiendo que el modelo asocie mejor los ladridos con sus significados situacionales. Las técnicas de procesamiento del habla humana pueden adaptarse eficazmente para comprender la comunicación animal".
De esta manera, el equipo sacó provecho de las tecnologías de voz existentes, como la conversión de voz a texto y la traducción. Para su funcionamiento, esas herramientas permiten distinguir matices en la voz -como el acento, el timbre y el tono- para transformar esos datos en unos que el ordenador pueda descifrar. Así, por ejemplo, la tecnología es capaz de identificar las palabras que se dicen y reconocer a la persona que habla.
El hecho de que partieran de la tecnología de reconocimiento de emociones en las personas, continúa Pérez Espinosa, "permitió explorar paralelismos entre las expresiones vocales humanas y caninas, y desarrollar una metodología más estructurada para interpretar las emociones de los perros a través de sus vocalizaciones".
En conclusión, el estudio demostró que se puede obtener información valiosa del ladrido de un perro. "Es posible predecir la raza de un perro basándose en sus vocalizaciones... Además, se puede identificar el contexto del ladrido, vinculando las vocalizaciones con situaciones específicas, como ladridos agresivos o normales hacia un extraño", ejemplifica el experto mexicano. También recuerda que se pueden obtener datos como el sexo y la edad. Lo más importante es que esta investigación es el punto de partida para entrenar nuevos sistemas enfocados en la comunicación animal.
Aunque los hallazgos son prometedores, el investigador del INAOE aclara que "comprender las emociones caninas requiere considerar factores adicionales", como el "lenguaje corporal y señales visuales (movimientos de la cola y expresiones faciales), señales químicas y táctiles, datos fisiológicos (ritmo cardíaco y niveles de cortisol) y el contexto conductual (interacciones con humanos u otros perros)".
Pérez Espinosa resalta que "los modelos de IA podrían entrenarse para inferir estados emocionales como estrés, ansiedad o excitación basándose en patrones acústicos". A su vez, "la IA podría ayudar a detectar problemas de salud, identificando anomalías vocales relacionadas con el dolor o afecciones respiratorias". Esta investigación tiene el modesto potencial de mejorar la vida de los animales, ayudando a sus cuidadores a comprender su estado emocional y sus necesidades.