Investigadores del buscador mostraron la parte creativa del proceso de reconocimiento de imágenes.
Las capacidades de la inteligencia artificial detrás de los reconocimiento de imagen sorprenden cada vez más por sus aciertos. Sin embargo, en sus confusiones también tienen mucho con lo que asombrarse.
En una publicación en el blog de investigadores de Google, los encargados de trabajar con la inteligencia artificial compartieron las imágenes que resultan del proceso en el que se procesan las fotografías. La herramienta, conocida como red neuronal, utiliza métodos matemáticos para clasificar a los objetos que aparecen en las imágenes y, a modo de entrenamiento, los investigadores le hacen analizar cientos de fotos para que aprenda a hacerlo bien.
A cada imagen se la hace pasar por un proceso en el que diferentes neuronas artificiales van estudiándola por capas. Pueden ser entre 10 y 30 y cuanto más alta sea la capa, más específico es el resultado que da. Primero reconoce el objeto, luego lo va resaltando y al final, en la última capa, es cuando se ve definido qué es lo que interpretó.
"Por ejemplo, la primera capa puede buscar por los bordes o esquinas de los elementos de la fotografía. Las capas intermedias interpretan las características básicas para encontrar formas o componentes, como una puerta o una hoja. Las últimas capas los arman en una interpretación completa –estas neuronas se activan en respuesta a objetos complejos como edificios enteros o árboles", explicaron los investigadores.
En su proceso de aprendizaje, a veces cometen errores, como en esta imagen en la que se ve un caballero medieval y la herramienta procesó cabezas de osos.
Los resultados oníricos de la inteligencia artificial son incluso capaces de encontrar patrones donde no los hay, como en esta imagen que solamente tiene ruido. "Aquí hay una sorpresa: las redes neuronales que fueron entrenadas para discriminar entre diferentes tipos de imágenes tienen algo de la información que se necesita para generar imágenes también", publicaron los investigadores.
Cuando las capas con que trabaja esta herramienta son las más sofisticadas, esas que detectan características más específicas, el resultado son patrones más interesantes. "Solamente le damos una imagen existente a nuestra red neuronal", publicaron. "Eso crea un bucle de retroalimentación: si una nube se parece a un pájaro, la red va a hacer que se vea cada vez más como un pájaro al punto en que, de la nada, aparecerá un ave bien detallada".
Como en este ejemplo, en que la herramienta creó figuras de animales en una foto de un cielo con nubes: