MADRID, 18 Nov. (Portaltic) -
Ayer un grupo de investigadores de Google sorprendían en el blog de desarrollo de la compañía con una entrada que empezaba con las descripciones de unas imágenes. En principio no es nada sorprendente, pero lo realmente impactante es que las descripciones las haya generado un 'software'.
Los investigadores destacan lo complicado que es para un ser humano sintetizar una imagen en una descripción escrita de pocas palabras, por lo que consideran más complejo programar una maquina para que lo haga. Aun así, según la información que facilitan están cada vez mas cerca de conseguirlo y facilitar la navegación de la gente con problemas de visión o simplemente facilitar la búsqueda de imágenes.
Los principales avances que han conseguido residen en los sistemas de detección de objetos, clasificación y etiquetado. Queda mucho trabajo por hacer para que el software sea capaz de analizar imágenes más complejas, sobre todo a nivel de relacionar los diferente objetos y la composición de la imagen.
La idea que surgió de los recientes avances de la máquina traductora donde la Recurrent Neural Network (RNN), consiguió traducir con éxito una frase del francés al alemán. Aunque el desarrollo del software se encuentre en un estadio temprano, habrá que seguir el trabajo de los científicos de Google para comprobar si son capaces de transformar las imágenes en palabras.