9 de abril de 2020
 
Actualizado 16/05/2019 10:45:02 +00:00 CET

Un algoritmo permite a un robot imitar cómo escribe cualquier persona

Un algoritmo permite a un robot imitar cómo escribe cualquier persona
UNIVERSIDAD DE BROWN

   MADRID, 16 May. (EUROPA PRESS) -

   Científicos de la Universidad de Brown han desarrollado un algoritmo que permite que los robots dibujen y escriban usando patrones de trazo como los que distinguen a cada persona.

   "Con solo mirar la imagen de destino de una palabra o boceto, el robot puede reproducir cada trazo como una acción continua", explica Atsunobu Kotani, estudiante universitario de Brown que dirigió el desarrollo del algoritmo. "Eso hace que sea difícil para las personas distinguir si fue escrito por el robot o si fue escrito por un humano", añade.

   En un documento que se presentará en la Conferencia Internacional de Robótica y Automatización de este mes, los investigadores demostraron cómo un robot pudo escribir 'hola' en 10 idiomas que emplean diferentes conjuntos de caracteres, así como reproducir bocetos en bruto, incluyendo uno de la Mona Lisa.

   El algoritmo hace uso de redes de aprendizaje profundo que analizan imágenes de palabras escritas a mano o bocetos y pueden deducir la serie probable de trazos a lápiz que los creó. Luego, el robot puede reproducir las palabras o los bocetos con los trazos del lápiz que aprendió.

   Según destaca Stefanie Tellex, profesora asistente de ciencias de la computación en Brown y asesora de Kotani, lo que hace que este trabajo sea único es la capacidad del robot para aprender desde cero.

   "Gran parte del trabajo existente en esta área requiere que el robot tenga información sobre el orden de los trazos de antemano --explica Tellex en un comunicado--. Si quisiera que el robot escribiera algo, alguien tendría que programar cada vez las órdenes de los trazos. Con lo que Atsu ha hecho, puedes dibujar lo que quieras y el robot puede reproducirlo. No siempre hace el orden perfecto de los trazos, pero se acerca bastante".

   Otro aspecto notable del trabajo, según Tellex, es cómo el algoritmo es capaz de generalizar su capacidad para reproducir trazos. Kotani entrenó su algoritmo de aprendizaje profundo utilizando un conjunto de caracteres japoneses, y demostró que podía reproducir los caracteres y los trazos que los crearon con aproximadamente el 93% de precisión. Pero, para sorpresa de los investigadores, el algoritmo terminó reproduciendo tipos de caracteres muy diferentes que nunca había visto: letras en inglés y en cursiva, por ejemplo.

   "Nos hubiera gustado que solo hubiéramos aprendido los caracteres japoneses --comenta Tellex--. Pero una vez que comenzó a trabajar en inglés, nos sorprendió. Luego decidimos ver hasta dónde podríamos llegar".

   Tellex y Kotani pidieron a todos los que trabajan en el laboratorio de Humans to Robots de Tellex que escribieran 'hola' en sus idiomas nativos, que incluían griego, hindú, urdu, chino y yiddish, entre otros. El robot fue capaz de reproducirlos todos con una precisión de trazo razonable.

REPRODUCCIÓN DE UN BOCETO DE LA MONA LISA

   Pero la obra maestra del sistema puede que sea su copia del boceto que realizó Kotani de la Mona Lisa. Este dibujó un boceto en un tablero de borrado en seco en el laboratorio de Tellex y luego permitió que el robot lo copiara con bastante fidelidad en el mismo tablero, justo debajo del original de Kotani. "Cuando regresé al laboratorio, todos estaban de pie alrededor de la pizarra, mirando a la Mona Lisa y preguntándome si [el robot] dibujaba esto. No podían creerlo", asegura Kotani.

   Para el investigador, este fue el momento en que su robot definió "lo que está más allá de la mera impresión". Una impresora de inyección de tinta puede recrear una imagen, pero lo hace con un cabezal de impresión que se remonta a la construcción de la imagen línea por línea. Pero en esta ocasión, fue el robot el que creó una imagen con trazos parecidos a los humanos, lo que para Kotani es "algo mucho más humano y expresivo".

   La clave para hacer que el sistema funcione, según Kotani, es que el algoritmo utiliza dos modelos distintos de la imagen que está tratando de reproducir. Utilizando un modelo global que considera la imagen como un todo, el algoritmo identifica un punto de partida probable para realizar el primer trazo. Una vez que el trazo ha comenzado, el algoritmo se acerca, mirando la imagen píxel por píxel para determinar dónde debe ir ese trazo y cuánto tiempo debe durar. Cuando llega al final del trazo, el algoritmo vuelve a llamar al modelo global para determinar dónde debe comenzar el siguiente trazo, y luego regresa al modelo ampliado. Este proceso se repite hasta completar la imagen.

   Tanto Kotani como Tellex dicen que el trabajo supone un paso hacia una mejor comunicación entre personas y robots. En última instancia, visualizan robots que pueden dejar notas, tomar dictados o diagramas de boceto para sus compañeros de trabajo y colaboradores humanos.