Google detalla el funcionamiento de su sistema de comunicación 3D basado en la telepresencia

Concepto de proyecto Starline
Concepto de proyecto Starline - GOOGLE RESEARCH
Publicado: jueves, 2 diciembre 2021 16:15

   MADRID, 2 Dic. (EUROPA Portaltic/EP) -

   Los investigadores de Google han compartido los avances que han hecho con el proyecto Starline, un sistema de comunicación tridimensional de telepresencia, que todvía tiene que resolver retos en la captura de imagen, la proyección y la sensación de copresencia.

   Google anunció el proyecto Starline en la última conferencia de desarrolladores Google I/O, un sistema de comunicación que apuesta por la telepresencia, es decir, que los dos participantes en una conversación sientan que están junto al otro, de forma física, pese a la distancia gracias a la tecnología 3D.

   Este sistema sigue en desarrollo, como refiere el documento publicado por Google Research, en el que señalan que todavía tienen que resolver tres problemas: capturar y renderizar la imagen en 3D de la persona en remoto de forma realista, crear una proyección de gran resolución con la que el usuario se sienta cómodo y conseguir la copresencia, que incluye proximidad, contacto visual e interacción.

   "La telepresencia presenta enormes oportunidades para reunir organizaciones y grupos sociales cada vez más distribuidos en el mundo", aseguran los responsables de este proyecto. En comparación con los sistemas en 2D, quienes han participado en los estudios han señalado que el sistema 3D es "significativamente mejor para fomentar varios elementos de comunicación, incluida la presencia, la atención, la medición de reacciones, el contacto visual, el compromiso y la conexión personal".

   Los investigadores también indican que los participantes "recordaron más reuniones y demostraron más comportamientos no verbales (gestos con las manos, asentimientos de cabeza y movimientos de cejas) que en las videoconferencias en 2D", como recogen en el artículo.

   El sistema que han desarrollado emplea un ordenador Lenovo P920 y tarjetas gráficas Nvidia (dos Quadro RTX 6000 y dos Titan RTX) para un procesamiento de vídeo a 60Hz (que se eleva a 120Hz en el caso de la monitorización del rostro).

   Consta, además, de dos estructuras: una pantalla, con cámaras, altavoces, micrófonos iluminadores, y el ordenador, donde se representaría al contacto, y otra unidad posterior con retroliminación infrarroja en la que hay un banco para que se siente el usuario.

   "Aunque alcanza un nivel de fidelidad audiovisual no demostrado en sistemas de telepresencia anteriores, algunos efectos aún no se capturan bien" en el que están trabajando, reconocen los investigadores, que señalan como ejemplo que elementos como el cabello o las gafas pueden dar lugar a errores de geometría y de textura.

   También tienen que trabajar en los sistemas de profundidad, de sonido estéreo, el color y la comprensión, así como en la densidad de píxeles y la arquitectura del panel para hacer realistas las conversaciones con este sistema, y para ampliar el número de participantes y extender este modo de comunicación a los grupos.

Leer más acerca de: