UE.- La CE elabora una recopilación de datos lingüísticos para facilitar la traducción por ordenador

Actualizado: viernes, 18 enero 2008 18:01

BRUSELAS, 18 Ene. (EUROPA PRESS) -

La Comisión Europea anunció hoy que ha elaborado una recopilación de un millón de frases con su correspondiente traducción de calidad en 22 de las 23 lenguas oficiales de la UE (falta el gaélico) con el objetivo de facilitar la traducción asistida por ordenador y hacerla más barata y accesible al público.

Esta recopilación de datos lingüísticos --la mayor jamás realizada en tantas lenguas-- está a disposición de todo el que quiera utilizarla de manera gratuita. Los datos son especialmente valiosos para quienes trabajan en el desarrollo de sistemas de traducción automática por ordenador en los que los programas "aprenden" a traducir correctamente y en contexto palabras y frases a partir de textos traducidos por profesionales.

Los datos pueden contribuir asimismo al desarrollo de otras aplicaciones informáticas lingüísticas tales como los correctores gramaticales y ortográficos, los diccionarios en línea y los sistemas de clasificación de textos multilingües.

El comisario de Multilingüismo, Leonard Orban, destacó que, a través de esta iniciativa, el Ejecutivo comunitario "pretende estimular las tecnologías del lenguaje, apoyar el multilingüismo y hacer la traducción asistida por ordenador más fácil, barata y accesible al público". "Los ciudadanos de las comunidades lingüísticas más pequeñas tendrán mayor facilidad para acceder a documentos y páginas web hasta ahora disponibles exclusivamente en las lenguas más utilizadas", dijo en un comunicado.

Las instituciones de la UE poseen mayor cantidad de textos multilingües que ninguna otra organización debido a la exigencia de disponer de la legislación de la UE en las 23 lenguas oficiales. Sus servicios de traducción trabajan con 253 pares posibles de combinaciones lingüísticas y producen aproximadamente 1,5 millones de páginas traducidas al año, según los datos de Bruselas.

La Comisión explicó que, aunque en Internet pueden encontrarse numerosas traducciones de textos del francés o del inglés, dichos recursos escasean cuando se trata de lenguas tales como el letón o el rumano, y son prácticamente inexistentes en el caso de combinaciones de dos lenguas en relación con las cuales existen pocos recursos.

El Ejecutivo comunitario resaltó que posee una amplia experiencia en el desarrollo de aplicaciones de tratamiento de textos multilingües y se encuentra a la vanguardia del multilingüismo, ofreciendo nuevas páginas web de búsqueda de noticias abiertas al público, que cubren hasta 35 idiomas, a través de la aplicación denominada 'European Media Monitoring'.

El Séptimo Programa Marco de investigación y desarrollo --en el campo temático de las tecnologías de la información y la comunicación-- apoya la investigación en materia de traducción automática y otras tecnologías relacionadas con las lenguas.