La Fundación Comillas acogerá en diciembre unas Jornadas de Trabajo del CORPES XXI

Fundación Comillas
EUROPA PRESS
Actualizado: martes, 23 octubre 2012 12:26

En 2014, el Corpus del Español del Siglo XXI reunirá 300 millones de formas que podrán consultarse en la Red


SANTANDER, 23 Oct. (EUROPA PRESS) -

La Fundación Comillas acogerá del 12 al 14 de diciembre unas Jornadas de Trabajo del CORPES XXI, un proyecto cuyo objetivo final es reunir, en 2014, un conjunto textual constituido por 300 millones de formas y palabras de la lengua común de 450 millones de hispanohablantes.

Se trata de la continuación de las jornadas de trabajo desarrolladas en ediciones previas, en colaboración con la Real Academia Española y el Grupo Santander y será una puesta en común de los avances realizados durante la última etapa del proyecto.

El CORPES constituye un proyecto que tiene como objetivo la contribución al mejor y más amplio conocimiento del español actual en toda su extensión y complejidad, según la información de la Fundación Comillas, consultada por Europa Press.

Para ello se cuenta con el empleo de tecnologías punteras en la selección, integración y explotación de los materiales, la voluntad de poner los materiales resultantes a disposición de todos los interesados y el planteamiento del trabajo mediante una estructura de funcionamiento que requiere la colaboración de un número amplio de universidades y centros de investigación del mundo hispánico.

CONVENIO

El pasado mes de marzo, José Manuel Blecua, director de la Real Academia Española (RAE), y Emilio Botín, presidente de Banco Santander, formaron un convenio que renueva la colaboración entre ambas entidades, iniciada en 2007, y que se mantendrá hasta 2014.

Con el acuerdo, el banco, a través de su División Global Santander Universidades, aporta 700.000 euros para proyectos de la RAE, entre los que destaca la culminación del Corpus del Español del Siglo XXI (CORPES XXI), un proyecto en el que participa la Fundación Comillas, entre otras instituciones académicas.

El Corpus del Español del Siglo XXI (CORPES XXI) es un proyecto cuyo objetivo final es reunir, en 2014, un conjunto textual constituido por 300 millones de formas y palabras de la lengua común de 450 millones de hispanohablantes.

Este corpus se elabora a partir de textos orales y escritos. El material proviene tanto de medios impresos libros y prensa como de contenidos publicados en Internet o emitidos en canales de información audiovisual.

El CORPES XXI, que supone la continuación del trabajo realizado con los corpus CREA y CORDE, es una iniciativa de la RAE y de la Asociación de Academias de la Lengua Española (ASALE) en la que trabajan, además del equipo central, ocho equipos externos a las Academias: seis de diferentes universidades españolas --Alcalá de Henares, Autónoma de Barcelona, León, Salamanca, Santiago de Compostela y Valencia--, la Academia Argentina de Letras y la Fundación Comillas.

El CORPES XXI consta actualmente de cerca de 100 millones de formas. La previsión para los próximos tres años es incrementar esa cifra en 200 millones más hasta llegar a 300, mediante la correspondiente selección, codificación e integración de materiales.

Los textos que integrarán el CORPES XXI reflejarán adecuadamente el español de todo el mundo: el 30% de las formas procederán de España y el 70% restante de América.