El Govern destina 3 millones al proyecto Aina para crear un corpus en catalán para tecnología

Lanza una campaña para captar "millones de voces" que permitan crearlo

El vicepresidente y conseller de Políticas Digitales y Territorio, Jordi Puigneró, junto al director del Barcelona Supercomputing Center (BSC), Josep Maria Martorell, y la responsable de la Unidad de Minería de Textos del BSC, Marta Villegas.
El vicepresidente y conseller de Políticas Digitales y Territorio, Jordi Puigneró, junto al director del Barcelona Supercomputing Center (BSC), Josep Maria Martorell, y la responsable de la Unidad de Minería de Textos del BSC, Marta Villegas. - EUROPA PRESS
Europa Press Catalunya
Publicado: martes, 15 febrero 2022 17:11

BARCELONA, 15 Feb. (EUROPA PRESS) -

El vicepresidente y conseller de Políticas Digitales y Territorio de la Generalitat, Jordi Puigneró, ha anunciado que el Govern destinará tres millones de euros durante este año al proyecto Aina con el fin de crear un corpus de voz en catalán para su uso en la tecnología, que se captará a través de la plataforma Common Voice.

Lo ha dicho este martes en una rueda de prensa en la que también han participado el director del Barcelona Supercomputing Center (BSC), Josep Maria Martorell, y la responsable de la Unidad de Minería de Textos del BSC, Marta Villegas.

Puigneró ha explicado que el objetivo es captar "millones de voces" para enseñar catalán a las máquinas para que cualquier empresa u organización pueda desarrollar servicios como traductores o asistentes personales en catalán.

Ha apuntado que el proyecto tiene el doble objetivo de impulsar el catalán en la era digital y garantizar el derecho de los catalanohablantes de poderse relacionar en su lengua con las máquinas.

"Quiero recordar que TV3 ha hecho un gran trabajo en la normalización y socialización del catalán en la sociedad y, en cierto modo, Aina viene a conquistar nuevos territorios que pasan por nuevas plataformas como el móvil", ha explicado Puigneró.

Villegas ha explicado que el proyecto tiene tres objetivos: proveer al catalán de la infraestructura necesaria para desarrollar aplicaciones basadas en Inteligencia Artificial, permitir que sea rentable y atractivo incluir el catalán en las plataformas, y conseguir que los catalanes puedan participar en su lengua con normalidad en el mundo digital.

Ha señalado que Aina es una infraestructura lingüística que debe permitir a empresas e instituciones crear las aplicaciones finales.

Para ello, han alcanzado acuerdos de colaboración con entidades como SoftCatal o Racó Catal, universidades o la Enciclopdia Catalana, además de la Corporació Catalana de Mitjans Audiovisuals (CCMA) o radios locales para tener datos de los diferentes dialectos del catalán.

CAMPAÑA

Para impulsar este corpus de voces, el Govern lanzará este miércoles la campaña 'La nostra llengua és la teva veu' con el fin de captar voces que permitan generar este corpus.

La campaña permitirá a los ciudadanos leer diferentes frases a través de la plataforma Common Voice con el fin de que se pueda crear un 'diccionario' que permita entrenar a la tecnología para que "entienda y hable" el catalán.

Villegas ha explicado que este tipo de tecnología "necesita datos masivos" y que la única manera de conseguirlo para el catalán es desde la iniciativa pública.

Villegas ha avanzado que su esperanza es pasar de las 1.000 horas que actualmente hay de catalán en Common Voice a 2.000.

Por su parte, Puigneró ha apuntado que se está trabajando con entidades para impulsar la campaña en todo el territorio catalán y que en el futuro se prevé mantener reuniones con los gobiernos del resto de territorios catalanohablantes para que también impulsen la campaña para incorporar sus dialectos.

Últimas noticias sobre estos temas

Contenido patrocinado