Desenvolupen una nova eina informàtica per a investigar la complexitat del genoma

El treball permet aprofundir en el coneixement de la formació de l'organisme i les seues malalties

El programa informàtic desenvolupat per l'I2SysBio permet descobrir nous tránscritos que no estaven en les bases de dades del genoma.
PIXABAY
Europa Press C. Valenciana
Publicado: jueves, 11 abril 2024 15:39

   VALÈNCIA, 11 Abr. (EUROPA PRESS) -

   Un equip de l'Institut de Biologia Integrativa de Sistemes (UV-CSIC) ha publicat en 'Nature Methods' un programari propi per a analitzar dades obtingudes per seqüenciació de lectura llarga del genoma. Aquest sistema permet descobrir noves molècules d'ARN i assignar-los una funció en la creació de teixits, la qual cosa "aprofundeix en el coneixement de la formació de l'organisme i les seues malalties".

   Els responsables de la troballa recorden que la complexitat d'un organisme emergeix del seu genoma, el llibre que conté les instruccions del seu ADN per a la vida. El mètode per a llegir aquest llibre --la seqüenciació-- ha evolucionat cap a la lectura de fragments cada vegada més llargs del genoma.

    En aquest camp, un grup de recerca liderat per l'Institut de Biologia Integrativa de Sistemes (I2SysBio), centre mixt de la Universitat de València (UV) i el Consell Superior d'Investigacions Científiques (CSIC), ha millorat un programa informàtic propi capaç de descobrir nous tránscritos -molècules d'ARN per a sintetitzar proteïnes i crear teixits- a partir de la seua seqüenciació amb instruments de lectura llarga; i assignar-los una funció en la formació de l'organisme.

   La seqüenciació de lectura llarga (long-read sequencing) és la tercera generació de mètodes de seqüenciació del genoma. Enfront de la lectura de fragments curts, que analitza uns 200 nucleòtids, els mètodes de lectura llarga poden obtenir lectures 100 vegades més llargues, la qual cosa deixa menys buits en la informació del genoma per a emplenar mitjançant eines bioinformáticas. Aquesta va ser una de les raons perquè la pròpia Nature Methods ho considerara 'Mètode de l'Any 2022'.

   Uns anys abans, el 2018, la investigadora Ana Conesa, llavors en la Universitat de Florida, va desenvolupar un programa informàtic anomenat SQANTI per a analitzar la informació que s'extreia mitjançant aquests mètodes de lectura llarga. Ara, el seu equip d'investigació en l'I2SysBio ha publicat una millora substancial d'aquest programari que es pot usar lliurement en els principals sistemes comercials que empren seqüenciació de lectura llarga, Pacific Biosciences (PacBio) i Oxford Nanopore Technologies (ONT).

   "Les tècniques de lectura llarga analitzen millor la complexitat dels tránscritos i el transcriptoma humans", comenta Conesa. Això identifica la porció del genoma que es llig en cada cèl·lula per a donar lloc a teixits i òrgans. Així, un únic gen pot donar lloc a una gran diversitat de tránscritos, mitjançant petits canvis en l'estructura d'ARN que codifica, i amb ells de proteïnes amb diferents funcions cel·lulars. "La seqüenciació de lectura curta no pot resoldre aquest puzle. La lectura llarga reconstrueix millor la complexitat funcional del transcriptoma humà, i això és clau per a estudiar determinades malalties, sobretot de tipus neurològic i càncer", sosté la investigadora del CSIC en un comunicat.

   La versió publicada ara -SQANTI3- soluciona alguns problemes anteriors derivats de la degradació de l'ARN i introdueix notables millores. El programa és capaç de descobrir nous tránscritos que no estaven en les bases de dades del genoma que usen aquests programes informàtics. A més, mitjançant tècniques d'Intel·ligència Artificial, el softwarepuede assignar informació funcional per al nou tránscrito, "alguna cosa essencial per a entendre la complexitat funcional de l'organisme i de les malalties", remarca Conesa.

CLÚSTER DE COMPUTACIÓ

   Per a desenvolupar aquest programa informàtic s'ha usat el clúster de computació Garnatxa de l'I2SysBio, que disposa de 15 nodes de computació capaces d'oferir 950 fils de còmput en paral·lel. A més, el grup Genòmica de l'Expressió Gènica que dirigeix Ana Conesa en l'I2SysBio participa en Elixir, una de les infraestructures estratègiques per a Fòrum Estratègic Europeu sobre Infraestructures d'Investigació (ESFRI) que permet a laboratoris de ciències de la vida de tota Europa compartir i emmagatzemar les seues dades.

   En el desenvolupament de SQANTI3 han col·laborat la Universitat de Florida i Pacific Biosciences.

Contenido patrocinado

Mitjà de comunicació subvencionat per la Generalitat Valenciana

Col.labora la Conselleria de Cultura, Educació, Universitats i ocupació de la Generalitat Valenciana amb una subvenció de 40.000 € para el foment de valencià

Hemeroteca en Valencià d'Europa Press