En av fem mänskliga gener är inte 'riktiga'

Ny forskning kan förändra biomedicinens ansikte; det mänskliga genomet har visat sig innehålla mycket färre "verkliga" eller proteinkodande gener än vad man tidigare trodde.

Vårt DNA kan innehålla mycket färre ”riktiga” gener än vad vi ursprungligen trodde.

I början av 1990-talet planerade forskare att kartlägga hela DNA-sekvensen för det mänskliga genomet.

Det så kallade Human Genome Project syftade till att hitta genetiska länkar till sjukdomar och att förstå funktionen och strukturen hos olika element i genomet, till exempel vilka gener som kodar proteiner och vilka faktorer som reglerar genuttryck.

De första resultaten från Human Genome Project förutspådde att det finns 40000 gener som kan koda proteiner, stora molekyler som är viktiga för att kroppens vävnader och organ ska fungera bra.

Men när projektet slutade 2003, uppskattades antalet till cirka 20 000–25 000 proteinkodande gener.

Sedan dess har forskare strävat efter att komma fram till det slutliga proteomet - det vill säga det totala antalet proteiner som kan uttryckas av gener - och har fokuserat på att förstå hur det genetiska uttrycket av dessa proteiner muteras i flera sjukdomar.

För detta ändamål har ett internationellt forskargrupp under ledning av Michael Tress, från det spanska National Cancer Research Center Bioinformatics Unit i Madrid, Spanien, nu undersökt generna som betraktas som proteinkodande av de tillgängliga proteombaserna.

Tress och kollegor publicerade resultaten av sin forskning i tidskriften Forskning om nukleinsyror. Federico Abascal, från Wellcome Trust Sanger Institute i Hinxton, Storbritannien, är den första författaren till tidningen.

Minst 2000 gener är ”pseudogener”

Forskarna jämförde proteomerna från tre samlingar av proteinsekvenser och genetiska anteckningar: GENCODE / Ensembl, RefSeq och UniProtKB.

Tress och team fann att, av det totala antalet 22 210 gener som listades som proteinkodning, endast 19 446 presenterades i alla tre samlingarna.

Sedan zoomade de in på skillnaden mellan 2764 gener och undersökte de experimentella bevisen och den information som var tillgänglig från anteckningarna.

Bevis föreslog att majoriteten av dessa gener var "icke-kodande gener eller pseudogener."

Forskarna fann också att ytterligare 1 470 gener - som listades som proteinkodande i de tre samlingarna - inte hade de funktionella egenskaperna eller den typiska utvecklingen av proteinkodande gener.

Därför tror forskarna att de tre referensdatabaserna för närvarande överskattar antalet mänskliga kodande gener med minst 2000, vilket komplicerar och adderar buller till storskaliga biomedicinska experiment.

"Att bestämma vilka potentiella icke-kodande gener som inte kodar för proteiner är en svår men mycket viktig uppgift, eftersom den mänskliga referensproteomen är en grundpelare i de flesta grundforskningar och stöder nästan alla stora biomedicinska projekt."

Vägbeskrivning för framtida forskning

Tress delar hur forskarna tar sina resultat vidare. "Vi har kunnat analysera många av dessa gener i detalj", förklarar han, "och mer än 300 gener har redan omklassificerats som icke-kodande."

"Överraskande nog", säger chimes i studiens medförfattare David Juan, "några av dessa ovanliga gener har studerats väl och har mer än 100 vetenskapliga publikationer baserat på antagandet att genen producerar ett protein."

Resultaten kan därför förändra fältet biomedicin som vi känner till det. Men mer forskning behövs.

"Våra bevis", tillägger Abascal, "antyder att människor bara kan ha 19 000 kodande gener, men vi vet fortfarande inte vilka [de] 19 000 generna."

none:  blod - hematologi hälsa allergi