Jedes fünfte menschliche Gen ist nicht "echt"

Neue Forschungsergebnisse könnten das Gesicht der Biomedizin verändern. Es wurde festgestellt, dass das menschliche Genom weit weniger „echte“ oder Protein-kodierende Gene enthält, als bisher angenommen wurde.

Unsere DNA enthält möglicherweise weit weniger „echte“ Gene als ursprünglich angenommen.

Anfang der neunziger Jahre machten sich Wissenschaftler daran, die gesamte DNA-Sequenz des menschlichen Genoms abzubilden.

Das sogenannte Humangenomprojekt zielte darauf ab, genetische Verbindungen zu Krankheiten zu finden und die Funktion und Struktur verschiedener Elemente des Genoms zu verstehen, z. B. welche Gene Proteine ​​codieren und welche Faktoren die Genexpression regulieren.

Die ersten Ergebnisse des Humangenomprojekts sagten voraus, dass es 40.000 Gene gibt, die Proteine ​​codieren können, große Moleküle, die für das gute Funktionieren der Gewebe und Organe des Körpers von entscheidender Bedeutung sind.

Als dieses Projekt jedoch 2003 zu Ende ging, fielen die Schätzungen für diese Zahl auf etwa 20.000 bis 25.000 proteinkodierende Gene.

Seitdem haben Wissenschaftler versucht, das endgültige Proteom zu finden - dh die Gesamtzahl der Proteine, die von Genen exprimiert werden können - und sich darauf konzentriert, zu verstehen, wie die genetische Expression dieser Proteine ​​bei verschiedenen Krankheiten mutiert.

Zu diesem Zweck hat ein internationales Forscherteam unter der Leitung von Michael Tress von der spanischen Abteilung für Bioinformatik des Nationalen Krebsforschungszentrums in Madrid, Spanien, die Gene untersucht, die von den wichtigsten verfügbaren Proteomdatenbanken als Protein-kodierend angesehen werden.

Tress und Kollegen veröffentlichten die Ergebnisse ihrer Forschung in der Zeitschrift Nukleinsäureforschung. Federico Abascal vom Wellcome Trust Sanger Institute in Hinxton, Großbritannien, ist der erste Autor des Papiers.

Mindestens 2.000 Gene sind „Pseudogene“.

Die Forscher verglichen die Proteome aus drei Sammlungen von Proteinsequenzen und genetischen Annotationen: GENCODE / Ensembl, RefSeq und UniProtKB.

Tress und sein Team stellten fest, dass von der Gesamtzahl von 22.210 Genen, die als Protein-kodierend aufgeführt sind, nur 19.446 in allen drei Sammlungen enthalten waren.

Dann zoomten sie auf den Unterschied von 2.764 Genen und untersuchten die experimentellen Beweise und die Informationen, die aus den Anmerkungen verfügbar waren.

Es gibt Hinweise darauf, dass die Mehrheit dieser Gene "nichtkodierende Gene oder Pseudogene" waren.

Außerdem stellten die Wissenschaftler fest, dass weitere 1.470 Gene, die in den drei Sammlungen als proteinkodierend aufgeführt waren, nicht die funktionellen Eigenschaften oder die typische Entwicklung proteinkodierender Gene aufwiesen.

Daher glauben die Forscher, "dass die drei Referenzdatenbanken derzeit die Anzahl der menschlichen kodierenden Gene um mindestens 2.000 überschätzen, was groß angelegte biomedizinische Experimente erschwert und Rauschen hinzufügt."

"Die Bestimmung, welche potenziellen nichtkodierenden Gene nicht für Proteine ​​kodieren, ist eine schwierige, aber äußerst wichtige Aufgabe, da das menschliche Referenzproteom eine grundlegende Säule der meisten Grundlagenforschung darstellt und fast alle biomedizinischen Großprojekte unterstützt."

Anweisungen für die zukünftige Forschung

Tress teilt mit, wie die Forscher ihre Erkenntnisse weiterentwickeln. "Wir konnten viele dieser Gene im Detail analysieren", erklärt er, "und mehr als 300 Gene wurden bereits als nicht kodierend eingestuft."

"Überraschenderweise", läutet David Juan, Co-Autor der Studie, "sind einige dieser ungewöhnlichen Gene gut untersucht worden und haben mehr als 100 wissenschaftliche Veröffentlichungen, die auf der Annahme beruhen, dass das Gen ein Protein produziert."

Die Ergebnisse könnten daher das Gebiet der Biomedizin, wie wir es kennen, verändern. Es sind jedoch weitere Forschungsarbeiten erforderlich.

"Unsere Beweise", fügt Abascal hinzu, "legen nahe, dass Menschen möglicherweise nur 19.000 kodierende Gene haben, aber wir wissen immer noch nicht, welche [diese] 19.000 Gene sind."

none:  Schlaganfall Herzkrankheit Lungensystem