Bioinformatik - Genetische Schaltzentralen leichter erkennen

09.10.2012

Alle Erbinformationen sind in der DNA festgelegt - aber nicht immer sind alle Gene aktiv. Welche Informationen umgesetzt werden, bestimmen sogenannte regulatorische Sequenzen. Ein neues Verfahren hilft, diese genetischen Schaltzentralen aufzuspüren. Das menschliche Genom umfasst etwa 20 000 Gene - ungefähr so viele, wie auch der winzige Fadenwurm Caenorhabditis elegans besitzt. Nicht die Anzahl der Gene macht nämlich die Komplexität eines Organismus aus, sondern die Regulierung ihrer Expression, also ihrer Aktivität. Gesteuert wird diese durch oft benachbarte regulatorische DNA/RNA-Sequenzen. Entscheidend daran beteiligt sind Regulationsfaktoren, die Informationen übermitteln, indem sie an regulatorische Sequenzen binden.

"Um die Steuerung der Genexpression besser zu verstehen, müssen wir untersuchen, wie und wann Regulationsfaktoren binden" sagt der LMU-Informatiker Johannes Söding, der nun mit seinem Team ein neues computerbasiertes Verfahren dafür entwickelt hat. Die meisten modernen Methoden zur Untersuchung der Genregulierung liefern als Ergebnis eine Liste von Sequenzen, die durch einen oder mehrere spezifisch bindende Faktoren kontrolliert werden. Die jeweiligen Bindungspräferenzen der Faktoren können dabei mithilfe sogenannter Positionsspezifischer Gewichtsmatritzen (PWMs) beschrieben werden.

Muster im Sequenzrauschen

Allerdings sind PWMs für die computergestützte Entdeckung unbekannter Bindepräferenzen in Sequenzdaten problematisch, weil es unendlich viele von ihnen gibt, und weil die Berechnung ihrer statistischen Signifikanz sehr zeitaufwändig ist. Södings Gruppe ist es gelungen, diese Limitierung zu überwinden und eine Methode zu entwickeln, mit der die statistische Signifikanz der PWMs direkt optimiert werden kann. Dieser Ansatz zahlt sich aus: "Unsere Methode zeigt im Vergleich zu herkömmlichen Verfahren eine deutlich größere Sensitivität, um auch schwache Muster zu erkennen. Zudem sind die errechneten PWMs genauer", erklärt Söding.

Die Wissenschaftler untersuchten mit ihrer Methode sogenannte humane Core-Promotor-Sequenzen, also kurze DNA-Abschnitte, an denen die Abschrift der DNA in Boten-RNA beginnt. Tatsächlich gelang es ihnen, eine Reihe von bislang unbekannten Motiven zu identifizieren, die vermutlich wichtige regulatorische Eigenschaften beinhalten. "Wir hoffen, mit unserer Methode das Verständnis der Genregulation durch spezifische DNA- und RNA-Bindungsfaktoren entscheidend voranzubringen", sagt Söding. (Genome Research, September 2012)