Genomische Datenwissenschaft

Genetik, Gesundheit

ddp, Beitrag vom 14. Dezember 2021

Da die Menschen immer tiefer in das Genom eindringen, trägt die Analyse und Interpretation der gesammelten Genomdaten zu einem besseren Verständnis der menschlichen Gesundheit und Krankheit bei, wirft aber auch Fragen zum Datenschutz und zur Ethik auf.

Das große Bild

  • Genomische Datenwissenschaft ist ein Studienbereich, der es Forschern ermöglicht, leistungsstarke rechnerische und statistische Methoden einzusetzen, um die in DNA-Sequenzen verborgenen funktionellen Informationen zu entschlüsseln.
  •  Schätzungen zufolge wird die Genomforschung im nächsten Jahrzehnt zwischen 2 und 40 Exabyte an Daten erzeugen.
  • Unsere Fähigkeit, die DNA zu sequenzieren, hat unsere Fähigkeit, die darin enthaltenen Informationen zu entschlüsseln, bei weitem übertroffen, so dass die Genomdatenwissenschaft noch viele Jahre lang ein dynamisches Forschungsgebiet sein wird.
  • Die Durchführung von Genomdatenforschung bringt eine Reihe von ethischen Verpflichtungen mit sich, da die Sequenzdaten jeder Person mit Fragen des Datenschutzes und der Identität verbunden sind.

Wie es Sie betrifft

In dem Maße, wie biomedizinische Forschungsprojekte und groß angelegte Kooperationen rasant zunehmen, steigt auch die Menge der erzeugten genomischen Daten: Derzeit werden jedes Jahr etwa 2 bis 40 Milliarden Gigabyte an Daten erzeugt. Die Forscher arbeiten daran, wertvolle Informationen aus diesen komplizierten und großen Datensätzen zu extrahieren, um die menschliche Gesundheit und Krankheit besser zu verstehen.

Was ist genomische Datenwissenschaft?

Genomische Datenwissenschaft ist ein Studienbereich, der es Forschern ermöglicht, leistungsstarke rechnerische und statistische Methoden einzusetzen, um die in der DNA-Sequenz verborgenen funktionellen Informationen zu entschlüsseln. Im Kontext der genomischen Medizin angewandt, helfen diese datenwissenschaftlichen Werkzeuge Forschern und Klinikern aufzudecken, wie sich Unterschiede in der DNA auf die menschliche Gesundheit und Krankheit auswirken.

Genomische Datenwissenschaft entstand in den 1990er Jahren als ein Bereich, in dem zwei Laboraktivitäten zusammengeführt wurden:

  • Experimentieren: Gewinnung genomischer Informationen durch Untersuchung der Genome lebender Organismen.
  • Datenanalyse: Verwendung von statistischen und computergestützten Werkzeugen zur Analyse und Visualisierung genomischer Daten, einschließlich der Verarbeitung und Speicherung von Daten und der Verwendung von Algorithmen und Software zur Erstellung von Vorhersagen auf der Grundlage der verfügbaren genomischen Daten.

Beide Tätigkeiten helfen den Forschern, die riesigen Mengen an Genomdaten zu erfassen und Erkenntnisse daraus zu gewinnen.

Warum umfasst die Genomik so viele Daten?

Die menschliche Genomik erlangte Anfang der 2000er Jahre allgemeine Aufmerksamkeit, als das Humangenomprojekt erfolgreich die erste Sequenz der chemischen Basen („Buchstaben“) – As, Cs, Gs und Ts – im menschlichen Genom erstellte. Jede der Billionen von Zellen im menschlichen Körper enthält eine vollständige Kopie des Genoms, d. h. unseres DNA-Bauplans.) Die meisten Zellen haben sogar zwei Kopien des Genoms, die zusammen etwa 6 Milliarden DNA-Buchstaben enthalten.

Forscher generieren heute mehr Genomdaten als je zuvor, um zu verstehen, wie das Genom funktioniert und sich auf die menschliche Gesundheit und Krankheit auswirkt. Diese Daten stammen von Millionen von Menschen in verschiedenen Populationen auf der ganzen Welt. Allein die Daten über eine einzige menschliche Genomsequenz würden 200 Gigabyte oder den Platz von etwa 200 Kopien von Jaws einnehmen. Wir werden schätzungsweise 40 Exabyte benötigen, um die bis 2025 weltweit anfallenden Genomsequenzdaten zu speichern. Das sind fast eine Milliarde DVDs von Jaws! Zum Vergleich: Fünf Exabyte könnten alle jemals von Menschen gesprochenen Wörter speichern.

Aufgrund der großen Menge an komplexen Daten, die mit menschlichen Genomen verbunden sind, gilt die Genomik heute als ein „Big Data“-Bereich.

Wie untersuchen und nutzen Wissenschaftler genomische Daten?

Forscher benötigen spezielle Rechen- und Analysewerkzeuge, um die in der DNA eines jeden Menschen verborgenen biologischen Informationen zu finden und zu interpretieren und um die großen Datenmengen zu verwalten, die bei genomischen Forschungsprojekten anfallen.

Forscher verwenden Software-Tools, so genannte Aligner, um zu bestimmen, wo einzelne DNA-Sequenzstücke auf jedem Teil einer Referenzgenomsequenz liegen.

Als Nächstes ermitteln „Variantenrufer“ die Stellen, an denen sich eine bestimmte menschliche Genomsequenz von anderen menschlichen Genomsequenzen unterscheidet. Diese genomischen Unterschiede gibt es in vielen Größen. Der Unterschied kann so klein sein wie ein DNA-Buchstabe (ein so genannter Ein-Nukleotid-Polymorphismus), viele Buchstaben lang (so genannte strukturelle Varianten) wie Einfügungen oder Streichungen oder wesentlich größere Chromosomenanomalien. Diese genomischen Unterschiede stellen möglicherweise kein Gesundheitsrisiko dar, können aber auch direkt zu seltenen Erbkrankheiten, Krebs oder anderen häufigeren Krankheiten führen.

Wie verwalten und speichern Forscher solche großen Mengen an genomischen Daten?

Experten für Computertechnologien und Genomik verwalten und speichern genomische Daten mit Hilfe verschiedener Computersysteme und Software. Zunehmend sind Datenanalyse- und Koordinierungszentren Teil von Forschungsnetzen und bieten diese Dienste an.

Die Generierung von Genomdaten erfordert erhebliche finanzielle Unterstützung von Institutionen wie dem National Human Genome Research Institute (NHGRI), das jedes Jahr über 125 Millionen Dollar zur Unterstützung verschiedener genomischer Datenforschungsprojekte bereitstellt.

Die erzeugten Datenressourcen werden häufig der breiteren wissenschaftlichen Gemeinschaft zur Verfügung gestellt, um weitere Datenanalysen zu erleichtern. Sie organisieren und liefern viele Arten von Informationen über das menschliche Genom, wie z. B. die Positionen von Genen und Varianten in der DNA.

Viele private und kommerzielle Cloud-Plattformen arbeiten mit staatlichen und öffentlichen Einrichtungen zusammen, wie zum Beispiel mit den National Institutes of Health (NIH) im Rahmen der STRIDES-Initiative. Diese Initiativen stellen Speicher- und Recheninfrastrukturen für das Hosting von Genomdaten bereit und sorgen für die nötige Sicherheit und den Schutz der Privatsphäre, insbesondere für humangenomische Daten.

Welche ethischen, rechtlichen und gesellschaftlichen Auswirkungen hat die gemeinsame Nutzung genomischer Daten?

Die Durchführung von Genomforschung bringt eine Reihe von ethischen Verpflichtungen mit sich, da Informationen über die Genomsequenz einer Person mit komplexen Fragen in Bezug auf Privatsphäre und Identität verbunden sind.

 

  • Informierte Zustimmung: Forscher bitten in der Regel um die Zustimmung der Personen, deren Genome sequenziert werden. Die Forscher müssen jedoch klare Informationen darüber geben, wie sie die resultierenden Genomsequenzdaten verwenden und weitergeben werden, wenn sie eine solche informierte Zustimmung erhalten.
  • Datenschutz: Mit Hilfe leistungsfähiger Computerprogramme können Sequenzdaten aus nicht identifizierten Genomen entnommen und unter bestimmten Umständen mit der Person, deren DNA sequenziert wurde, in Verbindung gebracht werden. Ermittler können solche Werkzeuge für nützliche Zwecke einsetzen, z. B. zur Identifizierung von Kriminellen, die an einem Tatort DNA hinterlassen haben. Der gesellschaftliche Nutzen muss jedoch die potenziellen Risiken einer solchen Nutzung genomischer Daten überwiegen.
  • Künstliche Intelligenz (KI): KI-Tools helfen Forschern zunehmend bei der Verarbeitung großer Mengen von Genomsequenzdaten, um nach verborgenen Mustern in der DNA zu suchen. Da KI-Algorithmen jedoch oft nicht transparent sind, können sich bei der Anwendung solcher Algorithmen auf DNA-Daten unbemerkt Verzerrungen einschleichen. Dieser Bereich der genomischen Datenwissenschaft erfordert eine umfassende ethische Forschung, um die einzigartigen Unterschiede zwischen den derzeitigen Methoden der genomischen Datenwissenschaft (die sich bei der Interpretation der Ergebnisse auf menschliche Intelligenz stützen) und den neueren KI-Methoden zu bewältigen. Während KI-Methoden viele vielversprechende Vorteile bieten, ziehen sie auch Schlussfolgerungen auf völlig andere Weise als Menschen und müssen daher einer sorgfältigen ethischen Aufsicht unterliegen.

Angesichts all dieser Überlegungen müssen Datenwissenschaftler und Genomforscher über die Auswirkungen ihrer Studien aufgeklärt werden und eng mit Ethikforschern zusammenarbeiten.

Wie geben Forscher humangenomische Daten weiter?

Von Forschern wird erwartet, dass sie menschliche Genomdaten entsprechend der von den Forschungsteilnehmern erteilten Zustimmung weitergeben. Genomische Daten werden in der Regel über Datenressourcen mit der wissenschaftlichen Gemeinschaft geteilt, auf die auf drei Arten zugegriffen werden kann:

Der offene oder uneingeschränkte Zugang ist die umfassendste Form der gemeinsamen Nutzung von Daten. Die Daten stehen der Öffentlichkeit für jeden Forschungszweck zur Verfügung.

Der registrierte Zugang liegt zwischen Open Access und kontrolliertem Zugang. Forscher können die Daten zu jedem beliebigen Zweck erhalten, müssen ihre Informationen jedoch registrieren und ihre Arbeit mit den Daten muss möglicherweise überwacht werden.

Bei der gemeinsamen Nutzung von Daten mit kontrolliertem Zugang müssen Forscher ihren Forschungszweck beschreiben, damit ein spezieller Datenzugangsausschuss die Vereinbarkeit des Forschungszwecks mit der Zustimmung des Teilnehmers bewerten kann. Der Forscher kann erst dann auf die Daten zugreifen, wenn der Ausschuss seine Zustimmung gegeben hat.

Welche neuen Themen gibt es in der Genomikdatenwissenschaft?

Menschliche Genome enthalten viele genomische Varianten (DNA-Buchstaben, die sich an bestimmten Stellen von Individuen unterscheiden). Gesundheitssysteme und Forscher entwickeln Instrumente, die diese DNA-Unterschiede erkennen und sie mit medizinisch relevanten Informationen verknüpfen, z. B. mit einem Krankheitsrisiko oder einer Indikation für ein bestimmtes Medikament unter mehreren Optionen. Forscher setzen auch Systeme der künstlichen Intelligenz ein, um Genomdaten für klinische Zwecke zu interpretieren, z. B. zur Diagnose von Krankheiten in frühen Stadien oder zur Vorhersage des Risikos für verschiedene Krankheiten auf der Grundlage genomischer Informationen.

In den letzten zehn Jahren ist das Cloud Computing für die Speicherung und Analyse genomischer Daten unentbehrlich geworden. Cloud Computing verringert die Notwendigkeit, große Datensätze zu duplizieren, erhöht die Sicherheit und bietet Forschern einen besseren Zugang zur Genomikdatenforschung. Datenwissenschaftler entwickeln Tools, um das Hochladen von Daten zu erleichtern und den Datenschutz zu gewährleisten.


Dieser Beitrag beschäftigt sich mit einem medizinischen Thema, einem Gesundheitsthema oder einem oder mehreren Krankheitsbildern. Dieser Artikel dient nicht der Selbst-Diagnose und ersetzt auch keine Diagnose durch einen Arzt. Bitte lesen und beachten Sie hier auch den Hinweis zu Gesundheitsthemen! Quellen: Der Beitrag basiert u.a. auf Informationen von MedlinePlus und Wikipedia lizenziert nach CC-by-sa-3.0 oder Open Government v3.0.

Was ist ein Genom?

Was ist ein Genom?

Genom ist ein schickes Wort für Ihre gesamte DNA. Von der Kartoffel bis zum Welpen haben alle lebenden Organismen ihr eigenes Genom....

Was sind Genetik und Genomik?

Was sind Genetik und Genomik?

Genetik und Genomik spielen beide eine Rolle bei Gesundheit und Krankheit....

Was ist Epigenomik?

Was ist Epigenomik?

Die Epigenomik ist ein Gebiet, auf dem Forscher die Lage und die Funktionen aller chemischen Markierungen des Genoms aufzeichnen....

Die Kosten der Sequenzierung des Genoms

Die Kosten der Sequenzierung des Genoms

Die Fortschritte in der Genomik haben zu einer erheblichen Senkung der Kosten für die Sequenzierung von Genomen geführt....

Was ist vergleichende Genomik?

Was ist vergleichende Genomik?

Die vergleichende Genomik vergleicht mit verschiedenen Tools die vollständigen Genomsequenzen verschiedener Arten von Lebewesen....

Weitere Medizin Docs News

Bei Schmerzen und mentalen Leiden

 

Sehen Sie hier die erstaunlichen Berichte von Patienten und Anwendern zur Yager-Methode.

Mehr zur Methode lesen

Menü