Die Kosten der Sequenzierung des Genoms

Genetik, Gesundheit

ddp, Beitrag vom 13. Dezember 2021

Die Fortschritte auf dem Gebiet der Genomik im letzten Vierteljahrhundert haben zu einer erheblichen Senkung der Kosten für die Sequenzierung von Genomen geführt. Die Kosten, die den verschiedenen Methoden und Strategien zur Sequenzierung von Genomen zugrunde liegen, sind von großem Interesse, da sie den Umfang und die Größenordnung fast aller Genomforschungsprojekte beeinflussen.

Übersicht

Seit den Anfängen der Genomik in den späten 1980er Jahren wurden die Kosten für die Genomsequenzierung und ihre Berechnung genauestens untersucht und beachtet. So hat beispielsweise das NHGRI die Kosten pro Genom in den von ihm finanzierten „Genomsequenzierungszentren“ über viele Jahre hinweg sorgfältig verfolgt (siehe Abbildung 1). Mit dem wachsenden Umfang humangenetischer Studien und der zunehmenden Zahl klinischer Anwendungen für die Genomsequenzierung wird dem Verständnis der zugrunde liegenden Kosten für die Erstellung einer Humangenomsequenz noch mehr Aufmerksamkeit geschenkt.

Die genaue Bestimmung der Kosten für die Sequenzierung eines bestimmten Genoms (z. B. eines menschlichen Genoms) ist nicht einfach. Es gibt viele Parameter zu definieren und Nuancen zu berücksichtigen. In der Tat ist es schwierig, genaue Zahlen zu den Kosten der Genomsequenzierung zu nennen, die für alle gleich sind, da verschiedene Forscher, Forschungseinrichtungen und Unternehmen diese Kosten in der Regel auf unterschiedliche Weise erfassen und ausweisen.

Eine Fibel zur Genomsequenzierung

Ein Genom besteht aus der gesamten DNA, die im Zellkern einer Zelle enthalten ist. Die DNA besteht aus vier chemischen Bausteinen oder „Basen“ (der Einfachheit halber mit G, A, T und C abgekürzt), wobei die biologische Information, die in der DNA kodiert ist, durch die Reihenfolge dieser Basen bestimmt wird. Diploide Organismen, wie der Mensch und alle anderen Säugetiere, enthalten doppelte Kopien fast aller ihrer DNA (d. h. Chromosomenpaare, wobei ein Chromosom jedes Paares von jedem Elternteil vererbt wird). Die Größe des Genoms eines Organismus wird im Allgemeinen als die Gesamtzahl der Basen in einer repräsentativen Kopie seiner Kern-DNA angesehen. Bei diploiden Organismen (wie dem Menschen) entspricht dies der Summe der Größe einer Kopie jedes Chromosomenpaares.

Organismen unterscheiden sich im Allgemeinen durch ihre Genomgröße. Das Genom von E. coli (einem Bakterium, das in Ihrem Darm lebt) umfasst beispielsweise ~5 Millionen Basen (auch Megabasen genannt), das einer Fruchtfliege ~123 Millionen Basen und das eines Menschen ~3.000 Millionen Basen (oder ~3 Milliarden Basen). Es gibt auch einige überraschende Extreme, wie z. B. bei der Loblolly-Kiefer – ihr Genom ist ~23 Milliarden Basen groß, mehr als siebenmal so groß wie das unsere. Natürlich hängen die Kosten für die Sequenzierung eines Genoms von seiner Größe ab. Die folgende Diskussion konzentriert sich auf das menschliche Genom; dabei ist zu bedenken, dass eine einzige „repräsentative“ Kopie des menschlichen Genoms ~3 Milliarden Basen umfasst, während das tatsächliche (diploide) Genom eines Menschen ~6 Milliarden Basen groß ist.

Genome sind groß und ihre Basen können – zumindest mit den heutigen Methoden – nicht in einem einzigen Schritt der Reihe nach „ausgelesen“ (d. h. sequenziert) werden. Um ein Genom zu sequenzieren, muss seine DNA zunächst in kleinere Stücke zerlegt werden, wobei jedes dieser Stücke dann chemischen Reaktionen unterzogen wird, die es ermöglichen, die Identität und die Reihenfolge der Basen zu bestimmen. Die aus jedem DNA-Stück abgeleitete Basenfolge wird häufig als „Sequenzlesung“ bezeichnet, und die Sammlung der daraus resultierenden Sequenzlesungen (die oft in die Milliarden geht) wird dann rechnerisch wieder zusammengesetzt, um die Sequenz des Ausgangsgenoms zu ermitteln. Die Sequenzierung menschlicher Genome wird heutzutage durch die Verfügbarkeit von „Referenz“-Sequenzen des menschlichen Genoms unterstützt, die eine wichtige Rolle bei der rechnerischen Assemblierung spielen. In der Vergangenheit wurde der Prozess der Zerlegung von Genomen, der Sequenzierung der einzelnen DNA-Stücke und der anschließenden Wiederzusammensetzung der einzelnen Sequenzlesungen zur Erstellung einer Sequenz des Ausgangsgenoms als „Shotgun-Sequenzierung“ bezeichnet (obwohl diese Terminologie heute weniger häufig verwendet wird). Wenn ein ganzes Genom sequenziert wird, nennt man das Verfahren „Whole-Genome-Sequencing“.

Eine Alternative zur Sequenzierung des gesamten Genoms ist die gezielte Sequenzierung eines Teils des Genoms. Meistens geht es dabei nur um die Sequenzierung der proteinkodierenden Regionen eines Genoms, die sich in DNA-Abschnitten befinden, die „Exons“ genannt werden und den derzeit „am besten verstandenen“ Teil der meisten Genome darstellen. Zum Beispiel entsprechen alle Exons im menschlichen Genom (das menschliche ‚Exom‘) ~1,5 % des gesamten menschlichen Genoms. Inzwischen gibt es Methoden, um nur die Exons experimentell zu „fangen“ (oder zu isolieren), die dann sequenziert werden können, um eine „Ganz-Exom-Sequenz“ eines Genoms zu erstellen. Für die Ganz-Exom-Sequenzierung sind zusätzliche Laborarbeiten erforderlich, so dass eine Ganz-Exom-Sequenz nicht ~1,5 % einer Ganz-Genom-Sequenz kostet. Da jedoch viel weniger DNA sequenziert wird, ist die Ganz-Exom-Sequenzierung (zumindest derzeit) billiger als die Ganz-Genom-Sequenzierung.

Ein weiterer wichtiger Faktor für die mit der Erzeugung von Genomsequenzen verbundenen Kosten ist die Datenqualität. Diese Qualität hängt in hohem Maße davon ab, wie oft jede Base im Genom während des Sequenzierungsprozesses im Durchschnitt tatsächlich „gelesen“ wird. Während des Humangenomprojekts (HGP) wurden in der Regel folgende Qualitätsstufen berücksichtigt: (1) ‚Entwurfssequenz‘ (deckt ~90 % des Genoms mit ~99,9 % Genauigkeit ab) und (2) ‚fertige Sequenz‘ (deckt >95 % des Genoms mit ~99,99 % Genauigkeit ab). Die Herstellung wirklich hochwertiger „fertiger“ Sequenzen nach dieser Definition ist sehr teuer; der Prozess der „Sequenzfertigstellung“ ist sehr arbeitsintensiv und daher mit hohen Kosten verbunden. Tatsächlich handelt es sich bei den meisten heute produzierten menschlichen Genomsequenzen um „Entwurfssequenzen“ (manchmal über und manchmal unter der oben definierten Genauigkeit).

Es gibt also eine Reihe von Faktoren, die bei der Berechnung der Kosten für die Genomsequenzierung zu berücksichtigen sind. Es gibt mehrere verschiedene Arten und Qualitätsstufen von Genomsequenzen, und der Prozess selbst kann viele Schritte und Aktivitäten umfassen. Um die tatsächlichen Kosten einer Genomsequenz zu verstehen, muss man daher wissen, was bei der Berechnung der Kosten berücksichtigt wurde und was nicht (z. B. Generierung von Sequenzdaten, Fertigstellung der Sequenz, vorgelagerte Aktivitäten wie Mapping, Abschreibung der Ausrüstung, Gemeinkosten, Versorgungsleistungen, Gehälter, Datenanalysen usw.). In der Realität gibt es oft Unterschiede darin, was bei der Schätzung der Genomsequenzierungskosten in verschiedenen Situationen berücksichtigt wird.

Nachfolgend finden Sie eine Zusammenfassung der Informationen über: (1) die geschätzten Kosten für die Sequenzierung des ersten menschlichen Genoms im Rahmen des HGP; (2) die geschätzten Kosten für die Sequenzierung eines menschlichen Genoms im Jahr 2006 (d. h. vor etwa einem Jahrzehnt); und (3) die geschätzten Kosten für die Sequenzierung eines menschlichen Genoms im Jahr 2016 (d. h. heute).

Wie viel hat es gekostet, die erste menschliche Genomsequenz im Rahmen des Humangenomprojekts zu erstellen?

Im Rahmen des HGP wurde eine „Referenzsequenz“ des menschlichen Genoms erstellt, d. h. es wurde eine repräsentative Version aller Teile jedes menschlichen Chromosoms sequenziert (insgesamt ~3 Milliarden Basen). Am Ende war die Qualität der „fertigen“ Sequenz sehr hoch, mit einer geschätzten Fehlerrate von <1 in 100.000 Basen; dies ist viel höher als eine typische menschliche Genomsequenz, die heute hergestellt wird. Die erzeugte Sequenz stammt nicht aus dem Genom einer Person und spiegelt als „Referenz“-Sequenz mit ~3 Milliarden Basen nur die Hälfte dessen wider, was bei der Sequenzierung des ~6-Milliarden-Basen-Genoms einer einzelnen Person erzeugt wird (siehe unten).

Im Rahmen des HGP wurde das menschliche Genom zunächst kartiert und dann sequenziert. Ersteres war seinerzeit erforderlich, weil es sonst keinen „Rahmen“ für die Organisation der eigentlichen Sequenzierung oder der daraus resultierenden Sequenzdaten gab. Die Karten des menschlichen Genoms dienten als „Gerüste“, auf denen die einzelnen Segmente der zusammengesetzten DNA-Sequenz miteinander verbunden werden konnten. Diese Genomkartierung war recht kostspielig, aber damals für die Erstellung einer genauen Genomsequenz unerlässlich. Es ist schwierig, die Kosten zu schätzen, die mit der „Humangenom-Kartierungsphase“ des HGP verbunden waren, aber sie lagen sicherlich im zweistelligen Millionen-Dollar-Bereich (und wahrscheinlich im dreistelligen Millionen-Dollar-Bereich).

Als die Sequenzierung des menschlichen Genoms im Rahmen des HGP begann, wurde in einem Zeitraum von 15 Monaten (von April 1999 bis Juni 2000) ein „Entwurf“ der menschlichen Genomsequenz (wie oben beschrieben) erstellt. Die geschätzten Kosten für die Erstellung dieses ersten „Entwurfs“ der menschlichen Genomsequenz belaufen sich weltweit auf ca. 300 Mio. USD, von denen die NIH etwa 50-60 % bereitstellten.

Im Rahmen des HGP wurde dann der „Entwurf“ verfeinert und eine „fertige“ menschliche Genomsequenz erstellt (wie oben beschrieben), was bis 2003 erreicht wurde. Die geschätzten Kosten für die Weiterentwicklung des „Entwurfs“ der menschlichen Genomsequenz zur „fertigen“ Sequenz belaufen sich weltweit auf ca. 150 Mio. USD. Es ist anzumerken, dass die Erstellung der endgültigen menschlichen Genomsequenz durch das HGP auch auf den Sequenzen kleiner Zielregionen des menschlichen Genoms beruhte, die vor der Hauptproduktionssequenzierungsphase des HGP erstellt wurden; es ist unmöglich, die mit diesen verschiedenen anderen Genomsequenzierungsbemühungen verbundenen Kosten zu schätzen, aber sie belaufen sich wahrscheinlich auf einen Betrag in zweistelliger Millionenhöhe.

Die obige Erklärung verdeutlicht die Schwierigkeit, eine einzige, genaue Zahl für die Kosten der Erstellung der ersten menschlichen Genomsequenz im Rahmen des HGP zu ermitteln. Eine solche Berechnung erfordert eine klare Abgrenzung dessen, was bei der Schätzung „gezählt“ wird und was nicht; außerdem können die meisten Kostenschätzungen für einzelne Komponenten nur als Spannen angegeben werden. An der unteren Grenze scheinen die Kosten mindestens 500 Millionen Dollar zu betragen, an der oberen Grenze könnten sie sich auf bis zu 1 Milliarde Dollar belaufen. Die Wahrheit liegt wahrscheinlich irgendwo dazwischen.

Die oben genannten geschätzten Kosten für die Erstellung der ersten menschlichen Genomsequenz durch das HGP sollten nicht mit den Gesamtkosten des HGP verwechselt werden. Die ursprünglich veranschlagten Kosten für den Beitrag der USA zum HGP beliefen sich auf 3 Milliarden Dollar; in Wirklichkeit dauerte das Projekt weniger lang (~13 Jahre statt ~15 Jahre) und erforderte weniger Mittel – ~2,7 Milliarden Dollar. Die letztgenannte Zahl stellt jedoch die gesamte US-Finanzierung für eine breite Palette wissenschaftlicher Aktivitäten unter dem Dach des HGP dar, die über die Sequenzierung des menschlichen Genoms hinausgehen, einschließlich Technologieentwicklung, physikalische und genetische Kartierung, Genomkartierung und Sequenzierung von Modellorganismen, bioethische Forschung und Programmmanagement. Darüber hinaus spiegelt dieser Betrag nicht die zusätzlichen Mittel für sich überschneidende Aktivitäten wider, die von anderen Ländern, die am HGP teilgenommen haben, durchgeführt werden.

Als das HGP kurz vor dem Abschluss stand, hatten sich die Genomsequenzierungs-Pipelines so weit stabilisiert, dass das NHGRI in der Lage war, recht zuverlässige Kostenangaben von den großen, vom Institut finanzierten Sequenzierungszentren zu sammeln. Auf der Grundlage dieser Daten schätzte das NHGRI die hypothetischen Kosten für die Erstellung einer „zweiten“ Referenzsequenz des menschlichen Genoms im Jahr 2003 mit den damals verfügbaren Methoden und Technologien auf etwa 50 Millionen Dollar.

Wie viel kostete die Sequenzierung eines menschlichen Genoms im Jahr 2006?

Seit dem Abschluss des HGP und der Erstellung der ersten „Referenz“-Sequenz des menschlichen Genoms haben sich die Bemühungen zunehmend auf die Erstellung von Sequenzen des menschlichen Genoms von einzelnen Personen verlagert. Bei der Sequenzierung des „persönlichen“ Genoms einer Person geht es darum, die Identität und Reihenfolge von ~6 Milliarden DNA-Basen festzustellen (im Gegensatz zu einer ~3-Milliarden-Basen-„Referenz“-Sequenz; siehe oben). Daher ist die Erstellung der Genomsequenz einer Person ein deutlich anderes Unterfangen als das HGP.

Innerhalb weniger Jahre nach dem Ende des HGP (z. B. 2006) begann sich die Landschaft der Genomsequenzierung zu verändern. Während revolutionäre neue DNA-Sequenzierungstechnologien, wie sie heute verwendet werden, zu diesem Zeitpunkt noch nicht ganz eingeführt waren, verfeinerten Genomikgruppen weiterhin die grundlegenden Methoden, die während des HGP verwendet wurden, und senkten die Kosten für die Genomsequenzierung weiter. Es wurden beträchtliche Anstrengungen für die Sequenzierung von nichtmenschlichen Genomen unternommen (viel mehr als für menschliche Genome), aber die damals gesammelten Kostenrechnungsdaten können verwendet werden, um die ungefähren Kosten zu schätzen, die mit der Sequenzierung des menschlichen Genoms zu dieser Zeit verbunden gewesen wären.

Auf der Grundlage von Daten, die das NHGRI von den durch das Institut finanzierten Genomsequenzierungsgruppen gesammelt hat, waren die Kosten für die Erstellung einer qualitativ hochwertigen „Entwurfssequenz“ des menschlichen Genoms bis 2006 auf ca. 14 Mio. USD gesunken. Hypothetisch gesehen hätte die Erstellung einer „fertigen“ Humangenomsequenz wahrscheinlich mehr als 20-25 Millionen Dollar gekostet – teuer, aber immer noch deutlich weniger als die Erstellung der ersten Referenzsequenz des menschlichen Genoms.

Wie viel kostet die Sequenzierung eines menschlichen Genoms im Jahr 2016?

Das Jahrzehnt nach dem HGP brachte revolutionäre Fortschritte bei den DNA-Sequenzierungstechnologien, die das Wesen der Genomik grundlegend verändern. Sogenannte „Next-Generation“-DNA-Sequenzierungsmethoden kamen auf den Markt, und ihre Auswirkungen wurden schnell deutlich, was die Senkung der Kosten für die Genomsequenzierung anbelangt (beachten Sie, dass diese vom NHGRI erhobenen Daten „rückwirkend“ sind und nicht immer genau die „voraussichtlichen“ Kosten für die Genomsequenzierung in der Zukunft widerspiegeln).

Im Jahr 2015 besteht die gängigste Routine für die Sequenzierung des menschlichen Genoms einer Person darin, eine „Entwurfssequenz“ zu erstellen und sie mit einer Referenzsequenz des menschlichen Genoms zu vergleichen, um alle Sequenzvarianten in diesem Genom zu katalogisieren; eine solche Routine beinhaltet keine Sequenznachbearbeitung. Kurz gesagt, fast alle Sequenzierungen des menschlichen Genoms im Jahr 2015 führen zu einer qualitativ hochwertigen „Entwurfs“-Sequenz (aber unvollendet). Diese Sequenzierung zielt in der Regel auf alle Exons (Ganz-Exom-Sequenzierung) oder auf das gesamte ~6-Milliarden-Basen-Genom (Ganz-Genom-Sequenzierung) ab, wie oben beschrieben. Die Qualität der resultierenden „Entwurfs“-Sequenzen hängt stark von der durchschnittlichen Basenredundanz der generierten Daten ab (wobei eine höhere Redundanz mehr kostet).

Das Aufkommen kommerzieller Unternehmen, die Genomsequenzierungsdienste zu wettbewerbsfähigen Preisen anbieten, hat die komplexe Landschaft der Genomsequenzierung im Jahr 2015 weiter vergrößert. Direkte Vergleiche zwischen kommerziellen und akademischen Genomsequenzierungsoperationen können besonders schwierig sein, da es viele Nuancen darüber gibt, was in den jeweiligen Kostenschätzungen enthalten ist (wobei solche Details von privaten Unternehmen oft nicht offengelegt werden). Die Kostendaten, die das NHGRI von den von ihm geförderten Genomsequenzierungsgruppen erhebt, enthalten Informationen über eine breite Palette von Aktivitäten und Komponenten, wie z. B.: Reagenzien, Verbrauchsmaterialien, DNA-Sequenzierungsinstrumente, bestimmte Computerausrüstung, andere Ausrüstung, Entwicklung von Laborpipelines, Laborinformationsmanagementsysteme, anfängliche Datenverarbeitung, Einspeisung von Daten in öffentliche Datenbanken, Projektmanagement, Versorgungsleistungen, andere indirekte Kosten, Arbeit und Verwaltung. Beachten Sie, dass eine solche Kostenrechnung in der Regel keine Aktivitäten wie Qualitätssicherung/Qualitätskontrolle (QA/QC), Abgleich der erzeugten Sequenz mit einem menschlichen Referenzgenom, Sequenzzusammenbau, Bestimmung genomischer Varianten oder Annotation umfasst. Mit ziemlicher Sicherheit unterscheiden sich die Unternehmen darin, welche der in den obigen Listen aufgeführten Punkte in die Kostenschätzungen einfließen, was direkte Kostenvergleiche mit akademischen Genomsequenzierungsgruppen schwierig macht. Es ist daher wichtig, diese Variablen – zusammen mit der Unterscheidung zwischen retrospektiven und prognostizierten Kosten – zu berücksichtigen, wenn man die von verschiedenen Gruppen angegebenen Genomsequenzierungskosten vergleicht. Jeder, der die Kosten für die Genomsequenzierung vergleicht, sollte sich auch der Unterscheidung zwischen „Preis“ und „Kosten“ bewusst sein – ein bestimmter Preis kann höher oder niedriger sein als die tatsächlichen Kosten.

Auf der Grundlage von Daten, die von NHGRI-finanzierten Genomsequenzierungsgruppen erhoben wurden, lagen die Kosten für die Erstellung einer hochwertigen „Entwurfs“-Ganzgenomsequenz des Menschen Mitte 2015 bei knapp über 4 000 USD; Ende 2015 war dieser Betrag auf unter 1 500 USD gesunken. Die Kosten für die Erstellung einer Ganz-Exom-Sequenz lagen im Allgemeinen unter 1 000 $. Die kommerziellen Preise für Ganzgenom- und Ganz-Exom-Sequenzen lagen oft (aber nicht immer) etwas unter diesen Zahlen.

Blick in die Zukunft

Die Innovation bei den Genomsequenzierungstechnologien und -strategien scheint sich nicht zu verlangsamen. Infolgedessen kann man davon ausgehen, dass die Kosten für die Sequenzierung des menschlichen Genoms weiter sinken werden. Die Schlüsselfaktoren, die bei der Bewertung des „Wertes“ im Zusammenhang mit den geschätzten Kosten für die Erstellung einer Humangenomsequenz zu berücksichtigen sind – insbesondere der Umfang des Genoms (ganzes Genom oder Exom), die Qualität und die damit verbundene Datenanalyse (falls vorhanden) – werden wahrscheinlich weitgehend gleich bleiben. Da in den kommenden Jahren neue DNA-Sequenzierungsplattformen zu erwarten sind, werden sich die Art der erzeugten Sequenzdaten und die damit verbundenen Kosten wahrscheinlich weiterhin dynamisch entwickeln. Daher muss der Art und Weise, wie die mit der Genomsequenzierung verbundenen Kosten berechnet werden, weiterhin Aufmerksamkeit gewidmet werden.


Dieser Beitrag beschäftigt sich mit einem medizinischen Thema, einem Gesundheitsthema oder einem oder mehreren Krankheitsbildern. Dieser Artikel dient nicht der Selbst-Diagnose und ersetzt auch keine Diagnose durch einen Arzt. Bitte lesen und beachten Sie hier auch den Hinweis zu Gesundheitsthemen! Quellen: Der Beitrag basiert u.a. auf Informationen von MedlinePlus und Wikipedia lizenziert nach CC-by-sa-3.0 oder Open Government v3.0.

Was ist ein Genom?

Was ist ein Genom?

Genom ist ein schickes Wort für Ihre gesamte DNA. Von der Kartoffel bis zum Welpen haben alle lebenden Organismen ihr eigenes Genom....

Was sind Genetik und Genomik?

Was sind Genetik und Genomik?

Genetik und Genomik spielen beide eine Rolle bei Gesundheit und Krankheit....

Genomische Datenwissenschaft

Genomische Datenwissenschaft

Genomische Datenwissenschaft ermöglicht rechnerische Methoden, um die in DNA verborgenen funktionellen Informationen zu entschlüsseln....

Was ist Epigenomik?

Was ist Epigenomik?

Die Epigenomik ist ein Gebiet, auf dem Forscher die Lage und die Funktionen aller chemischen Markierungen des Genoms aufzeichnen....

Was ist vergleichende Genomik?

Was ist vergleichende Genomik?

Die vergleichende Genomik vergleicht mit verschiedenen Tools die vollständigen Genomsequenzen verschiedener Arten von Lebewesen....

Weitere Medizin Docs News

Bei Schmerzen und mentalen Leiden

 

Sehen Sie hier die erstaunlichen Berichte von Patienten und Anwendern zur Yager-Methode.

Mehr zur Methode lesen

Menü