Sequenzieren – So entdeckt und unterscheidet man Coronavirus-Varianten

erstellt mit BioRender.com

Verschiedene SARS-CoV-2-Varianten unterscheiden sich in ihrer Erbinformation, ihrer RNA. Die Unterschiede in der RNA, auch Mutationen genannt, prägen sich in unterschiedlichen Eigenschaften des Virus aus. Manche Veränderungen führen zu einem Vorteil für das Virus und sie setzen sich als neue Variante durch (siehe auch Infovideo: SARS-CoV-2: Mutationen und Varianten des Coronavirus). Um die verschiedenen Varianten zu erkennen und zu verstehen, kann man das Erbgut des Virus sequenzieren.

Durch Sequenzierung kann die genaue Basenabfolge einer DNA festgestellt werden.

Da die Erbinformation von SARS-CoV-2 aus RNA besteht, wird sie im ersten Schritt in DNA umgeschrieben (= Reverse Transkription). Um DNA zu sequenzieren, gibt es verschiedene Methoden, die im Laufe der Jahrzehnte stetig verbessert wurden. Während das Human Genome Project in den 90er Jahren 13 Jahre benötigte, um zum ersten Mal ein menschliches Genom zu sequenzieren, geht das heute innerhalb weniger Tage. Diese modernen Sequenzierungsverfahren werden auch als Next Generation Sequencing (NGS) bezeichnet und zeichnen sich vor allem durch hohe Geschwindigkeit und Durchsatz aus. Dieser Artikel erklärt eine dieser NGS-Methoden, das Illumina-Verfahren, welches auch bei der Corona-Sequenzierung häufig benutzt wird.

Der Ablauf der Sequenzierung im Überblick

erstellt mit BioRender.com

1.) In der Vorbereitungsphase werden die DNA-Proben in kleinere Abschnitte zerteilt und mit einer Erkennungssequenz, genannt Barcode, markiert.

Trotz aller technischen Verbesserungen bleibt Sequenzierung vergleichsweise teuer und langwierig. Um Zeit zu sparen, wird die DNA fragmentiert, also in kürzere Stücke zerteilt. Dadurch kann der ursprüngliche DNA-Strang parallel an verschiedenen Stellen sequenziert werden. Um den Zeitaufwand und auch die Kosten möglichst gering zu halten, werden mehrere DNA-Proben, zum Beispiel mehrere Corona-Genome, im selben Prozess sequenziert. Um die Daten zum Schluss wieder ihrem Ursprung zuordnen zu können, müssen die DNA-Abschnitte mit verschiedenen Barcodes markiert werden.

Die DNA wird in mehrere Abschnitte zerlegt, indem ein Enzym, die so genannten Polymerase, die DNA in kurzen Stücken abschreibt (wie bei der Polymerasekettenreaktion, siehe auch PCR-Wissensartikel). Dabei werden die DNA-Kopien an den Enden um eine kurze Basensequenz, den Barcode und die Adaptersequenz, verlängert.  Während die Adaptersequenz an jedem DNA-Stück gleich ist erhalten nur Fragmente desselben Ursprungs die gleichen Barcodes.

erstellt mit BioRender.com

2.) Die DNA-Fragmente werden in Einzelstränge geteilt und an eine Platte gebunden. Durch PCR werden die DNA-Abschnitte vervielfältigt, bis Ansammlungen vieler identischer DNA-Abschnitte entstehen. Eine solche Ansammlung gleicher DNA nennt man ein Cluster.

Bei der Sequenzierung (siehe Schritt 3) werden Farbsignale erzeugt, mit der die Basenabfolge ermittelt wird. Damit die Farbsignale zugeordnet werden können muss die DNA zuvor fixiert werden. Dazu paart sich die Adaptersequenz mit den auf der Platte gebundenen komplementären Sequenzen.

Die später erzeugten Farbsignale müssen eine gewisse Intensität erreichen, um detektiert zu werden. Das erreicht man durch Vervielfältigung zu einem Cluster, da durch viele identische schwache Farbsignale auf einem Fleck ein starkes Signal entsteht.

erstellt mit BioRender.com

3.) Die für die Sequenzierung verwendeten Basen sind mit einem Fluoreszenzfarbstoff markiert (siehe Abbildung). Der Einbau einer fluoreszierenden Base an einen DNA-Einzelstrang sendet ein Farbsignal, das spezifisch für eine der vier Basen ist.

Das Prinzip dieser Methode lautet „Sequenzierung durch Synthese“. Das bedeutet, dass die Sequenzierung während des  Baus des komplementären DNA-Strangs erfolgt. Nachdem eine Fluoreszenz-markierte Base in die DNA eingebaut wurde, stoppt die Reaktion, da der Farbstoff die Verknüpfungsstelle für die nächste Base blockiert. Der gebundene Farbstoff wird durch einen Laser angeregt und die Maschine detektiert, wo auf der Platte welcher Farbstoff (d.h. welche Base) eingebaut wurde.

Der Farbstoff wird anschließend mit einem Enzym von der DNA entfernt und die nächste Base wird ergänzt. Erneut kommt es zu einem Stillstand, der Farbstoff der neuen Base wird registriert und entfernt. Der Zyklus wird so lange wiederholt, bis der DNA-Abschnitt einschließlich der jeweiligen Barcodes vollständig sequenziert ist. Aus der Reihenfolge der Farbsignale ergibt sich die Basenabfolge.

erstellt mit BioRender.com

4.) Bei der Auswertung der Daten kann man aufgrund der Barcodes jede Teilsequenz wieder ihrem Ursprung zuordnen. Die Fragmente werden in ihre ursprüngliche Reihenfolge gebracht und auf Unterschiede in den Basenabfolge untersucht.

Zu Beginn wurden den DNA-Fragmenten einer Ursprungsprobe dieselben Barcodes angehängt. In der Auswertung können Fragmente mit demselben Barcode zu einer Probe gruppiert werden. Die Software ordnet die Fragmente in die korrekte Reihenfolge, sodass die vollständige Sequenz entsteht.

Um Mutationen zu erkennen, werden die Sequenzen mit einer Vorlage oder untereinander verglichen. Die Unterschiede in der Basenabfolge sind oft vergleichsweise gering, können aber eine große Veränderung in den Eigenschaften des Virus auslösen.

erstellt mit BioRender.com

bg, 25.07.2022


Quellenangaben

Dieser Artikel wurde von Vera Felsenstein im Rahmen ihres Praktikums bei Open Science – Lebenswissenschaften im Dialog erstellt. Vera hat an der FH Campus Wien ihren Bachelor-Abschluss in Molekularer Biotechnologie gemacht und danach als Technische Assistentin bei der Vienna Covid-19 Detection Initiative (VCDI) gearbeitet. Aktuell unterstützt sie das Projekt SARSeq bei der Sequenzierung von Corona Varianten.

 

© Nadja Meister/Info-Media