close
close

Laborvalidierung eines klinischen metagenomischen Sequenzierungsassays der nächsten Generation zur Erkennung und Entdeckung von Atemwegsviren

Sammlung menschlicher Proben

Restliche, im Labor bestätigte viruspositive Abstrich- oder BAL-Proben der oberen Atemwege aus klinischen Patiententests wurden vom UCSF Clinical Microbiology Laboratory abgerufen. Zu den akzeptablen Abstrichproben der oberen Atemwege gehörten (1) bilaterale Nasopharynx-Abstriche, (2) bilaterale Abstriche der vorderen Nasenhöhle, (3) oropharyngeale Abstriche, (4) kombinierte Nasopharyngeal- und Oropharyngeal-Abstriche und (5) kombinierte oropharyngeale/mittlere Nasenmuschel-Abstriche. Alle Proben mussten für die Aufnahme in unsere Studie die Mindestanforderungen an Probenhandhabung, Lagerung und Volumen erfüllen. Die Proben wurden bei 4 °C gelagert

Inklusion und Ethik

In diese Studie wurden alle Proben einbezogen, die die Mindestanforderungen an Volumen (≥ 450 μl), Probenhandhabung (höchstens ein Gefrier-Auftau-Schritt) und Lagerung (eingefroren bei –80 °C) erfüllen. Proben sowie klinische und Labormetadaten wurden gemäß einem Biobanking-Protokoll mit Verzicht auf Einwilligung gesammelt, das vom UCSF Institutional Review Board genehmigt wurde (Protokoll Nr. 11-05519).

Vorbereitung externer Kontrollen

Die externe Positivkontrolle (PC) wurde hergestellt, indem eine gepoolte negative Nasentupfermatrix mit einem im Handel erhältlichen Referenzmaterial, dem Accuplex Verification Panel (SeraCare, Milford, MA), versetzt wurde. Dieses Panel bestand aus einer Mischung nichtinfektiöser SARS-CoV-2-, Influenza-A-, Influenza-B- und RSV-Genome, die in einer synthetischen Proteinhülle eingekapselt waren, um die Struktur eines viralen Kapsids nachzuahmen. Dieses PC-Material wurde mit einem Titer von ~10 „zudosiert“.4 Kopien/ml für jede Viruskontrolle, 1–2 Logs höher als die geschätzte Nachweisgrenze des Tests (~500 Kopien/ml). Die Negativmatrix wurde durch Zusammenführen von Nasopharyngealabstrichproben von asymptomatischen Personen hergestellt und als externe Negativkontrolle (NC) verwendet.

Nukleinsäureextraktion

500 µl Abstrich der oberen Atemwege oder BAL-Flüssigkeit wurden bei 16.000 × zentrifugiert G für 10 Min. Das MagMAX™ Viral/Pathogen II (MVP II) Nukleinsäure-Isolierungskit (Kat.-Nr. A48383, Thermo Fisher Scientific, Waltham, MA) und das KingFisher™ Flex Purification System mit einem 96-Deep-Well-Kopf (Thermo Fisher Scientific, Waltham, MA). ) wurden für die vollständige Nukleinsäureextraktion verwendet. Dieses Protokoll wurde geändert, um die DNase-Behandlung mit TURBO™ DNase (Kat.-Nr. AM2238, Thermo Fisher Scientific, Waltham, MA) als Wirtsdepletionsschritt während der Extraktion einzubeziehen. Der Bakteriophage MS2 (Kat.-Nr. 22-156-880, Zeptometrix, Buffalo, NY) wurde allen Proben einschließlich der Negativkontrolle als interne qualitative Kontrolle zugesetzt.

Bibliotheksvorbereitung und -sequenzierung

Die gleichzeitige reverse Transkription von gereinigter RNA, versetzt mit ERCC-RNA-Kontrollen (Kat.-Nr. 4456740, Invitrogen, Waltham, MA) und die Depletion ribosomaler RNA (rRNA) wurden mit dem NEBNext® Ultra™ II RNA First Strand Synthesis Module (Kat.-Nr.) durchgeführt E7771S/E7771L, New England Biolabs, Ipswich, MA) bzw. QIAseq FastSelect-rRNA HMR Kit (Kat.-Nr. 334385, Qiagen, Germantown, MD), gefolgt von der Zweitstrang-cDNA-Synthese mit Sequenase™ Version 2.0 DNA-Polymerase (Kat.-Nr. 70775Z1000UN). , Thermo Fisher Scientific, Waltham, MA). Komplementäre DNA (cDNA) wurde unter Verwendung von AMPure XP-Perlen (Kat.-Nr. A63881, Beckman Coulter, Brea, CA) gereinigt und auf das MagicPrep NGS-Instrument (Tecan Genomics, Inc., Männedorf, Schweiz) geladen, um eine Endreparatur und Adapterligation durchzuführen. und Barcode, Amplifikation (25 Zyklen) und Reinigung mit dem DNA-Seq Mech Kit (Kat.-Nr. 30186627/30186628/30186629, Tecan Genomics, Inc., Männedorf, Schweiz). Bibliotheken wurden mit dem Qubit dsDNA HS Assay (Kat.-Nr. Q32854, Thermo Fisher Scientific, Waltham, MA) auf dem Qubit Flex (Thermo Fisher Scientific, Waltham, MA) quantifiziert und normalisiert. Die endgültigen gepoolten Bibliotheken wurden als Single-End-Reads entweder auf dem Illumina (San Diego, CA) MiniSeq unter Verwendung des Rapid Reagent Kit (100 Zyklen) oder auf dem Illumina NextSeq 550 unter Verwendung des Mid-Output- oder High-Output-Kits (150 Zyklen) sequenziert. .

Bioinformatik

Die SURPI+-Rechenpipeline, die als Container (v1.0.0) entweder auf einem sicheren Server oder in einer Cloud-Infrastruktur ausgeführt wird, wurde zur Identifizierung respiratorischer viraler Krankheitserreger anhand von mNGS-Daten verwendet. Lesevorgänge wurden vorverarbeitet, indem Adapter gekürzt und Sequenzen mit geringer Komplexität und geringer Qualität entfernt wurden, gefolgt von einer rechnerischen Subtraktion menschlicher Lesevorgänge. Das skalierbare Nukleotid-Ausrichtungsprogramm43 Der Nukleotid-Aligner wurde mit einer Bearbeitungsdistanz von 16 gegen die Nukleotiddatenbank (NT) des National Center for Biotechnology Information (NCBI) (März 2019, unter Einbeziehung der SARS-CoV-2 WuHan-Hu-1-Genomzugangsnummer NC_045512) ausgeführt wurde vorgefiltert, um nur virale Lesevorgänge zu behalten. Die Pipeline wurde so geändert, dass sie „Tagging“ oder Annotation von Einträgen aus Referenzsequenzen umfasst, die eine Teilmenge der NCBI NT-Datenbank darstellen, wie z. B. FDA-ARGOS23. Beachten Sie, dass die FDA-ARGOS-Datenbank zwar qualitätskontrolliert und reguliert ist, aber nur 1428 Mikrobenstämme enthält, von denen die meisten bakteriell sind. Es wurde auch nicht mit aktuellen Viren wie SARS-CoV-2 aktualisiert; Daher wurden in dieser Studie keine Lesevorgänge festgestellt, die mit viralen Genomen in FDA-ARGOS übereinstimmen. Die Pipeline wurde geändert, um bei Bedarf zusätzliche Referenzdatenbanken wie GISAID aufzunehmen44. Die Pipeline wurde auch geändert, um SPAdes (v3.15.4) zu verwenden.45 und DIAMOND (v2.0.15)46bzw. für die optionale De-novo-Assemblierung von Lesevorgängen in zusammenhängende Sequenzen (Contigs) und die Ausrichtung übersetzter Nukleotidsequenzen zur Identifizierung sequenzdivergenter Viren. Virale Reads wurden mit DIAMOND bei a identifizierte-Wertgrenze von 10–5. Abdeckungskarten wurden automatisch erstellt, indem SURPI+-klassifizierte Virus-Reads dem wahrscheinlichsten Referenzgenom zugeordnet wurden.

Die Qualitätskontrollmetriken für den Test basierten auf denen, die zuvor für Liquor cerebrospinalis ermittelt wurden21und umfassen mindestens 5 Millionen vorverarbeitete Lesevorgänge pro Probe, >75 % der Daten mit einem Qualitätsfaktor >30 (Q> 30) und erfolgreicher Nachweis der 4 Atemwegsviren im PC und der intern gespikten MS2-Phagenkontrolle. Ein Kriterium von ≥3 nicht überlappenden Virus-Reads oder Contigs, die mit dem viralen Zielgenom übereinstimmen, wurde als positiver Nachweis gewertet.

Bewertung der analytischen Leistungsmerkmale von mNGS

Die automatisierten Standardarbeitsanweisungen und Sequenzierungsläufe für diese klinischen Validierungsstudien wurden von einem staatlich zugelassenen klinischen Laborwissenschaftler in Kalifornien durchgeführt. Die LoD wurde für jeden der vier repräsentativen Organismen im PC durch Probit-Analyse unter Verwendung einer Reihe von Verdünnungen im Bereich von 100 bis 5.000 Kopien/ml mit 10 bis 40 Replikaten bei jeder Konzentration bestimmt. Die Linearität wurde durch Auftragen der Standardkurve nachgewiesen. Um die Quantifizierung mithilfe des ERCC und der Positivkontrolle zu validieren, haben wir ein HCV-positives Plasma seriell auf eine bekannte Konzentration im Bereich von 4 × 10 verdünnt6 bis 4 × 103 Kopien/ml in dreifacher Ausfertigung. Anschließend haben wir das quantitative Maß mit dem bekannten Maß verglichen. Die Präzision wurde durch wiederholte Analyse von zwei PC- und zwei NC-Proben in 20 Läufen (Reproduzierbarkeit innerhalb des Assays) und durch Testen von 20 PC- und 20 NC-Proben in 20 separaten Läufen (Reproduzierbarkeit zwischen den Assays) bestimmt. Zur Beurteilung der Inklusivität wurden kommerziell erhältliche Kulturüberstände entnommen, um die Fähigkeit des Assays zum Nachweis der beabsichtigten Ziele zu beurteilen. Jedes der 17 Atemwegsviren mit Titern im Bereich von 1,3 × 104 auf 1,2 × 108 TCID50/ml wurden in einer Verdünnung von 1:10 in die Negativkontrollmatrix gegeben. Diese Viren stellten bekannte Unterlinien und Unterarten dar und wir haben die Fähigkeit des Assays zum Nachweis des Virus bewertet. Wir haben auch Proben von bestätigt viruspositivem BAL getestet (N= 7) und CSF-Proben (N= 4) in eine negative Matrix gegeben, um die Testleistung im Hinblick auf die Erkennung ungewöhnlicher Viren zu bewerten. Um die Exklusivität des mNGS-Assays zu beurteilen, haben wir eine zuvor etablierte Mischung aus sieben repräsentativen Krankheitserregern versetzt, um die falsch-positive Erkennungsrate für virale Krankheitserreger zu bestimmen. Wir haben die Kreuzkontamination zwischen benachbarten Probenvertiefungen und die Verschleppungskontamination über aufeinanderfolgende Läufe von Proben mit hoher Viruslast untersucht. Die Interferenz wurde mithilfe von PC ermittelt, das mit bekannten Mengen an hämolytischem Blut, Lipiden, Bilirubin, menschlicher RNA und bakterieller DNA/RNA versetzt war. Die Wirkung von Schleim in BAL-positiven Flüssigkeiten wurde ebenfalls bewertet. Die Stabilität wurde bestimmt, indem die Proben bis zu 7 Tage lang bei 4 °C aufbewahrt oder drei Einfrier-/Auftauzyklen unterzogen wurden. Die Genauigkeit wurde anhand von 191 klinischen Proben bestimmt, darunter 110 viruspositive Proben (103 Abstrichproben der oberen Atemwege und 7 BAL-Flüssigkeiten) von Patienten mit akuter Atemwegsinfektion sowie 81 virusnegative Proben (52 Abstrichproben der oberen Atemwege und 29 BAL-Flüssigkeiten). Die Proben wurden von Patienten der University of California, San Francisco (UCSF) entnommen. Zu den verwendeten viralen RT-PCR-Vergleichstests gehören Genmark ePlex (Carlsbad, CA), Luminex NxTAG (Austin, TX) und/oder Luminex Verigene RP Flex Respiratory Pathogen Panels. Die mNGS-Ergebnisse wurden mit ursprünglichen klinischen Tests und anschließend mit einem zusammengesetzten Referenzstandard einschließlich Diskrepanztests und klinischer Beurteilung verglichen. Im zweiten Vergleich, bei dem die Ergebnisse nicht übereinstimmten, wurden orthogonale Tests mit einem anderen Instrument oder einem unabhängigen CLIA-Labor (dem kalifornischen Gesundheitsministerium) zusätzlich zur klinischen Beurteilung zur Neuklassifizierung der mNGS-Ergebnisse durchgeführt. Der zweite Vergleich wurde als positive prozentuale Übereinstimmung (PPA) und negative prozentuale Übereinstimmung (NPA) angegeben, da selektive Diskrepanztests die Sensitivitäts- und Spezifitätsergebnisse beeinflussen können.

Orthogonale Diskrepanztests beim kalifornischen Gesundheitsministerium

Die Proben wurden mittels Echtzeit-PCR auf der Grundlage von CDC-Protokollen unter Verwendung eines Virus-Respiratory-Panels getestet, einem unveröffentlichten, vom CDPH-Labor entwickelten Test (LDT). Zu den Viren, die von diesem Panel erkannt werden können, gehörten das humane Metapneumovirus, das Respiratory Syncytial Virus, das Adenovirus, das Parainfluenzavirus (Typ 1, 2, 3 und 4), das Enterovirus/Rhinovirus und die humanen Coronaviren 229E, OC43, NL63 und HKU1.

In-silico-Analyse zur Identifizierung neuartiger, sequenzdivergenter Viren mithilfe der SURPI+-Pipeline

Um die Nachweisfähigkeit für neuartige, sequenzdivergente Viren zu beurteilen, wurde eine In-silico-Analyse durchgeführt. Repräsentative virale Referenzgenome, die Ausbruchsviren von klinischer und öffentlicher Gesundheitsbedeutung mit Pandemiepotenzial entsprechen, wurden aus der NCBI-GenBank-Datenbank abgerufen, in nicht überlappende Segmente aufgeteilt und dann nach dem Zufallsprinzip beprobt und in silico in eine negative Nasentupfermatrix-Sequenzierungsbibliothek aufgenommen. Anschließend haben wir einen übergeordneten Satz taxonomischer Identifikatoren (Art, Gattung und/oder Familie) genommen, die diesen Viren entsprechen, und alle Einträge mit diesen taxonomischen Identifikatoren aus dem SURPI+-Referenzdatensatz entfernt. Als nächstes verwendeten wir die SURPI+-Pipeline, um die simulierte Sequenzierungsdatei sowohl mit der Original- als auch mit der „eingeschränkten Referenz“-Datenbank zu vergleichen und bewerteten die Leistung der Pipeline bei der Erkennung „simulierter“ neuartiger und/oder abweichender Viren, denen eine Referenzsequenz fehlte.

Statistische Analysen

Statistische Analysen wurden mit den Paketen scipy (Version 1.5.3) und rstatix ​​(Version 0.7.0) durchgeführt, wie sie in Python (Version 3.7.12) bzw. R (Version 4.0.3) implementiert sind. Der nichtparametrische Mann-Whitney-U-Test wurde für paarweise Vergleiche der Viruslast-Mediane verwendet, während der Kruskal-Wallis-H-Test für Vergleiche der Mediane aller Schweregradgruppen verwendet wurde. Probit-Regressionsanalysen wurden mit scipy (Version 1.5.3), numpy (Version 1.19.1) und statsmodels (Version 0.12.2) durchgeführt, wie in der Python-Software (Version 3.7.12) implementiert.

Sensitivitäts- und Spezifitätsanalysen wurden wie folgt durchgeführt: Da bei mNGS und RVP mehr als ein Ziel positiv sein kann, wurde jedes Ergebnis in jeder Probe unabhängig bewertet und jedem Ergebnis entsprechend richtig/falsch-negativ/positiv zugeordnet. Die Gesamtzahl der Beobachtungen wurde jedoch konstant gehalten (eine Stichprobe = eine Beobachtung = 1). Wenn beispielsweise bei einem Test zwei Organismen nachgewiesen wurden, nämlich der auslösende Krankheitserreger und ein Kontaminant, wurde dem ersteren 0,5 richtig positiv und dem letzteren 0,5 falsch positiv zugeordnet, so dass ihre Summe immer gleich 1 war. Darüber hinaus wurde as Wir verwendeten RVP als Vergleichstest, der nur eine begrenzte Anzahl von Zielen umfasste. mNGS-positive und RVP-negative Ergebnisse, die kein Ziel für das RVP waren, wurden nicht als falsch positive Ergebnisse betrachtet.

Zusammenfassung der Berichterstattung

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.