banner

Noticias

Nov 15, 2023

Requisitos mínimos para la validación y acreditación ISO15189 de tres procedimientos de secuenciación de próxima generación para el SARS

Scientific Reports volumen 13, número de artículo: 6934 (2023) Citar este artículo

774 Accesos

1 altmétrica

Detalles de métricas

Los avances rápidos y recurrentes de nuevas cepas (variantes) del SARS-CoV-2 han llevado a las autoridades de salud pública de todo el mundo a establecer redes de vigilancia para monitorear la circulación de variantes preocupantes. El uso de tecnologías de secuenciación de próxima generación ha planteado la necesidad de una evaluación del control de calidad como se requiere en los laboratorios clínicos. El presente estudio es el primero en proponer una guía de validación para la tipificación del SARS-CoV-2 utilizando tres métodos NGS diferentes que cumplen con los estándares ISO15189. Estos incluyen la evaluación del riesgo, especificidad, precisión, reproducibilidad y repetibilidad de los métodos. Entre los tres métodos utilizados, dos se basan en amplicones que implican la reacción en cadena de la polimerasa con transcripción inversa (Artic v3 y Midnight v1) en Oxford Nanopore Technologies, mientras que el tercero se basa en amplicones que utilizan la reacción en cadena de la polimerasa del complemento inverso (Nimagen) en tecnología Illumina. Descubrimos que todos los métodos cumplían con el requisito de calidad (p. ej., resultados de tipificación 100 % concordantes en cuanto a precisión, reproducibilidad y repetibilidad) para la tipificación del SARS-CoV-2 en un entorno clínico. Además, los resultados de tipificación que surgieron de cada uno de los tres métodos de secuenciación se compararon utilizando tres nomenclaturas ampliamente conocidas (OMS, Pangolineage y Nextclade). También se compararon con respecto a variaciones de un solo nucleótido. Los resultados mostraron que se debe dar prioridad a Artic v3 y Nimagen para la investigación de brotes, ya que proporcionan resultados de mayor calidad para muestras que no cumplen con los criterios de inclusión para el análisis en un entorno clínico. Este estudio es un primer paso hacia la validación de las pruebas NGS desarrolladas en laboratorio en el contexto de la nueva regulación europea para dispositivos médicos y diagnóstico in vitro.

Los coronavirus son virus de ARN monocatenario con envoltura ampliamente distribuidos entre mamíferos y aves que causan una amplia gama de enfermedades, incluidas infecciones respiratorias. Estos virus presentan una gran diversidad genética y una alta capacidad para realizar recombinaciones y mutaciones genéticas1,2. A finales de 2019, un nuevo miembro de la subfamilia de los coronavirus, denominado SARS-CoV-2, fue detectado por primera vez en China (Wuhan) y se convirtió en responsable de la pandemia mundial sin precedentes que siguió. A pesar de su baja frecuencia de mutación en comparación con otros virus de ARN3, la alta tasa de transmisión del SARS-CoV-2 en humanos aumenta las posibilidades de adquisición de mutaciones y su consiguiente evolución. Por lo tanto, con el tiempo han surgido muchas variantes del SARS-CoV-2, incluidas variantes de interés y variantes preocupantes (COV). Esta última presenta mayor transmisibilidad y/o capacidad de evadir la inmunidad que las cepas que circulaban anteriormente3,4,5,6.

La mayoría de los países han intentado controlar nuevas olas de infección implementando medidas de salud pública con el objetivo de evitar la inundación de los centros de salud, garantizando así el acceso a la atención sanitaria a las personas que necesitan un tratamiento esencial. En este contexto, era fundamental desarrollar una red de vigilancia eficiente que permitiera la detección temprana de nuevas variantes circulantes y su transmisión en la población7,8. La secuenciación del genoma completo no sólo ayuda a los científicos a estudiar el virus y desarrollar vacunas, sino que también es una herramienta clave para establecer redes de vigilancia sólidas.

El genoma completo del SARS-CoV-2 se secuenció por primera vez a principios de 2020 utilizando células infectadas con virus y combinando varias tecnologías de secuenciación de próxima generación (NGS) (es decir, Illumina y Oxford Nanopore Technologies)9. Ambas tecnologías todavía se utilizan ampliamente en todo el mundo para obtener secuencias de cepas circulantes5,6,7,10,11. En septiembre de 2020, la red nacional de secuenciación del Reino Unido, denominada Consorcio Genomics UK de la Enfermedad del Coronavirus 2019 (COVID-19), identificó el primer COV conocido hoy como variante alfa (B.1.1.7). Esta variante del SARS-CoV-2 se caracteriza por la deleción HV69-70 y la mutación del aminoácido N501Y. Fue capaz de propagarse muy rápidamente y exhibió un total de 14 reemplazos de aminoácidos específicos de linaje en comparación con la primera cepa identificada en Wuhan, incluidas tres mutaciones que se sabe confieren beneficios epidemiológicos (es decir, N501Y, deleción 69-70, P681H)7,12 . Desde entonces, se han identificado cuatro variantes principales de preocupación a nivel mundial: beta (K417N, E484K), gamma (K417T, V1176F), delta (L19R, L452R, eliminación 157-158, L452R, T478K, D950N) y la última versión omicron. Variante (R346K, L452X, F486V). Cada una de estas variantes ha acumulado mutaciones que les confieren ventajas evolutivas hasta las variantes ómicrones más prevalentes actualmente, que han adquirido más de 60 mutaciones en comparación con el genoma de referencia de Wuhan6,13,14.

Aunque muchos países establecieron diferentes estrategias de vigilancia para monitorear los COV, la NGS se convirtió en la estrategia fundamental ampliamente adoptada. Las tecnologías NGS se implementaron en muchos laboratorios, incluidos laboratorios médicos. Si bien la NGS es un procedimiento cualitativo capaz de detectar prácticamente un número ilimitado de objetivos15,16, la mayoría de los estándares y recomendaciones para análisis de biología molecular en el entorno clínico están diseñados para pruebas cuantitativas de un solo analito15. Por lo tanto, se necesitan métodos de validación y control de calidad adecuados para garantizar la confiabilidad de los datos de secuenciación generados por NGS. En mayo de 2017, el Parlamento Europeo y el Consejo publicaron nuevos reglamentos sobre productos sanitarios (Reglamento (UE) 2017/745) y productos sanitarios para diagnóstico in vitro (Reglamento (UE) 2017/746), también llamado IVDR, con el objetivo de mejorar la Calidad y seguridad del diagnóstico clínico. Estos estándares aumentan en gran medida el número y la diversidad de requisitos de calidad para la validación de pruebas desarrolladas en laboratorio (LDT). Uno de los requisitos es que todos los LDT deben estar acreditados por un organismo de acreditación nacional y, por lo tanto, cumplir con las normas ISO1518917,18,19. La mayoría de los métodos de secuenciación para patógenos emergentes y en rápida evolución son LDT, su validación es un primer paso hacia el cumplimiento de las normas ISO15189 y el IVDR posterior.

Este trabajo tiene como objetivo complementar los datos publicados sobre los métodos de secuenciación del SARS-CoV-2, principalmente criterios de calidad20 y el informe de evaluación de calidad externa21, mejorando el control de calidad. De hecho, los métodos aquí descritos se han utilizado y evaluado en gran medida22,23,24 por sus limitaciones25,26, pero carecen de procedimientos de validación. El presente trabajo propone una guía de validación para los procedimientos operativos estándar (SOP) de tipificación del SARS-CoV-2 utilizando NGS y siguiendo los estándares de acreditación ISO15189. Además, se compararon las capacidades de tipificación y de identificación de variaciones de un solo nucleótido (SNV) de tres SOP validados. Hasta donde sabemos, este estudio es el primero en proponer un proceso de validación completo para los SOP de secuenciación del genoma completo del SARS-CoV-2 que cumplan con los estándares ISO15189 y conduzcan a la acreditación de los métodos por parte de un organismo de acreditación nacional, un primer paso hacia Implementación del IVDR en el ámbito clínico.

Se recolectaron muestras clínicas (hisopado nasofaríngeo en medio UTM o Zymo) de pacientes sintomáticos o de alto riesgo en contacto con fines de diagnóstico únicamente entre mayo de 2021 y enero de 2022, según lo recomendado por las autoridades sanitarias nacionales en ese momento, y dieron positivo para SARS-CoV- 2 en CHU UCL Namur o en Clinique Saint-Pierre Ottignies utilizando el ensayo Allplex®2019-CoV (Seegene, Seúl, Corea) o el kit TaqPath COVID-19 CE-IVD RT-PCR (Thermo Fisher Scientific; MA, EE. UU.) que detectar el SARS-CoV-2 apuntando respectivamente a cuatro genes (N, E y RdRP/S) o tres genes (N, S y ORF1). Se seleccionaron cincuenta y cinco muestras residuales con un amplio rango de valores de qPCR Ct del gen N (de 12,4 a 35,9) para la validación técnica de los métodos NGS.

El ARN total se extrajo directamente de las muestras clínicas mediante dos métodos diferentes.

Para la secuenciación de Illumina, los ácidos nucleicos se extrajeron utilizando el sistema automatizado de manipulación de líquidos Hamilton Microlab STARlet (Accuramed; Halen, Bélgica) con el kit STARMag Viral DNA/RNA 200 C (Seegene; Seúl, Corea del Sur) siguiendo las instrucciones del fabricante. Todo el procedimiento para veinticuatro muestras tomó 1h15 (tiempo práctico: 15 min).

Para Oxford Nanopore Technologies (ONT), los ácidos nucleicos se extrajeron utilizando el kit de aislamiento de ácido nucleico Viral/Pathogen II de Applied Biosystem\(^{\textrm{TM}}\) MagMAX\(^{\textrm{TM}}\) Viral/Pathogen II ( Thermo Fisher Scientific; MA, EE. UU.) con el sistema automatizado KingFisher Flex96 (Thermo Fisher Scientific; MA, EE. UU.). Se agregaron proteinasa K y perlas de unión a muestras clínicas previamente dispensadas en una placa de 96 pocillos profundos. Las placas se introdujeron en el KingFisher Flex96 y se utilizó el protocolo MVP_2Wash_200_Flex, según instrucciones del fabricante. Todo el procedimiento para veinticuatro muestras tomó 45 minutos (tiempo práctico: 20 minutos).

La transcripción inversa de extractos de ARN se realizó utilizando el NEBNext®LunaScript®RT SuperMix Kit 5x (New England Biolabs; MA, EE. UU.). Siguiendo el procedimiento operativo estándar (POE) de Illumina, se mezclaron 6 \(\upmu\)L de ARN con 2,4 \(\upmu\)L de la enzima diluida en 3,6 \(\upmu\)L de agua libre de nucleasas. Según el ONT SOP, se mezclaron 8 \(\upmu\)L de ARN con 2\(\upmu\)L de enzima. Las mezclas se incubaron a 25 \(^{\circ }\)C durante 2 min (recocido de cebadores poli-dT), a 55 \(^{\circ }\)C durante 20 min para Illumina SOP o 10 min para ONT SOP (síntesis de ADNc) y finalmente a 95 \(^{\circ }\)C durante 1 min (inactivación de enzimas). Todo el procedimiento para veinticuatro muestras tomó 20 minutos para los SOP de ONT y 30 min para los SOP de Illumina.

El ADNc se amplificó utilizando el kit de preparación de biblioteca WGS EasySeq\(^{\textrm{TM}}\) SARS-CoV-2 (Nimagen BV; Nijmegen, Países Bajos), en adelante denominado Nimagen, utilizando tecnología de PCR de complemento inverso (RC-PCR). que produce amplicones cortos (alrededor de 200 pb). Esta tecnología permite la amplificación del ADNc utilizando dos tipos de cebadores: cebadores específicos de diana con cola universal y cebadores universales acoplados a secuencias adaptadoras de Illumina y a secuencias índice i5 e i7 para la identificación de muestras27. Se realizaron dos RC-PCR (A y B) para cada muestra con dos grupos de cebadores que cubren todo el genoma del SARS-CoV-2. Se mezcló ADNc (5 \(\upmu\)L) de cada muestra con 0,2 \(\upmu\)L del panel de sondas A o B por separado, 0,8 \(\upmu\)L de tampón de dilución de sonda y 10 \( \upmu\)L de 2x mezcla maestra. Las muestras se incubaron a 98 \(^{\circ }\)C durante 2 minutos para la desnaturalización del ADN bicatenario. A continuación, se generaron cebadores de índice objetivo funcionales (combinación de cebadores específicos de objetivo y cebadores universales) mediante la incubación de muestras a 98 \(^{\circ }\)C durante 10 s, a 80 \(^{\circ }\) C durante 1 s, a 58 \(^{\circ }\)C durante 10 min y a 72 \(^{\circ }\)C durante 1 min. Luego, se agregaron índices, adaptadores de secuencia y colas universales a los extremos 5' y 3' de los fragmentos de ADN objetivo realizando dos ciclos de incubación a 98 \(^{\circ }\)C durante 10 s, 80 \(^{\ circ }\)C durante 1 s, 62 \(^{\circ }\)C durante 90 min y durante 2 min a 72 \(^{\circ }\)C. Finalmente, los fragmentos de ADNc con índices, adaptadores de secuencia y colas universales se amplificaron realizando 40 ciclos de incubación a 95 \(^{\circ }\)C durante 10 s, 80 \(^{\circ }\)C durante 1 s. , 62 \(^{\circ }\)C durante 2 min y 72 \(^{\circ }\)C durante 1 min. Todo el procedimiento para veinticuatro muestras tomó 7 h (tiempo práctico: 30 min).

El ADNc se amplificó con dos PCR multiplexadas, cada una de las cuales comprende un conjunto de cebadores específicos (A y B) (Integrated DNA Technologies; Iowa, EE. UU.) para cubrir todo el genoma del SARS-CoV-2. Ya sea con amplicones cortos de alrededor de 400 pb para el SOP v322 de secuenciación de códigos de barras de Artic nCoV 2019, en adelante llamado Artic v3 o con amplicones más largos de alrededor de 1200 pb para el SOP v123 de secuenciación rápida de códigos de barras de nCoV 2019, en adelante llamado Midnight v1. Se mezclaron 2,5 \(\upmu\)L de ADNc con 0,4 \(\upmu\)L (Artic v3 SOP) o 0,11 \(\upmu\)L (Midnight v1 SOP) de los grupos de cebadores A o B por separado, 12,5 \(\upmu\)L. (\upmu\)L de Q5®Hot Start High-Fidelity 2X Master Mix (New England Biolabs; MA, EE. UU.) y 9,6 \(\upmu\)L (Artic v3 SOP) o 9,89 \(\upmu\)L (Midnight v1 SOP) de agua libre de nucleasas y se incuba a 98 \(^{\circ }\)C durante 30 s (activación por calor), seguido de 30 (Artic v3 SOP) o 32 ciclos (Midnight v1 SOP) de incubación a 98 \(^{\circ }\)C durante 15 s y 65 \(^{\circ }\)C durante 5 min (recocido y alargamiento de cebadores). Todo el procedimiento para veinticuatro muestras tomó 3h15 (tiempo práctico: 30 min) para ambos SOP.

Todos los productos de ADNc A y B amplificados por RC-PCR se combinaron por separado. Para homogeneizar la profundidad de lectura entre muestras durante la secuenciación, el volumen de muestra introducido en los pools depende de la carga viral de cada muestra: 2 \(\upmu\)L si valor de qPCR Ct <20, 4 \(\upmu\)L si 20\(\le\) valor de qPCR Ct \(\le\)25 u 8 \(\upmu\)L si valor de qPCR Ct > 25. 40 \(\upmu\)L de cada conjunto diluido con 60 \( Se purificó \upmu\)L de tampón RC-PCR Low-TE (Nimagen BV; Nijmegen, Países Bajos) utilizando 85 \(\upmu\)L de perlas magnéticas AmplicleanTM de inmovilización reversible en fase sólida (SPRI) (Nimagen BV; Nijmegen, Países Bajos). ) mezclando ADN y perlas (relación perlas:ADN = 0,85), seguido de incubación de la mezcla a temperatura ambiente (RT) durante 5 minutos, luego las perlas se lavaron dos veces con etanol al 75%. Las perlas cubiertas con fragmentos de ADN de interés se mezclaron con 110 \(\upmu\)L de tampón RC-PCR Low TE (Nimagen BV; Países Bajos) y se incubaron a temperatura ambiente durante 2 minutos. El procedimiento de purificación se repitió una segunda vez. El ADN eluido de cada conjunto se cuantificó utilizando el kit 1xdsDNA HS (Thermo Fisher Scientific; MA, EE. UU.) con Qubit 4.0 (Thermo Fisher Scientific; MA, EE. UU.) y el tamaño y la integridad de los amplicones se verificaron utilizando el analizador de fragmentos QIAxcel (Qiagen; Hilden , Alemania) con el kit de detección de ADN (Qiagen; Hilden, Alemania).

Cada suspensión de ADN se diluyó para alcanzar una concentración de 2 nM utilizando tampón RC-PCR Low-TE (Nimagen BV; Nijmegen, Países Bajos) antes de combinarlas y diluirlas para alcanzar una concentración final de biblioteca de 80 pM. Todo el procedimiento duró 1h45 (tiempo práctico: 1h30).

El ADN amplificado de cada reacción de PCR se agrupó por muestra y cada muestra se cuantificó utilizando el kit 1XdsDNA HS (Thermo Fisher Scientific; MA, EE. UU.) y el Qubit 4.0 (Thermo Fisher Scientific; MA, EE. UU.). Las muestras se diluyeron para obtener como máximo un factor 2 entre la muestra menos concentrada y la más concentrada para homogeneizar la profundidad de lectura. Se desafilaron los extremos de 3,3 \(\upmu\)L de ADN con 5'-fosfatos y 3'-hidroxilos mediante la adición de 1,2 \(\upmu\)L de tampón de reacción de preparación Ultra II End, 0,5 \(\upmu\) de ADN. L de mezcla de enzimas Ultra II End prep del kit NEBNext®End Repair (New England Biolabs; MA, EE. UU.) y 5 \(\upmu\)L de agua libre de nucleasa y se incuba a 25 \(^{\circ }\) C durante 15 min, luego a 65 \(^{\circ }\)C durante 15 min. Se codificaron 0,75 \(\upmu\)L de cada muestra con extremos romos con 1,25 \(\upmu\)L de códigos de barras nativos del kit Native Barcoding Expansion 96 (Oxford Nanopore Technologies; Oxford, Reino Unido), 5 \(\upmu\)L \)L de enzima Blunt/TA Ligase (New England Biolabs; MA, EE. UU.) y 3 \(\upmu\)L de agua libre de nucleasa incubando las mezclas a 25 \(^{\circ }\)C durante 20 min. , luego a 65 \(^{\circ }\)C durante 10 min. Todas las muestras se combinaron y luego se purificaron con perlas magnéticas AMPure XP (Beckman Coulter; CA, EE. UU.) mezclando la biblioteca de ADN con perlas en una proporción de 0,4 perlas:ADN y se incubaron a temperatura ambiente durante 8 minutos. Las perlas se lavaron dos veces con tampón de fragmentos cortos (Oxford Nanopore Technologies; Oxford, Reino Unido) y una vez con etanol al 70%. Los fragmentos de ADN se eluyeron incubando las perlas en 30 l de agua libre de nucleasas a temperatura ambiente durante 5 min.

La biblioteca de ADN se cuantificó utilizando el kit 1xdsDNA HS (Thermo Fisher Scientific; MA, EE. UU.) con el Qubit 4.0 (Thermo Fisher Scientific; MA, EE. UU.), y se ligaron 30 ng de ADN bicatenario a la proteína adaptadora AMII (Oxford Nanopore Technologies; Oxford, Reino Unido) utilizando 10 \(\upmu\)L de tampón y 5 \(\upmu\)L de ligasa del kit NEBNext Quick Ligation Module (New England Biolabs; MA, EE. UU.) e incubación durante 10 minutos a temperatura ambiente. . La biblioteca de ADN se purificó por segunda vez con perlas magnéticas AMPure XP (Beckman Coulter; CA, EE. UU.) para eliminar fragmentos de ADN de muy alto peso molecular y proteínas no unidas mezclando la biblioteca con perlas (relación perla:ADN = 1) e incubación a RT durante 5 min. Las perlas se lavaron dos veces con tampón de fragmentos cortos (Oxford Nanopore Technologies; Oxford, Reino Unido) y el ADN se eluyó incubando las perlas en 15 \(\upmu\)L de tampón de elución (Oxford Nanopore Technologies; Oxford, Reino Unido) durante 2 minutos a RT. La biblioteca final se cuantificó utilizando el kit 1xdsDNA HS (Thermo Fisher Scientific; MA, EE. UU.) y Qubit 4.0 (Thermo Fisher Scientific; MA, EE. UU.). La concentración de ADN bicatenario debe ser de al menos 1 ng/\(\upmu\)L para proceder con la secuenciación. Se agregaron a la biblioteca 37,5 \(\upmu\)L de tampón de secuenciación y 25,5 \(\upmu\)L de perlas de carga incluidas en el kit de viales auxiliares de secuenciación (Oxford Nanopore Technologies; Oxford, Reino Unido) de acuerdo con las instrucciones del fabricante. Todo el procedimiento duró 3h30 (tiempo práctico: 2h30).

El ADN amplificado de cada reacción de PCR (A y B) se reunió por muestra. Se codificaron las muestras con el Rapid Barcoding Kit 96 (Oxford Nanopore Technologies; Oxford, Reino Unido) incubando 5 \(\upmu\)L de cada muestra con 2,5 \(\upmu\)L de un código de barras único y 2,5 \(\upmu\)L de \)L de agua libre de nucleasas a 30 \(^{\circ }\)C durante 2 min, luego a 80 \(^{\circ }\)C durante 2 min. Se agruparon volúmenes idénticos de cada muestra con código de barras. La biblioteca de ADN se purificó mediante SPRI con perlas magnéticas (Oxford Nanopore Technologies; Oxford, Reino Unido) mezclando ADN y perlas (relación perla:ADN = 1) e incubando la mezcla a temperatura ambiente durante 5 minutos. Las perlas se lavaron dos veces con etanol al 80 % y se incubaron en 30 \(\upmu\) L de tampón de elución (Oxford Nanopore Technologies; Oxford, Reino Unido) para eluir el ADN. El ADN purificado se cuantificó utilizando el kit 1XdsDNA HS (Thermo Fisher Scientific; MA, EE. UU.) y el Qubit 4.0 (Thermo Fisher Scientific; MA, EE. UU.). Se mezclaron entre 600 ng y 800 ng de biblioteca de ADN con 1 \(\upmu\)L de proteína adaptadora RAPF (Oxford Nanopore Technologies; Oxford, Reino Unido) y se incubaron durante 5 minutos a temperatura ambiente. Se agregaron a la biblioteca 37,5 \(\upmu\)L de tampón de secuenciación II y 25,5 \(\upmu\)L de perlas de carga II incluidos en el kit de viales auxiliares de secuenciación (Oxford Nanopore Technologies; Oxford, Reino Unido) de acuerdo con las instrucciones del fabricante. . Todo el procedimiento duró 50 min (tiempo práctico: 40 min).

La biblioteca se cargó en un cartucho iSeq100 de 300 ciclos (Illumina; San Diego, CA, EE. UU.) con un sistema de secuenciación ISeq100 (Illumina; San Diego, CA, EE. UU.). Se utilizaron los siguientes parámetros para la secuenciación:

Modo GenerarFastq

Kit de preparación de biblioteca: Nimagen IDX96-U01

Tipo de lectura: extremo emparejado

Longitudes de lectura: lectura1 = 151, índice1 = 10, índice2 = 10, lectura2 = 151

Recorte del adaptador activado

La celda de flujo R9.4 (Oxford Nanopore Technologies; Oxford, Reino Unido) se cebó utilizando el kit de cebado de celda de flujo (Oxford Nanopore Technologies; Oxford, Reino Unido) y la biblioteca se cargó en la celda de flujo. Las series de secuenciación se realizaron con un GridION (Oxford Nanopore Technologies; Oxford, Reino Unido) utilizando los siguientes parámetros.

Tensión de polarización inicial: −180 mV

Modelo de llamada base: llamada base de alta precisión

Biblioteca Artic v3 de códigos de barras: barcoding_kits=EXPNBD196,trim_barcodes=“off”,require_barcodes_both_ends=“on”, detect_mid_strand_barcodes=“off”,min_score=60

Biblioteca de códigos de barras Midnight v1: barcoding_kits=SQK-RBK11096, trim_barcodes=“off”, require_barcodes_both_ends=“off”, detect_mid_strand_barcodes=“on”, min_score=60, min_score_mid=50

Leer filtrado: min_qscore=9

El análisis de las lecturas se realizó según el pipeline easyseq_covid19 de Jordy Coolen disponible en GitHub (https://github.com/JordyCoolen/easyseq_covid19). Después de la secuenciación, las lecturas obtenidas se filtraron con fastp (versión 0.20.1) en función de la calidad de las secuencias. Las lecturas se alinearon con el genoma de referencia NC_045512.2 del SARS-CoV-2 con el software bwa (versión 0.7.17). Las secuencias correspondientes a los cebadores se recortaron con bamclipper (versión 1.0.0). Las variantes de nucleótido único (SNV) se llamaron usando bcftools (versión 1.9) combinado con KMA (versión 1.3.9) con los siguientes parámetros: frecuencia de mutación \(\ge\) 75%, puntaje de calidad \(\ge\) 20, profundidad de lecturas \(\ge\) 5. Finalmente, la secuencia de consenso se obtuvo con el consenso de bcftools (versión 1.9)24.

El análisis de los datos de secuenciación se realizó siguiendo las instrucciones de Oxford Nanopore Technologies. La llamada base y la demultiplexación (distribución de lecturas) se llevaron a cabo en tiempo real mediante, respectivamente, guppybasecaller y guppybarcoder, ambos integrados en el software de secuenciación MinKnow (versión 21.05.12).

El procesamiento adicional de datos se realizó siguiendo el proceso bioinformático descrito por ARTICnetwork28. Las lecturas se filtraron según su calidad (puntuación de calidad>9) y su longitud (Artic: longitud mínima = 400 pb - longitud máxima = 700 pb, Midnight: longitud mínima = 600 pb - longitud máxima = 1200 pb) para evitar lecturas quiméricas . Las lecturas aprobadas se asignaron al genoma de referencia del SARS-CoV-2 MN908947.3 usando minimap2 (versión 2.18-r1015) y se llamaron a los SNV para posiciones con profundidad de lectura \(\ge\) 20, y la secuencia de consenso se obtuvo usando medaka. (versión 1.4.3, modelo r941_prom_variant_g360) un software que utiliza modelos basados ​​en redes neuronales entrenados para llamar adecuadamente a variaciones de secuencia29.

La tipificación molecular de las cepas de SARS-CoV-2 se realizó utilizando diferentes clasificaciones: OMS, Nextclade y Pangolin con las bases de datos Nextclade30 (versión 2.2.0) y Pango-designation31 (versión 1.9, linajes versión 2022-05-13) disponibles en línea.

Se utilizó el kappa de Cohen para medir la concordancia por pares entre dos listas de llamadas de SNP, digamos A y B, una para cada SOP. Se calculó de la siguiente manera.

Cada posición se clasifica como mutada o no según A y B, lo que proporciona una lista de clasificaciones pareadas que se dividen en cuatro categorías: (a) mutada para A y B, (b) mutada para A pero no para B, (c) mutada para B pero no para A y (d) no mutado ni para A ni para B.

La proporción de resultados concordantes (P0) y la proporción de resultados concordantes atribuibles al azar (Pc) se calcularon a partir del número de pares de cada categoría, na, nb, nc y nd.

Donde N es el número total de pares. El Kappa de Cohen (\(\kappa\)) se define entonces de la siguiente manera:

El resultado es un número entre −1 y 1, un \(\kappa\) de 1 representa una coincidencia perfecta entre dos listas mientras que 0 o menos representa un acuerdo que no excede lo que produciría el azar. [0;0.2[ indica acuerdo muy débil, [0.2;0.4[ acuerdo débil, [0.4;0.6[ acuerdo moderado, [0.6;0.8[ acuerdo alto, [0.8;1[ acuerdo muy alto).

Estos análisis de concordancia se realizaron utilizando R 4.1 (R Foundation for Statistical Computing; Austria, Viena, 2021).

La norma ISO 15189:2012 especifica requisitos de calidad y competencia en los laboratorios médicos32. Lo utilizan los organismos nacionales de acreditación para evaluar, reconocer y confirmar la competencia de un laboratorio médico para un método específico. Esta norma requiere la validación de cualquier método analítico no estándar para confirmar su desempeño y los requisitos específicos para su uso previsto. Las características de desempeño que deben evaluarse mediante un método cualitativo son:

Incertidumbre, al evaluar la influencia de factores externos en el resultado. Utilizamos el método 5M, también llamado diagrama de Ishikawa, para mostrar que los factores externos no influyen en el resultado de nuestros análisis. Este método se utiliza frecuentemente en biología molecular y es el método más utilizado para evaluar factores de riesgo en la fabricación farmacéutica33. Facilita la evaluación sistemática de los factores de entrada que potencialmente afectan el rendimiento del método33,34.

Especificidad, al verificar que las lecturas de NGS para las muestras negativas de PCR del SARS-CoV-2 no coincidan con el genoma del SARS-CoV-2.

Precisión, al participar en pruebas redondas de Evaluación Externa de Calidad (EQA): debemos alcanzar el 100% de concordancia en los resultados de tipificación.

Reproducibilidad, comparando las mutaciones de nucleótidos identificadas para al menos 3 muestras en 3 ejecuciones de secuenciación independientes: debemos alcanzar el 100% de concordancia para los resultados de tipificación y \(\kappa\) > 0,81 para la identificación de SNV.

Repetibilidad, comparando las mutaciones de ácido nucleico identificadas para al menos 3 muestras secuenciadas tres veces dentro de la misma secuenciación: debemos alcanzar el 100 % de concordancia para los resultados de tipificación y \(\kappa\) > 0,81 para la identificación de SNV.

Los umbrales de aceptación para cada característica se describen en nuestro procedimiento interno para la validación de métodos de biología molecular acreditados por el Organismo Belga de Acreditación (BELAC).

Según la ley belga publicada en el “Moniteur belge” el 30 de diciembre de 2008, página 68774, sobre la recolección y el uso de material humano para aplicaciones médicas humanas o investigaciones científicas, no se requiere el consentimiento del paciente ni la aprobación del comité de ética para el uso de muestras de diagnóstico residuales. para investigaciones no médicas (Título II; Cap. 1; Art. 3; §5).

En este estudio, validamos y comparamos tres SOP de secuenciación del genoma completo del SARS-CoV-2 basados ​​en amplicones. En el marco de estas validaciones, cincuenta y cinco muestras positivas para SARS-CoV-2 han sido secuenciadas con tres SOP de secuenciación: Artic v3, Midnight v1 y Nimagen. Como parte de la acreditación de las normas ISO15189, evaluamos la incertidumbre de cada método utilizando el diagrama 5M y la especificidad mediante la secuenciación de tres muestras de hisopos nasofaríngeos que dieron negativo para SARS-CoV-2. Dos muestras formaron parte de un panel de evaluación de calidad externo y se utilizaron para evaluar la precisión de los métodos. Se secuenciaron siete muestras en tres ejecuciones de secuenciación independientes y tres veces en las mismas ejecuciones de secuenciación para cada SOP para evaluar, respectivamente, la reproducibilidad y repetibilidad de los métodos.

Finalmente, se compararon los resultados de tipificación y la identificación de SNV entre cada SOP.

Evaluamos la incertidumbre de los POE utilizando un diagrama de 5M (Medición/Medio, Material, Máquina, Método, Mano de obra) (Tabla complementaria 1).

El ambiente (Gestión/Medio) se encuentra en condiciones de temperatura monitoreadas. Las habitaciones tienen funciones dedicadas y los bancos de trabajo se limpian antes y después de cada manipulación con una solución de descontaminación de borrado de ADN (MP Biomedicals; Irvine, CA) como se describe en la sección "Gestión/medio" de la tabla complementaria 1 para reducir el riesgo de contaminación cruzada. . No obstante, el uso de material amplificado, así como el gran tamaño de los lotes de muestras, aumentan el riesgo de contaminación cruzada35. Se añadió un control negativo (agua libre de nucleasas) a cada secuenciación, desde el paso de transcripción inversa, para evaluar una posible contaminación cruzada. Se demostró que por debajo del 5 % de lecturas de contaminantes, no se observó ninguna variación en la escritura o en las llamadas de SNV23. Reproducimos estos experimentos in silico y confirmamos las conclusiones de Freed et al. (datos no mostrados). El número de lecturas obtenidas en nuestros controles negativos representa menos del 2,5% del número total de lecturas obtenidas para la muestra con el menor número de lecturas en cada ejecución (Artic v3: 1,68% ± 0,011, Midnight v1: 1,90% ± 0,0035, Nimagen: 2,04% ± 0,0031). Podemos concluir que los tres POE son lo suficientemente estrictos como para reducir la contaminación cruzada técnica a un nivel que no afecte los resultados.

Los lotes de reactivos están documentados para cada análisis y las hojas de datos de seguridad del material están disponibles para cada reactivo (Material). Los dispositivos pasan por procedimientos de mantenimiento diario, trimestral y/o anual y el software se valida después de cada actualización importante (Máquina). Los resultados pasan por criterios de validación descritos en el apartado de materiales y métodos antes de ser validados técnica y médicamente, y los procedimientos se revisan cada dos años (Método). El personal está capacitado, calificado, conoce los procedimientos y se evalúa anualmente (Manpower) (Tabla complementaria 1).

Evaluamos la especificidad de los tres SOP incluyendo tres muestras negativas de PCR de SARS-CoV-2 en tres ejecuciones independientes desde la extracción hasta el paso de secuenciación. Aunque estas muestras generaron una gran cantidad de lecturas, hasta 68 000 lecturas, menos de diez lecturas por muestra coinciden con el genoma del SARS-CoV-2 (datos no mostrados). Esto indica que los tres SOP son muy específicos para la secuenciación y los análisis del SARS-CoV-2.

Para evaluar la precisión de los tres SOP, utilizamos dos muestras (UZL_CV10_07 y UZL_CV10_89) recibidas en noviembre de 2021 en el contexto de un panel de Evaluación de Calidad Externa (EQA) organizado por el Centro Nacional de Referencia (NRC) de Bélgica para virus respiratorios como un anillo. prueba. La NRC centralizó las muestras originalmente secuenciadas en laboratorios independientes, se confirmó el resultado de la tipificación y las muestras se enviaron a otros dos laboratorios independientes. Por lo tanto, comparamos nuestros resultados con los obtenidos por el laboratorio de origen y otro laboratorio para ambas muestras. La comparación se realizó en dos niveles: tipificación según las directrices de la OMS y dos bases de datos (Pangolin31 y Nextclade30), y comparación de mutaciones de aminoácidos. Los resultados de tipificación son idénticos para la muestra UZL_CV10_07 en nuestro laboratorio y en ambos laboratorios con los que se comparó para las tres nomenclaturas (Tabla 1), mientras que la mutación I2230T solo fue identificada por un laboratorio independiente y el nuestro utilizando los tres SOP (datos no mostrados). . Los resultados de tipificación para la muestra UZL_CV10_89 son idénticos en nuestro laboratorio y en ambos laboratorios con los que se comparó cuando se usa Nextclade o según las pautas de la OMS, pero difieren de un laboratorio a otro cuando se usa la base de datos Pangolin (Tabla 1). Estas discrepancias se deben al uso de una nueva versión de la base de datos Pangolin en nuestro laboratorio. De hecho, los resultados de mecanografía de ambos laboratorios externos se publicaron utilizando Pangolin v3.1.16, versión de linajes 2021-11-25 que aún no contenía el linaje AY.126. Aunque se observaron muchas discrepancias al analizar las mutaciones de aminoácidos descritas por cada laboratorio (datos no mostrados), no afectaron los resultados de tipificación. Los tres SOP mostraron una tasa de éxito del 100%. El NRC confirmó la identificación correcta de todas las muestras de EQA en nuestro laboratorio. Desde entonces, hemos participado con éxito en otras tres pruebas organizadas por la NRC.

Evaluamos la reproducibilidad de los tres SOP secuenciando siete muestras en tres ejecuciones independientes. La reproducibilidad se evaluó en tres niveles: tipificación según las directrices de la OMS y dos bases de datos (Pangolin y Nextclade), mutaciones de aminoácidos (aa) e identificación de SNV.

En cuanto a la tipificación de muestras con una cobertura suficiente, la concordancia alcanzó el 100% para las tres nomenclaturas con los tres SOP (Tabla complementaria 2). La muestra CV2031641758, que tenía un valor qPCR Ct = 29,01, no se pudo escribir en ninguna de las bases de datos utilizadas para el SOP de medianoche debido a una cobertura muy baja (ejecución 1: cobertura media = 0x, 0% > 100x, ejecución 2: cobertura media = 0x, 0% > 100x, ejecución 3: cobertura media = 5x, 1,5% > 100x).

La concordancia en el nivel de mutación aa se evaluó mediante el coeficiente kappa de Cohen. Este coeficiente (\(\kappa\)) representa la confiabilidad entre dos medidas cualitativas al considerar la probabilidad de que el acuerdo ocurra por casualidad. Cada SOP tenía una reproducibilidad muy alta para la identificación de mutaciones aa para muestras con valores de qPCR Ct <25 (Artic v3: media \(\kappa\) = 0,9883 ± 0,01011, Midnight v1: media \(\kappa\) = 1 ± 0, Nimagen: media \(\kappa\) = 0,8566 ± 0,03534). Para una muestra con valor qPCR Ct = 29,01, la reproducibilidad es alta para Nimagen (\(\kappa\) = 0,7599 ± 0,1293), moderada para Artic v3 (\(\kappa\) = 0,4945 ± 0,1014) y muy débil para Midnight v1 (\(\kappa\) = 0 ± 0).

A nivel de mutación de nucleótidos, la reproducibilidad es alta (\(\kappa\) > 0,8) para todas las muestras con un valor de qPCR Ct < 25 (Artic v3: media \(\kappa\) = 0,9918 ± 0,01060, Midnight v1: media \(\kappa\) = 1 ± 0, Nimagen: media \(\kappa\) = 0.9433 ± 0.1468). Para la muestra con el valor más alto de qPCR Ct (Ct = 29,01), los coeficientes son más bajos (Artic v3: \(\kappa\) = 0,6896 ± 0,02007, Midnight v1: \(\kappa\) = 0 ± 0,00005, Nimagen: \ (\kappa\) = 0,7659 ± 0,05119) lo que indica una mayor discrepancia, especialmente para el SOP Midnight v1. Ambos métodos de amplicones cortos (Artic v3 y Nimagen) tienen un coeficiente que indica una alta correlación (Fig. 1, panel izquierdo). Aunque la reproducibilidad de los tres métodos es similar para muestras con un valor de qPCR Ct <25, la reproducibilidad del SOP Midnight v1 es significativamente diferente de la de los otros dos métodos para muestras con un valor de qPCR Ct >25 (tabla complementaria 3).

Evolución del coeficiente kappa de Cohen de la reproducibilidad (panel izquierdo) y la repetibilidad (panel derecho) para cada muestra en función del valor de Ct para el gen N y para cada método: Artic v3 (rojo), Midnight v1 (verde) y Nimagen (azul). Un coeficiente kappa de 1 significa una coincidencia perfecta entre tres ejecuciones independientes (panel izquierdo) o entre tres repeticiones en la misma ejecución (panel derecho) cuando un coeficiente kappa de 0 puede interpretarse como un acuerdo que no excede lo que produciría el azar. Los tres métodos tienen un alto coeficiente kappa de reproducibilidad y repetibilidad para todas las muestras con un valor de Ct <25, pero este coeficiente disminuye para las muestras por encima de ese umbral.

Evaluamos la repetibilidad de cada SOP secuenciando siete muestras tres veces en una misma ejecución. La repetibilidad se evaluó en tres niveles: tipificación según las directrices de la OMS y dos bases de datos (PangoLineage y Nextclade), mutaciones aa e identificación de SNV.

Todos los resultados de tipificación fueron concordantes para cada muestra procesada con los tres SOP, excepto la muestra CV2031641758 que tiene el valor qPCR Ct más alto (29.01) y no se pudo tipificar usando el SOP Midnight debido a la baja cobertura (repetición 1: cobertura media = 1x, 0% > 100x, repetir 2: cobertura media = 0x, 0% > 100x, repetir 3: cobertura media = 1x, 0% > 100x) (Tabla complementaria 4).

El análisis estadístico kappa realizado para evaluar la concordancia de las mutaciones aa mostró la muy alta repetibilidad de todos los SOP para muestras con valores de qPCR Ct < 25 (Artic v3: media \(\kappa\) = 0,9953 ± 0,00402, Midnight v1: media \ (\kappa\) = 1 ± 0, Nimagen: media \(\kappa\) = 0.9435 ± 0.02546) pero el coeficiente \(\kappa\) disminuyó para la muestra con valor de qPCR Ct > 25 (Artic v3: \(\kappa \) = 0,7279 ± 0,08269, Midnight v1: \(\kappa\) = 0 ± 0, Nimagen: \(\kappa\) = 0,8837 ± 0,03753) todavía muestra una alta repetibilidad para Nimagen y Artic, mientras que Midnight v1 no es repetible.

Los resultados para las mutaciones de nucleótidos fueron similares: la repetibilidad fue muy alta para muestras con un valor de qPCR Ct < 25 (Artic v3: media \(\kappa\) = 0,9961 ± 0,002926, Midnight v1: media \(\kappa\) = 1 ± 0, Nimagen: media \(\kappa\) = 0,9742 ± 0,01683) pero el coeficiente kappa fue menor para la muestra con un valor de Ct >25 (Artic v3: \(\kappa\) = 0,7581 ± 0,01951, Nimagen: \( \kappa\) = 0,8287 ± 0,01903), especialmente para el SOP Midnight v1 que tenía un coeficiente \(\kappa\) = 0 ± 0,00003, lo que indica que no era repetible para muestras con un valor de qPCR Ct > 25 (Fig. 1). panel derecho). Esto se debió a la baja profundidad de lectura (<20) en la mayoría de las posiciones de nucleótidos para dos repeticiones realizadas con el SOP Midnight v1. Como esta profundidad era el umbral mínimo establecido en el proceso bioinformático para la llamada de nucleótidos en la secuencia de consenso, y como la tercera repetición tenía una profundidad de lectura suficiente en estas posiciones, el análisis resultó en una falta de coincidencia total. Aunque la repetibilidad no es significativamente diferente entre los tres métodos para muestras con un valor de qPCR Ct <25, la repetibilidad del SOP Midnight v1 es significativamente diferente en comparación con los otros dos métodos para un valor de qPCR Ct >25 (tabla complementaria 3).

Los tres SOP descritos en este artículo cumplieron con el criterio de validación ISO15189 para muestras con un valor de qPCR Ct <25, que es el criterio de exclusión recomendado para análisis en un entorno clínico. Aunque los tres métodos no fueron lo suficientemente potentes para analizar muestras con un valor de qPCR Ct > 25 en un entorno clínico, los resultados de la secuenciación y la tipificación de cepas se pueden obtener en un entorno no clínico, pero deben interpretarse con precaución. Por lo tanto, comparamos los tres métodos utilizando cincuenta y cinco muestras sin considerar los criterios de exclusión del valor de Ct.

Las muestras se secuenciaron según los tres SOP y se compararon en dos niveles: tipificación según las directrices de la OMS y dos bases de datos (Pangolin y Nextclade), e identificación de SNV.

Para cuarenta y cinco de cincuenta y cinco muestras con resultados de tipificación válidos, incluidas veintisiete muestras de veintinueve con un valor de qPCR Ct <25, las nomenclaturas de la OMS y NextClade muestran una concordancia del 100 % entre los tres métodos. Para Pangolin, que es un método de tipificación más estricto, observamos cinco discrepancias entre los SOP. Entre estos, Pangolineage identificó una variante que se origina directamente en el ancestro más cercano identificado para los otros SOP. Calificamos estas discrepancias como inexactitudes y no como discrepancias reales. Todas las muestras que presentaban estas imprecisiones tenían un valor de qPCR Ct> 30 para el gen N (Tabla 2).

Diez muestras secuenciadas con el SOP Midnight v1 no se pudieron escribir en ninguna nomenclatura debido a una cobertura insuficiente. Entre ellas, tampoco se pudieron tipificar tres muestras secuenciadas con el SOP Artic y dos muestras secuenciadas con el SOP Nimagen, respectivamente. Ocho de estas diez muestras tenían un valor de qPCR Ct del gen N >25 (Tabla 2), lo que nos llevó a estudiar la evolución de la cobertura del genoma en función de la carga viral. Observamos que para los tres SOP, la cobertura fue alta para todas las muestras con valores de qPCR Ct del gen N <25 (el 96% y el 90% de las muestras tuvieron una cobertura media superior a 380x para los métodos Artic v3 y Midnight v1, respectivamente, y El 90% de las muestras tiene una cobertura media superior a 600\(\times\) para el método Nimagen), pero la cobertura de secuenciación se redujo drásticamente con los tres SOP para muestras con un valor de qPCR Ct >25 (Fig. 2).

Evolución de la cobertura media del genoma según el valor Ct del gen N para los tres métodos: Artic v3 (rojo), Midnight v1 (verde) y Nimagen (azul). La cobertura media es relativamente estable para todas las muestras con un valor de Ct <25 y cae para las muestras con un valor de Ct >25.

Luego comparamos los SNV identificados en cada muestra para un SOP frente al otro utilizando el coeficiente kappa de Cohen. Las muestras con un valor de qPCR Ct <25 tuvieron coeficientes kappa cercanos o iguales a 1, lo que indica una alta concordancia entre ambos métodos comparados. Para muestras con un valor de Ct >25, el coeficiente kappa disminuyó progresivamente con el aumento del valor de Ct. Esta disminución fue similar al comparar cualquier método entre sí (Fig. 3). Sin embargo, todas las discrepancias observadas pueden explicarse por una profundidad de lectura demasiado baja en la posición de la discrepancia para el método que no identificó la mutación (<20 lecturas para los métodos Nanopore o <5 lecturas para el método Illumina). Cuando, en esa posición genómica, la profundidad de las lecturas era mayor que 0 pero por debajo de los puntos de corte mencionados anteriormente, observamos que la mutación estaba presente en más del 70% de las lecturas, lo que indica que las discrepancias no se debían a errores de secuenciación. inherentes a los métodos sino a los umbrales de detección establecidos en los procesos bioinformáticos.

Evolución del coeficiente kappa de Cohen para la comparación de llamadas SNVs de tres métodos: Artic v3, Midnight v1 y Nimagen, comparados de dos en dos, dependiendo del valor de Ct para el gen N de cada muestra. Un coeficiente kappa de 1 significa una coincidencia perfecta, mientras que un coeficiente kappa de 0 significa una discrepancia total. Los tres métodos llaman casi perfectamente a los mismos SNV para muestras con un valor de Ct <25 (coeficiente kappa cercano a 1), pero las llamadas de SNV difieren cada vez más a medida que aumenta el valor de Ct. La línea azul es una curva suavizada basada en el algoritmo de suavizado de diagramas de dispersión de estimación local y el área gris representa la banda de confianza del 95%.

Los tres SOP estudiados en este artículo presentaron procedimientos estándar de preparación de bibliotecas NGS. En nuestras manos, y para obtener resultados óptimos, ambos métodos ONT permitieron secuenciar cuarenta y ocho muestras con una celda de flujo 9.4 y un GridION (Oxford Nanopore Technologies; Oxford, Reino Unido) en una sola ejecución, mientras que el método Illumina permitió secuenciar veinticinco muestras. cuatro muestras con un cartucho iSeq 100 i1 Reagent v2 (Illumina; CA, EE. UU.) en una ejecución. La ejecución, desde la transcripción inversa hasta la adquisición de archivos fastq, requirió 32 h, incluidas 3 h 30 de práctica con el SOP Artic v3, 29 h, incluida 1 h 30 de práctica para el SOP Midnight v1 y 29 h 30, incluidas 2 h 30 de práctica. -hora del SOP de Nimagen. Vale la pena señalar que el tiempo de secuenciación de ambos SOP que utilizan tecnología Nanopore podría reducirse aún más. El costo de secuenciación de una muestra según los precios del catálogo, sin considerar la extracción y los consumibles plásticos, es el más bajo para el SOP Midnight v1 y el mayor para el SOP Nimagen. Los costos de secuenciación podrían reducirse aún más para los procedimientos ONT, ya que esa tecnología permite la reutilización de celdas de flujo de secuenciación. Cualquier modificación u optimización de cualquiera de los procedimientos requerirá al menos una nueva verificación del método.

Los pipelines bioinformáticos se verificaron antes de su implementación en el flujo analítico mediante la realización de tres análisis independientes de los datos brutos obtenidos tras secuenciar dos muestras. Se obtuvo 100% de concordancia de tipificación con las bases de datos Nextclade y Pangolin. Tras su implementación, cada actualización importante de uno de los software implicados en los oleoductos dio lugar a un procedimiento de revalidación que consistió en volver a secuenciar cinco muestras para las que ya estaban disponibles los datos analizados con la última versión del software. Se debe obtener una concordancia de tipificación del 100% con los resultados de tipificación anteriores (OMS, Nextclade y Pangolin). Todas las actualizaciones e informes de validación se registraron en el sistema de gestión de calidad del laboratorio.

Los tres métodos evaluados en este estudio fueron validados para muestras con un valor de qPCR Ct del gen N <25, cumpliendo con los requisitos ISO15189. Generaron datos reproducibles, repetibles y precisos para la secuenciación del genoma completo de muestras clínicas del SARS-CoV-2. La capacidad de identificar variantes del SARS-CoV-2 según diferentes nomenclaturas fue idéntica independientemente del método. Escribir con la base de datos de Pangolin podría dar lugar a discrepancias menores que se debieron principalmente a las diferentes versiones de la base de datos utilizadas más que a un error técnico durante los procedimientos de secuenciación en sí. Otro factor que afectó la precisión de la escritura fue la cobertura. Como ya se describe en la literatura, nuestros datos confirmaron que, en los métodos de secuenciación basados ​​en amplicones, la cobertura era sensible a la carga viral, esta última correlacionada con el valor de qPCR Ct36,37. Las muestras con un valor de qPCR Ct >25 generalmente mostraron una profundidad de lectura insuficiente, lo que proporcionó una baja confiabilidad en algunas mutaciones clave, lo que podría conducir a una designación de linaje incorrecta o aproximada, lo que resalta la importancia de los criterios de selección de muestras en el contexto de los programas nacionales de vigilancia que utilizan muestras clínicas8. 38. Nuestros datos confirmaron que los tres métodos validados aquí proporcionaron resultados de calidad similar y fueron adecuados para el seguimiento epidemiológico del SARS-CoV-2 utilizando muestras con un valor de qPCR CT del gen N <25 en un entorno clínico.

Para la determinación de la relación clonal en investigaciones de brotes que requieren la detección exacta de variantes de un solo nucleótido (SNV), nuestros resultados sugirieron que los tres métodos podrían usarse al analizar muestras con alta carga viral (valor qPCR Ct <25). Sin embargo, nuestros datos indicaron que para muestras con baja carga viral (valor qPCR Ct >25), se debe preferir un método que utilice amplicones más pequeños (Artic v3 y Nimagen), ya que exhiben una mejor reproducibilidad y repetibilidad, y una mayor cobertura media del genoma. . Esta variabilidad en la cobertura para muestras con baja carga viral ya había sido reportada por Freed et al. Sin embargo, han demostrado que era posible alcanzar resultados de buena calidad generando más datos de secuenciación que con muestras con cargas virales altas o medias. Esto no se logró en nuestro estudio ya que secuenciamos todas las muestras en las mismas condiciones. También se ha demostrado que para detectar eficazmente los SNV y, por extensión, alcanzar una cobertura mínima de 400x con una técnica de NGS basada en amplicones, el material utilizado para la transcripción inversa debe contener al menos 1.000 copias de ARN viral39,40.

Los tres métodos descritos en este artículo son métodos basados ​​en amplicones. Permitieron de manera eficiente el enriquecimiento de secuencias objetivo para obtener resultados óptimos para una amplia gama de muestras. Sin embargo, eran sensibles a sustituciones, deleciones e inserciones en la secuencia con la que se hibridaban los cebadores. Dado que los virus de ARN, incluido el SARS-CoV-2, presentan periódicamente este tipo de eventos en su genoma10, es fundamental identificar las pérdidas de determinados amplicones y adaptar periódicamente los cebadores utilizados en los SOP en función de la evolución del virus. El método de amplificación Midnight v1 utilizó una menor cantidad de cebadores, lo que lo hace menos sensible a las abandonos. No obstante, si aún se producen abandonos, la región que ya no estará cubierta será mucho mayor con el SOP de Midnight v1 que con los SOP de Artic o Nimagen. Sin embargo, el diseño del cebador de los tres SOP permite la amplificación de fragmentos superpuestos (Figura 1 complementaria), lo que permite una identificación rápida de una mutación en la secuencia complementaria de un cebador utilizando herramientas de acceso abierto como Integrative Genomics Viewer41.

En varios países, incluida Bélgica, se implementaron temporalmente PCR de cepas específicas (o PCR de COV) para un seguimiento rápido y económico de los COV, como durante la aparición de las variantes alfa y omicron BA.1, que se caracterizaban por un objetivo del gen S. fallo detectable mediante kits de PCR42. Estos marcadores de mutación de PCR alcanzaron rápidamente sus límites ya que padecían la alta tasa de mutación del virus, lo que requería una actualización demasiado frecuente de los cebadores de PCR, lo que dejó a la NGS como la técnica estándar de oro para la detección y el seguimiento de COV en los programas de vigilancia. En ese contexto, y a pesar de su inferior calidad de secuenciación para muestras de baja carga viral, no se debe descuidar el método Midnight v1. Su protocolo técnico es muy sencillo y rápido de configurar en comparación con los otros dos métodos presentados aquí, que consumen mucho tiempo y son tediosos para el personal técnico. También es menos costoso y, por tanto, puede ser el método ideal para el seguimiento a gran escala, especialmente en países de bajos ingresos.

En 2028, todos los laboratorios de diagnóstico europeos deberán cumplir con la nueva regulación europea para productos sanitarios y diagnóstico in vitro que entró en vigor en 2022 y tiene como objetivo estandarizar más análisis clínicos y aumentar la seguridad del paciente17,18. Un requisito importante del IVDR es que todas las pruebas desarrolladas en laboratorio (por ejemplo, métodos de tipificación NGS para patógenos emergentes y de rápida propagación) deben estar acreditadas por un organismo de acreditación nacional, lo que implica una validación completa del método que cumple con los estándares ISO1518919. Este estudio es un primer paso hacia la implementación del IVDR. Sin embargo, esta carrera hacia la estandarización y la seguridad podría reducir la capacidad de los laboratorios médicos para proporcionar diagnósticos de vanguardia. En microbiología molecular, la tipificación de virus que evolucionan rápidamente durante una epidemia o pandemia requiere flexibilidad, como la adaptación de conjuntos de cebadores para métodos basados ​​en amplicones o actualizaciones periódicas de las bases de datos de tipificación. En patología molecular, la constante evolución de la práctica médica y el creciente conocimiento sobre el desarrollo de tumores y la adquisición de resistencia a los tratamientos requieren una actualización periódica de los paneles de mutación de ADN y fusión de ARN para que los pacientes se beneficien rápidamente de los últimos conocimientos en el campo. Cualquier cambio importante en un procedimiento validado (por ejemplo, composición de reactivos, versión de software, base de datos) que implique una nueva validación completa y el cumplimiento del IVDR será un gran desafío, consumirá mucho tiempo y será costoso para los laboratorios médicos que deseen mantenerse a la vanguardia de su práctica. .

En conclusión, los tres métodos presentados en este artículo cumplieron, en nuestras manos, todos los requisitos de la norma ISO15189 para el establecimiento de un método de tipificación epidemiológica en un entorno clínico y pueden usarse con igual confianza en el marco del SARS-CoV-2. programas de vigilancia. Sin embargo, se deben preferir los métodos que utilizan amplicones más cortos cuando se trabaja con muestras con baja carga viral. Hasta donde sabemos, este estudio es el primero en proponer un proceso de validación completo para los SOP de secuenciación del genoma completo del SARS-CoV-2 que cumplan con los estándares ISO15189 y conduzcan a la acreditación de los métodos por parte de un organismo de acreditación nacional, un primer paso hacia Implementación del IVDR en el ámbito clínico.

Los conjuntos de datos generados durante el estudio actual están disponibles en el repositorio BioSample, acceso PRJNA954542. https://www.ncbi.nlm.nih.gov/bioproject/954542.

Weiss, SR y Leibowitz, JL Patogénesis del coronavirus. Adv. Resolución de virus. 81, 85-164. https://doi.org/10.1016/B978-0-12-385885-6.00009-2 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Cui, J., Li, F. y Shi, Z.-L. Origen y evolución de los coronavirus patógenos. Nat. Rev. Microbiol. 17, 181-192. https://doi.org/10.1038/s41579-018-0118-9 (2019).

Artículo CAS PubMed Google Scholar

González-Candelas, F. et al. Un año de pandemia: Evolución a corto plazo del SARS-CoV-2 y aparición de nuevos linajes. Infectar. Gineta. Evolución. 92, 104869. https://doi.org/10.1016/j.meegid.2021.104869 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Burki, T. Comprensión de las variantes del SARS-CoV-2. The Lancet 397, 462. https://doi.org/10.1016/S0140-6736(21)00298-1 (2021).

Artículo CAS Google Scholar

Otto, SP y cols. Los orígenes y el futuro potencial de las variantes preocupantes del SARS-CoV-2 en la evolución de la pandemia de COVID-19. actual. Biol. 31, R918–R929. https://doi.org/10.1016/j.cub.2021.06.049 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Chen, Y. et al. Variantes emergentes del SARS-CoV-2: ¿por qué, cómo y qué sigue? Cell Insight 1, 100029. https://doi.org/10.1016/j.cellin.2022.100029 (2022).

Artículo PubMed Central Google Scholar

(COG-UK), C. Una red integrada de vigilancia genómica del SARS-CoV-2 a escala nacional. The Lancet Microbe1, e99 – e100. https://doi.org/10.1016/S2666-5247(20)30054-9 (2020).

Cuypers, L. y col. Dos años de vigilancia genómica en Bélgica durante la pandemia de SARS-CoV-2 para lograr una cobertura en todo el país y monitorear la introducción y propagación de variantes emergentes. Virus 14, 2301. https://doi.org/10.3390/v14102301 (2022).

Artículo PubMed PubMed Central Google Scholar

Zhu, N. y col. Un nuevo coronavirus de pacientes con neumonía en China, 2019. N. Engl. J. Med. 382, 727–733. https://doi.org/10.1056/NEJMoa2001017 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Zhou, P. y col. Un brote de neumonía asociado a un nuevo coronavirus de probable origen en murciélagos. Naturaleza 579, 270–273. https://doi.org/10.1038/s41586-020-2012-7 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Lu, R. y col. Caracterización genómica y epidemiología del nuevo coronavirus de 2019: implicaciones para los orígenes del virus y la unión al receptor. The Lancet 395, 565–574. https://doi.org/10.1016/S0140-6736(20)30251-8 (2020).

Artículo CAS Google Scholar

Rambaut, A. y col. Caracterización genómica preliminar de un linaje emergente de SARS-CoV-2 en el Reino Unido definido por un nuevo conjunto de mutaciones de pico (Universidad de Edimburgo, Representante Técnico, 2020).

Google Académico

Harvey, WT y cols. Variantes del SARS-CoV-2, mutaciones puntiagudas y escape inmunológico. Nat. Rev. Microbiol. 19, 409–424. https://doi.org/10.1038/s41579-021-00573-0 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Berkhout, B. & Herrera-Carrillo, E. Evolución del SARS-CoV-2: sobre la aparición repentina de la variante Omicron. J. Virol. 96, e00090-22. https://doi.org/10.1128/jvi.00090-22 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Gargis, AS, Kalman, L. & Lubin, IM Garantizar la calidad de la secuenciación de próxima generación en laboratorios de microbiología clínica y salud pública. J.Clin. Microbiol. 54, 2857–2865. https://doi.org/10.1128/JCM.00949-16 (2016).

Artículo PubMed PubMed Central Google Scholar

Thelen, MH & Huisman, W. Armonización de la acreditación según ISO15189. Clínico. Química. Laboratorio. Medicina. (CCLM) 56, 1637–1643. https://doi.org/10.1515/cclm-2017-0820 (2018).

Artículo CAS PubMed Google Scholar

Parlamento, E. y Consejo. REGLAMENTO (UE) 2017/745 sobre productos sanitarios, por el que se modifica la directiva 2001/83/CE, el reglamento (CE) n.º 178/2002 y el reglamento (CE) n.º 1223/2009 y se derogan las directivas del consejo 90/385/CEE y 93/42/ CEE. Tecnología. Rep., Parlamento Europeo y Consejo (2017).

Parlamento, E. y Consejo. REGLAMENTO (UE) 2017/746 sobre productos sanitarios para diagnóstico in vitro y por el que se deroga la directiva 98/79/CE y la decisión de la comisión 2010/227/UE. Tecnología. Rep., Parlamento Europeo y Consejo (2017).

Vanstapel, FJ y cols. ISO 15189 es un instrumento suficiente para garantizar la fabricación de alta calidad de pruebas desarrolladas en laboratorio para uso interno que cumplen con los requisitos del Reglamento europeo de diagnóstico in vitro: Opinión conjunta del grupo de trabajo sobre asuntos regulatorios europeos y acreditación del grupo de trabajo e ISO/ Normas CEN de la Federación Europea de Química Clínica y Medicina de Laboratorio. Clínico. Química. Laboratorio. Medicina. (CCLM) 61, 608–626. https://doi.org/10.1515/cclm-2023-0045 (2023).

Artículo PubMed Google Scholar

Jacot, D., Pillonel, T., Greub, G. & Bertelli, C. Evaluación de la secuenciación del genoma del SARS-CoV-2: criterios de calidad y variantes de baja frecuencia. J.Clin. Microbiol. 59, e00944-21. https://doi.org/10.1128/JCM.00944-21 (2021).

Artículo PubMed PubMed Central Google Scholar

Wegner, F. y col. Evaluación de calidad externa de la secuenciación del SARS-CoV-2: una prueba piloto de ESGMD-SSM en 15 laboratorios europeos. J.Clin. Microbiol. 60, e01698-21. https://doi.org/10.1128/JCM.01698-21 (2022).

Artículo PubMed PubMed Central Google Scholar

Tyson, J.R. y col. Mejoras en el método de PCR multiplex ARTIC para la secuenciación del genoma del SARS-CoV-2 mediante nanoporos. preimpresión, Genómica (2020). https://doi.org/10.1101/2020.09.04.283077.

Freed, NE, Vlková, M., Faisal, MB y Silander, OK Secuenciación rápida y económica del genoma completo del SARS-CoV-2 utilizando amplicones en mosaico de 1200 pb y código de barras rápido Oxford Nanopore. Biol. Métodos Protocolo 5, bpaa014. https://doi.org/10.1093/biomethods/bpaa014 (2020).

Coolen, JP y cols. Secuenciación del genoma completo del SARS-CoV-2 mediante PCR de complemento inverso: para un análisis de variantes y brotes sencillo, rápido y preciso. J.Clin. Virol. 144, 104993. https://doi.org/10.1016/j.jcv.2021.104993 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Cotten, M., Lule Bugembe, D., Kaleebu, P. y Phan, MVT Cebadores alternativos para la secuenciación del genoma completo del SARS-CoV-2. Virus Evol.7, veab006. https://doi.org/10.1093/ve/veab006 (2021).

Itokawa, K., Sekizuka, T., Hashino, M., Tanaka, R. y Kuroda, M. Desenredar las interacciones del cebador mejora la secuenciación del genoma del SARS-CoV-2 mediante PCR en mosaico múltiple. MÁS UNO 15, e0239403. https://doi.org/10.1371/journal.pone.0239403 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Kieser, RE y cols. PCR de complemento inverso: un novedoso sistema de PCR de un solo paso para tipificar ADN altamente degradado para la identificación humana. Forenses. Ciencia. En t. Gineta. 44, 102201. https://doi.org/10.1016/j.fsigen.2019.102201 (2020).

Artículo CAS Google Scholar

Loman, N., Rowe, W. y Rambaut, A. ARTIC-nCoV-bioinformaticsSOP-v1.1.0.

Lee, JY y cols. Evaluación comparativa de herramientas de pulido de nanoporos para el ensamblaje del genoma microbiano y estrategias de pulido para análisis posteriores. Ciencia. Rep. 11, 20740. https://doi.org/10.1038/s41598-021-00178-w (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Aksamentov, I., Roemer, C., Hodcroft, E. y Neher, R. Nextclade: Asignación de clados, llamada de mutaciones y control de calidad de genomas virales. J. Software de código abierto. 6, 3773. https://doi.org/10.21105/joss.03773 (2021).

O'Toole, A. y col. Asignación de linajes epidemiológicos en una pandemia emergente utilizando la herramienta Pangolin. Evolución del virus. veab064, https://doi.org/10.1093/ve/veab064 (2021).

ISO 15189:2012 Laboratorios médicos - Requisitos de calidad y competencia. Tecnología. Rep., Organización Internacional de Normalización (2012).

Grangeia, HB, Silva, C., Simões, SP & Reis, MS Calidad por diseño en la fabricación farmacéutica: una revisión sistemática del estado actual, los desafíos y las perspectivas futuras. EUR. J. Farmacéutica. Biofarmacia. 147, 19–37. https://doi.org/10.1016/j.ejpb.2019.12.007 (2020).

Artículo CAS PubMed Google Scholar

Nunnally, BK et al. (eds) (Springer, Berlín, 2015).

Google Académico

Coleman, W. & Tsongalis, G. Capítulo 2: enfoques de laboratorio en patología molecular: la reacción en cadena de la polimerasa. En Enfoques de laboratorio en patología molecular: la reacción en cadena de la polimerasa. En: Diagnostic Molecular Pathology., 15–23 (Academic Press, Cambridge, 2017).

Charré, C. et al. Evaluación de enfoques basados ​​en NGS para la caracterización del genoma completo del SARS-CoV-2. Evolución del virus6, veaa075. https://doi.org/10.1093/ve/veaa075 (2020).

Tshiabuila, D. et al. Comparación de la secuenciación del SARS-CoV-2 utilizando ONT GridION e Illumina MiSeq. Genoma de BMC. 23, 319. https://doi.org/10.1186/s12864-022-08541-5 (2022).

Artículo CAS Google Scholar

Grupo de evaluación de riesgos, R. Recomendaciones para la selección de muestras para la secuenciación del genoma completo. Tecnología. Rep., Grupo de evaluación de riesgos, RAG (2021).

Grubaugh, ND y cols. Un marco de secuenciación basado en amplicones para medir con precisión la diversidad de virus intrahuésped utilizando PrimalSeq e iVar. Genoma Biol. 20, 8. https://doi.org/10.1186/s13059-018-1618-7 (2019).

Artículo PubMed PubMed Central Google Scholar

Kubik, S. et al. Recomendaciones para una genotipificación precisa del SARS-CoV-2 mediante secuenciación de muestras clínicas basada en amplicones. Clínico. Microbiol. Infectar. 27(1036), e1-1036.e8. https://doi.org/10.1016/j.cmi.2021.03.029 (2021).

Artículo CAS Google Scholar

Robinson, JT y cols. Visor de genómica integrativa. Nat. Biotecnología. 29, 24-26. https://doi.org/10.1038/nbt.1754 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Cuypers, L. y col. Esfuerzo de armonización a nivel nacional para la presentación de informes semicuantitativos de los resultados de las pruebas de PCR del SARS-CoV-2 en Bélgica. Virus 14, 1294. https://doi.org/10.3390/v14061294 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Descargar referencias

Los autores agradecen al Ph. Biol. Jean-Louis Bayart de Cliniques Saint Pierre Ottignies por proporcionar algunas de las muestras clínicas. Los autores desean agradecer a la Dra. Edith Renguet por su ayuda para mejorar el manuscrito.

Estos autores contribuyeron igualmente: Pierre Bogaerts y Jonathan Degosserie.

Departamento de Medicina de Laboratorio, UCLouvain, CHU UCL Namur, 5530, Yvoir, Bélgica

Céline Maschietto, Gaëtan Otto, Pauline Rouzé, Nicolas Debortoli, Lesly Nyinkeu, Olivier Denis, Te-Din Huang, François Mullier, Pierre Bogaerts y Jonathan Degosserie

Plataforma federal de pruebas COVID-19 Bis, CHU UCL Namur & UNamur, 5530, Yvoir, Bélgica

Céline Maschietto, Gaëtan Otto, Lesly Nyinkeu, Olivier Denis, Te-Din Huang, François Mullier y Jonathan Degosserie

Laboratorio de Microbiología, CHU UCL Namur, 5530, Yvoir, Bélgica

Pauline Rouzé, Olivier Denis, Te-Din Huang y Pierre Bogaerts

Namur Molecular Tech, CHU UCL Namur, 5530, Yvoir, Bélgica

Nicolás Debortoli, Lesly Nyinkeu y Jonathan Degosserie

Unidad de Apoyo Científico, CHU UCL Namur, 5530, Yvoir, Bélgica

Benoît Bihin

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

CM, GO, PB y JD concibieron los experimentos, CM, PR y LN realizaron los experimentos, GO desarrolló los procesos bioinformáticos, CM, BB, ND y JD analizaron los resultados, BB y ND realizaron análisis estadísticos, OD y TD. H. validó los resultados, JD supervisó el proyecto, CM y JD escribieron el manuscrito, PB y FM revisaron exhaustivamente el manuscrito, todos los autores revisaron el manuscrito.

Correspondencia a Jonathan Degosserie.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Maschietto, C., Otto, G., Rouzé, P. et al. Requisitos mínimos para la validación y acreditación ISO15189 de tres procedimientos de secuenciación de próxima generación para la vigilancia del SARS-CoV-2 en entornos clínicos. Representante científico 13, 6934 (2023). https://doi.org/10.1038/s41598-023-34088-w

Descargar cita

Recibido: 25 de enero de 2023

Aceptado: 24 de abril de 2023

Publicado: 28 de abril de 2023

DOI: https://doi.org/10.1038/s41598-023-34088-w

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.

COMPARTIR