Développement et validation de classificateurs de diagnostic COVID-19 basés sur l’hôte à 2 gènes

Développement et validation de classificateurs de diagnostic COVID-19 basés sur l’hôte à 2 gènes
Développement et validation de classificateurs de diagnostic COVID-19 basés sur l’hôte à 2 gènes

Le dépistage de la maladie à coronavirus 2019 (COVID-19) a été un point clé des stratégies de la plupart des pays pour lutter contre la maladie. Alors qu’au départ, les gouvernements étaient obligés de s’appuyer sur des tests PCR de fortune pour obtenir des résultats, un processus long et peu évolutif, des processus plus standardisés ont été rapidement développés et des tests de flux latéral pouvant fournir des diagnostics au point de service ont été encore plus utiles. Un groupe de chercheurs de Biohub a tenté de créer une méthode plus précise pour les tests PCR. La recherche peut être trouvée sur le medRxiv* serveur de préimpression.

Étude : Une signature d’hôte à 2 gènes pour une meilleure précision du diagnostic COVID-19 agnostique aux variantes virales. Crédit d’image : Trofimchuk Vladimir/Shutterstock

L’étude

Les chercheurs ont commencé par identifier les candidats à 2 gènes les plus performants dans une cohorte d’ARN-seq développée dans des travaux antérieurs, en la complétant par des échantillons supplémentaires qui avaient été collectés. La cohorte finale comprenait 318 patients, dont 90 avaient le COVID-19 et 59 avaient différentes infections respiratoires aiguës virales (IRA). Ceux-ci ont été divisés en un ensemble de formation et de test, avec des proportions à peu près équivalentes de personnes avec et sans COVID-19 dans chacun.

Un algorithme de sélection avide a été utilisé pour identifier les combinaisons de 2 gènes qui étaient les meilleures pour prédire le statut COVID-19. Un premier gène a été sélectionné pour maximiser l’aire sous la courbe caractéristique de fonctionnement du récepteur (AUC) du classificateur binaire de la machine à vecteurs de support (SVM) qui utilisait les gènes sélectionnés comme caractéristiques. Un deuxième gène a été sélectionné pour maximiser l’AUC lorsqu’il est combiné avec le premier gène. Les meilleurs premiers gènes étaient les gènes stimulés par l’interféron IFI6, IFI44L et HERC6. La plupart des «seconds gènes» étaient liés de la même manière aux processus et signaux immunitaires/inflammatoires.

Les performances des neuf meilleures combinaisons ont été estimées avec 10 000 tours chacun de validation croisée 5 fois dans les ensembles d’entraînement et de test ou l’entraînement sur l’ensemble d’entraînement et les prédictions sur l’ensemble de test. L’approche finale a montré des valeurs d’AUC jusqu’à 0,93. Les classificateurs ont été validés à l’aide d’un ensemble de données ARN-seq sur écouvillon NP généré de manière indépendante et acquis auprès de collègues à New York. Encore une fois, les combinaisons de 2 gènes ont montré des résultats très similaires.

Généralement, le premier gène était suffisant pour distinguer le COVID-19 des autres IRA non viraux, tandis que le deuxième gène était plus utile pour faire la différence entre le COVID-19 et les autres IRA viraux. IFI6 seul a séparé avec succès les échantillons de COVID-19 et non viraux, mais certains échantillons d’IRA viraux ont montré des niveaux similaires d’expression d’IFI6. L’ajout de GB5 a permis une meilleure séparation car il est généralement exprimé plus fortement dans d’autres IRA viraux.

Les chercheurs ont décidé d’affiner les gènes en considérant le changement de pli d’expression entre COVID-19 et les autres groupes. Ils ont tracé l’AUC des classificateurs SVM pour chaque gène par rapport au facteur de changement de ce gène entre les échantillons COVID-19 et non viraux, en moyenne entre les deux ensembles de données. Plusieurs ISG ont montré la valeur prédictive robuste et les changements de pli qui devraient pouvoir être détectés par qPCR. Le tracé de l’AUC des classificateurs utilisant IFI6 en combinaison avec un gène sur deux contre le changement de pli du deuxième gène entre COVID-19 et d’autres ARI viraux a montré plusieurs candidats avec des changements de pli légèrement plus petits, bien que toujours détectables par PCR. Seuls certains de ces gènes ont été détectés par les gènes sélectionnés par l’algorithme glouton.

Quatre « premiers » gènes ont été sélectionnés et l’expression de ces gènes par rapport à un gène de référence a été mesurée à l’aide de la qPCR à partir d’écouvillons d’une nouvelle cohorte de patients et de témoins (avec et sans COVID-19). Les écouvillons n’ont pas été séquencés, donc ceux sans COVID-19 pourraient être viraux ou non viraux. Les quatre gènes ont pu attribuer ou non la plupart des échantillons à COVID-19. Les classificateurs SVM qui reposaient sur un seul gène pourraient montrer des performances de prédiction significatives de manière indépendante.

Pour tester la capacité de séparer le COVID-19 des autres virus, quatre « seconds » gènes ont été choisis et mesurés dans les échantillons de COVID-19 par rapport à un sous-ensemble des échantillons viraux séquencés d’origine. Trois gènes ont montré une expression significativement plus élevée dans les échantillons non COVID-19, et le quatrième a montré une expression plus élevée dans les échantillons COVID-19. Tous pourraient prédire avec succès le statut COVID-19 à partir des données qPCR.

Enfin, les chercheurs ont évalué l’efficacité de cette méthode sur toutes les variantes, en effectuant une qPCR pour IFI6 et GBP5 sur des échantillons avec Omicron et Delta, ce qui a permis de prédire COVID-19 avec une probabilité élevée dans tous les échantillons de variantes. Ils ont également examiné la probabilité qu’une contamination croisée en laboratoire puisse conduire à des faux positifs, un problème courant avec les tests PCR. Même avec des faux positifs stimulés, les estimations sont restées exactes.

Conclusion

Cette recherche pourrait s’avérer inestimable pour les tests COVID-19 à l’avenir et pourrait aider à garantir des lectures précises à partir d’échantillons COVID-19. Bien qu’il y ait encore du développement à faire, les auteurs ont prouvé qu’il s’agissait d’une méthode viable et réaliste pour détecter le COVID-19, et les informations qu’ils ont recueillies pourraient informer les fabricants de tests et aider l’industrie à maintenir la précision.

*Avis important

medRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique/le comportement lié à la santé, ou traités comme des informations établies.

 
For Latest Updates Follow us on Google News
 

PREV COVID-19 : les hospitalisations provinciales augmentent à nouveau ; 10 732 nouveaux cas signalés
NEXT L’Australie laisse tomber les normes lors de la deuxième journée à Hobart, mais le cinquième test des cendres reste captivant
----