Идентификация комбинаций геномных мутаций с помощью полногеномного поиска ассоциаций на примере микобактерии туберкулеза
Аннотация
Полногеномный поиск ассоциаций играет ключевую роль в выявлении взаимосвязей между геномами и фенотипами. Многие исследования в этой области посвящены изучению генетических вариаций и их взаимодействий в геномах. Однако, несмотря на достигнутый значительный прогресс в данном направлении, рассматриваемая проблема по-прежнему является крайне актуальной и требует разработки эффективных методов и алгоритмов ее решения. Для поиска ассоциированных с фенотипом комбинаций однонуклеотидных полиморфизмов в настоящей статье предложены четыре новых алгоритма, основанных на изучении взаимодействия однонуклеотидных полиморфизмов в двух режимах – аддитивном и мультипликативном. На первом этапе эти алгоритмы используют полный перебор пар однонуклеотидных полиморфизмов для предсказания их ассоциации с фенотипом, а на втором этапе – жадные процедуры для поиска комбинаций, включающих до пяти однонуклеотидных полиморфизмов с наибольшими величинами ассоциации. Разработанный вычислительный подход протестирован на наборе данных, содержащем 3178 геномов микобактерии туберкулеза, для выявления комбинаций мутаций и прогнозирования устойчивости различных штаммов микобактерии туберкулеза к 20 лекарственным препаратам. Полученные результаты сопоставлены с результатами прогнозирования лекарственной устойчивости микобактерии туберкулеза современными программными системами Mykrobe и TB-Profiler. Для 5 препаратов первой линии и 1 препарата второй линии (офлоксацина) системы Mykrobe и TB-Profiler по правильности предсказания несколько превосходят предложенные авторами алгоритмы, однако для остальных 14 препаратов второй линии уступают им.
Литература
- Visscher PM, Wray NR, Zhang Q, Sklar P, McCarthy MI, Brown MA, et al. 10 years of GWAS discovery: biology, function, and translation. The American Journal of Human Genetics. 2017;101(1):5–22. DOI: 10.1016/j.ajhg.2017.06.005.
- Abdellaoui A, Yengo L, Verweij KJH, Visscher PM. 15 years of GWAS discovery: realizing the promise. The American Journal of Human Genetics. 2023;110(2):179–194. DOI: 10.1016/j.ajhg.2022.12.011.
- Zhu Zhixiang, Tong Xiaoran, Zhu Zhihong, Liang Meimei, Cui Wenyan, Su Kunkai, et al. Development of GMDR-GPU for gene – gene interaction analysis and its application to WTCCC GWAS data for type 2 diabetes. PloS One. 2013;8(4):e61943. DOI: 10.1371/journal.pone.0061943.
- Díez Díaz F, Sánchez Lasheras F, Moreno V, Moratalla-Navarro F, Molina de la Torre AJ, Martín Sánchez V. GASVeM: a new machine learning methodology for multi-SNP analysis of GWAS data based on genetic algorithms and support vector machines. Mathematics. 2021;9(6):654. DOI: 10.3390/math9060654.
- Nguyen T-T, Huang JZ, Wu Q, Nguyen TT, Li MJ. Genome-wide association data classification and SNPs selection using twostage quality-based random forests. BMC Genomics. 2015;16(supplement 2):S5. DOI: 10.1186/1471-2164-16-S2-S5.
- Ritchie MD, Van Steen K. The search for gene – gene interactions in genome-wide association studies: challenges in abundance of methods, practical considerations, and biological interpretation. Annals of Translational Medicine. 2018;6(8):157. DOI: 10.21037/atm.2018.04.05.
- Berrandou T-E, Balding D, Speed D. LDAK-GBAT: fast and powerful gene-based association testing using summary statistics. The American Journal of Human Genetics. 2023;110(1):23–29. DOI: 10.1016/j.ajhg.2022.11.010.
- Zhang J, Liang X, Gonzales S, Liu J, Gao XR, Wang X. A gene based combination test using GWAS summary data. BMC Bioinformatics. 2023;24:2. DOI: 10.1186/s12859-022-05114-x.
- Evans LM, Arehart CH, Grotzinger AD, Mize TJ, Brasher MS, Stitzel JA, et al. Transcriptome-wide gene – gene interaction associations elucidate pathways and functional enrichment of complex traits. PLoS Genetics. 2023;19(5):e1010693. DOI: 10.1371/journal.pgen.1010693.
- World Health Organization. Global tuberculosis report – 2023. Geneva: World Health Organization; 2023. XIV, 57 p.
- Goossens SN, Sampson SL, Van Rie A. Mechanisms of drug-induced tolerance in Mycobacterium tuberculosis. Clinical Microbiology Reviews. 2020;34(1):e00141-20. DOI: 10.1128/cmr.00141-20.
- Islam MM, Hameed HMA, Mugweru J, Chhotaray C, Wang C, Tan Y, et al. Drug resistance mechanisms and novel drug targets for tuberculosis therapy. Journal of Genetics and Genomics. 2017;44(1):21–37. DOI: 10.1016/j.jgg.2016.10.002.
- Cui Z-J, Yang Q-Y, Zhang H-Y, Zhu Q, Zhang Q-Y. Bioinformatics identification of drug resistance-associated gene pairs in Mycobacterium tuberculosis. International Journal of Molecular Sciences. 2016;17(9):1417. DOI: 10.3390/ijms17091417.
- Kuang X, Wang F, Hernandez KM, Zhang Z, Grossman RL. Accurate and rapid prediction of tuberculosis drug resistance from genome sequence data using traditional machine learning algorithms and CNN. Scientific Reports. 2022;12:2427. DOI: 10.1038/s41598- 022-06449-4.
- Hunt M, Bradley P, Lapierre SG, Heys S, Thomsit M, Hall MB, et al. Antibiotic resistance prediction for Mycobacterium tuberculosis from genome sequence data with Mykrobe. Wellcome Open Research. 2019;4:191. DOI: 10.12688/wellcomeopenres.15603.1.
- Benavente ED, Coll F, Furnham N, McNerney R, Glynn JR, Campino S, et al. PhyTB: phylogenetic tree visualisation and sample positioning for M. tuberculosis. BMC Bioinformatics. 2015;16:155. DOI: 10.1186/s12859-015-0603-3.
- Ezewudo M, Borens A, Chiner-Oms Á, Miotto P, Chindelevitch L, Starks AM, et al. Integrating standardized whole genome sequence analysis with a global Mycobacterium tuberculosis antibiotic resistance knowledgebase. Scientific Reports. 2018;8:15382. DOI: 10.1038/s41598-018-33731-1.
- Gröschel M, Owens M, Freschi L, Vargas R Jr, Marin MG, Phelan J, et al. GenTB: a user-friendly genome-based predictor for tuberculosis resistance powered by machine learning. Genome Medicine. 2021;13:138. DOI: 10.1186/s13073-021-00953-4.
- Iwai H, Kato-Miyazawa M, Kirikae T, Miyoshi-Akiyama T. CASTB (the comprehensive analysis server for the Mycobacterium tuberculosis complex): a publicly accessible web server for epidemiological analyses, drug-resistance prediction and phylogenetic comparison of clinical isolates. Tuberculosis. 2015;95(6):843–844. DOI: 10.1016/j.tube.2015.09.002.
- Phelan JE, O’Sullivan DM, Machado D, Ramos J, Oppong YEA, Campino S, et al. Integrating informatics tools and portable sequencing technology for rapid detection of resistance to anti-tuberculous drugs. Genome Medicine. 2019;11:41. DOI: 10.1186/s13073-019-0650-x.
- Sekizuka T, Yamashita A, Murase Y, Iwamoto T, Mitarai S, Kato S, et al. TGS-TB: total genotyping solution for Mycobacterium tuberculosis using short-read whole-genome sequencing. PloS One. 2015;10(11):e0142951. DOI: 10.1371/journal.pone.0142951.
- Sergeev RS, Kavaliou IS, Sataneuski UV, Gabrielian A, Rosenthal A, Tartakovsky M, et al. Genome-wide analysis of MDR and XDR tuberculosis from Belarus: machine-learning approach. IEEE/ACM Transactions on Computational Biology and Bioinformatics. 2019;16(4):1398–1408. DOI: 10.1109/TCBB.2017.2720669.
- Steiner A, Stucki D, Coscolla M, Borrell S, Gagneux S. KvarQ: targeted and direct variant calling from fastq reads of bacterial genomes. BMC Genomics. 2014;15:881. DOI: 10.1186/1471-2164-15-881.
- Rosenthal A, Gabrielian A, Engle E, Hurt DE, Alexandru S, Crudu V, et al. The TB Portals: an open-access, web-based platform for global drug-resistant-tuberculosis data sharing and analysis. Journal of Clinical Microbiology. 2017;55(11):3267–3282. DOI: https://doi.org/10.1128/jcm.01013-17.
Copyright (c) 2024 Журнал Белорусского государственного университета. Математика. Информатика

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.
Авторы, публикующиеся в данном журнале, соглашаются со следующим:
- Авторы сохраняют за собой авторские права на работу и предоставляют журналу право первой публикации работы на условиях лицензии Creative Commons Attribution-NonCommercial. 4.0 International (CC BY-NC 4.0).
- Авторы сохраняют право заключать отдельные контрактные договоренности, касающиеся неэксклюзивного распространения версии работы в опубликованном здесь виде (например, размещение ее в институтском хранилище, публикацию в книге) со ссылкой на ее оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в интернете (например, в институтском хранилище или на персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу. (См. The Effect of Open Access).