Сетевой анализ профилей экспрессии генов

О. О. Мирасов, Г. Р. Шахмаметова

Аннотация


В статье рассматривается предлагаемый процесс анализа генетических материалов, а именно профилей экспрессии генов, для выявления генов, связанных с возникновением заболевания. Рассматривается пайплайн сбора, загрузки и предобработки данных в программу. Представлена математическая постановка задачи, а именно: указаны алгоритмы обработки данных в виде метода главных компонент, линейного дискриминантного анализа, случайного леса, обобщенной линейной модели регрессии, модели Lasso, а также причины использования метода построения графов SCUDO. Приводится блок-схема последовательного применения моделей для достижения результата.

Ключевые слова


Методы машинного обучения; профили экспрессии генов; рак; ДНК; геномные данные.

Полный текст:

PDF

Литература


Microarray gene-expression profiles of 45 matching pairs of pancreatic tumor and adjacent non-tumor tissues from 45 patients with pancreatic ductal adenocarcinoma. URL: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi (дата обращения 29.05.2024)

Díaz-Uriarte R., Alvarez de Andrés S. Gene selection and classification of microarray data using random forest // BMC Bioinformatics. 7. 3 (2006). DOI 10.1186/1471-2105-7-3.

Huang D., Quan Y., He M., et al. Comparison of linear discriminant analysis methods for the classification of cancer based on gene expression data // J Exp Clin Cancer Res. 28. 149 (2009). DOI 10.1186/1756-9966-28-149.

Xu X. et al. Gsw-fi: a GLM model incorporating shrinkage and double-weighted strategies for identifying cancer driver genes with functional impact // BMC Bioinformatics. 25. 99 (2024). DOI 10.1186/s12859-024-05707-8.

Huang H. H., Rao H., Miao R., et al. A novel meta-analysis based on data augmentation and elastic data shared lasso regularization for gene expression // BMC Bioinformatics. 23 (Suppl 10). 353 (2022). DOI 10.1186/s12859-022-04887-5.

Lauria M., Moyseos P., Priami C. SCUDO: a tool for signature-based clustering of expression profiles // Nucleic Acids Research. 43(W1). 2015.W188–W192. DOI 10.1093/nar/gkv449.

Шапошникова А. С., Богданов М. Р. Определение сердечного ритма плода по неинвазивному ЭКГ с применением различных фильтров // СИИТ. 2023. Т. 5. № 6(15). С. 32-37. DOI 10.54708/2658-5014-SIIT-2023-no5-p32. EDN WBBOVK. [[ Shaposhnikova A. S., Bogdanov M. R. “Determination of fetal heart rate by non-invasive ECG using various filters” // SIIT. 2023. Vol. 5, No. 6(15), pp. 32-37. DOI 10.54708/2658-5014-SIIT-2023-no5-p32. EDN WBBOVK. (In Russian). ]]

Шахмаметова Г. Р., Ахметшин А. А. Обзор современного состояния исследований в области применения машинного обучения в обработке ПГИА данных // Высшая школа: научные исследования: Мат-лы Межвузовского международного конгресса, Москва, 26 мая 2023 г. Т. 2. М: Инфинити, 2023. С. 127-140. EDN USBHTE. [[ Shakhmametova G. R., Akhmetshin A. A. “Review of the current state of research in the field of machine learning application in processing PGIA data” // Higher school: scientific research: Proceedings of the Interuniversity International Congress, Moscow, May 26, 2023. Vol. 2. Moscow: Infinity, 2023, pp. 127-140. EDN USBHTE. (In Russian). ]]

Yusupova N., Zulkarneev R., Rizvanov D., et al. Classification of interaction participants in the formation of the trajectory of diagnosis and treatment of bronchopulmonary diseases to design agents of a multi-agent system // Software Engineering Application in Systems Design: Proceedings of 6th Computational Methods in Systems and Software. 2022. Czech Republic. October 10–15. 2022. Vol. 596. Switzerland: Springer Nature Switzerland AG. Part of Springer Nature, 2023, pp. 723-731. DOI 10.1007/978-3-031-21435-6_62. EDN GWZYNZ.

Shakhmametova G. R., Evgrafov A. A., Zulkarneev R. Kh. Development of data storage and user interface in the clinical decision support system // Software Engineering Research in System Science: Proceedings of 12th Computer Science On-line Conference. 2023. Zlin, Czech Republic, 01–30 апреля 2023 года. Vol. 722-1. Springer Nature Switzerland AG: Springer Nature Switzerland AG, 2023, pp. 808-816. DOI 10.1007/978-3-031-35311-6_75. EDN WICSIR.

Зиновьев М. С., Нургаянова О. С. Оценка индивидуального риска развития сахарного диабета второго типа и возможных осложнений // СИИТ. 2023. Т. 5. № 4(13). С. 101-110. DOI 10.54708/2658-5014-SIIT-2023-no5-p101. EDN HIIXFH. [[ Zinoviev M. S., Nurgayanova O. S. “Assessment of individual risk of developing type 2 diabetes mellitus and possible complications” // SIIT. 2023. Vol. 5, No. 4(13), pp. 101-110. DOI 10.54708/2658-5014-SIIT-2023-no5-p101. EDN HIIXFH. (In Russian). ]]

Юсупова Н. И., Нургаянова О. С., Зулкарнеев Р. Х. Формализация этапов риск-анализа в СППР с учетом оценок клинических рисков при бронхолегочных заболеваниях // СИИТ. 2023. Т. 5. № 1(10). С. 11-24. DOI 10.54708/2658-5014-SIIT-2023-no1-p11. EDN KHIIHT. [[ Yusupova N. I., Nurgayanova O. S., Zulkarneev R. Kh. “Formalization of risk analysis stages in decision support system taking into account clinical risk assessments for bronchopulmonary diseases” // SIIT. 2023. Vol. 5, No. 1(10), pp. 11-24. DOI 10.54708/2658-5014-SIIT-2023-no1-p11. EDN KHIIHT. (In Russian). ]]

Шахмаметова Г. Р., Береговая С. П., Христодуло А. Д. Анализ эндокринологических данных на основе моделей классификации // СИИТ. 2022. Т. 4. № 2(9). С. 30-36. DOI 10.54708/26585014_2022_42930. EDN LBZVZL. [[ Shakhmametova G. R., Beregovaya S. P., Khristodullo A. D. “Analysis of endocrinological data based on classification models” // SIIT. 2022. Vol. 4, No. 2(9), pp. 30-36. DOI 10.54708/26585014_2022_42930. EDN LBZVZL. (In Russian). ]]

Насыров Р. В. Причинный подход к построению бионических вычислений на основе рекурсивных моделей анализа данных // СИИТ. 2022. Т. 4. № 1(8). С. 27-36. DOI 10.54708/26585014_2022_41827. EDN UOMMOU. [[ Nasyrov R. V. “Causal approach to the construction of bionic computations based on recursive models of data analysis” // SIIT. 2022. Vol. 4, No. 1(8), pp. 27-36. DOI 10.54708/26585014_2022_41827. EDN UOMMOU. (In Russian). ]]

Shakhmametova G., Yusupova N., Zulkarneev R., Khudoba Ye. Concept map for clinical recommendations data and knowledge structuring // Proceedings of the 8th International Conference on Applied Innovations in IT. Koethen. Germany. March 10. 2020. Vol. 8. Issue 1. Koethen, Germany: Anhalt University of Applied Sciences, 2020, pp. 71-76. EDN PXBUZZ.

Юсупова Н. И., Гаянова М. М., Богданов М. Р., Юсупова, Н. И. Извлечение информации об использовании информационных технологий для поддержки принятия решений в медицинской диагностике // Вестник Южно-Уральского государственного университета. Серия: Компьютерные технологии, управление, радиоэлектроника. 2022. Т. 22. № 1. С. 14 27. DOI 10.14529/ctcr220102. EDN HSTNZS. [[ Yusupova N. I., Gayanova M. M., Bogdanov M. R. Yusupova, N. I. “Extracting information on the use of information technologies to support decision-making in medical diagnostics” // Bulletin of the South Ural State University. Series: Computer technologies, control, radio electronics. 2022. Vol. 22, No. 1, pp. 14-27. DOI 10.14529/ctcr220102. EDN HSTNZS. (In Russian). ]]

Шахмаметова Г. Р., Христодуло А. Д., Береговая С. П. Анализ эндокринологических данных на основе моделей классификации // СИИТ. 2022. Т. 4. № 2(9). С. 30-36. DOI 10.54708/26585014_2022_42930. EDN LBZVZL. [[ Shakhmametova G. R., Khristodullo A. D., Beregovaya S. P. “Analysis of endocrinological data based on classification models” // SIIT. 2022. Vol. 4, No. 2(9), pp. 30-36. DOI 10.54708/26585014_2022_42930. EDN LBZVZL. (In Russian). ]]

Мирасов О. О. Анализ современного состояния исследований в области обработки геномных данных методами машинного обучения // Мавлютовские чтения: Мат-лы XV Всероссийской молодежной научной конференции: В 7 тт. Уфа, 26–28 октября 2021 г. Т. 4. Уфа: УГАТУ, 2021. С. 262-268. EDN DRAWPI. [[ Mirasov O. O. “Analysis of the current state of research in the field of genomic data processing using machine learning methods” / scientific supervisor G. R. Shakhmametova // Mavlyutov Readings: materials of the XV All-Russian youth scientific conference, Ufa, October 26-28, 2021. Volume 4, pp. 262-268. EDN DRAWPI. (In Russian). ]]


Ссылки

  • На текущий момент ссылки отсутствуют.


(c) 2024 О. О. Мирасов, Г. Р. Шахмаметова