Анализ участия преподавателей вуза в научных мероприятиях с помощью Elasticsearch

А. В. Пруцков

Аннотация


Анализ данных является основой для принятия управленческих решений. Разработаны различные программы, позволяющие автоматизировать анализ данных. Одним из видов анализа данных является агрегация. Наиболее разнообразные способы агрегации данных по сравнению с другими программами предоставляет программа Elasticsearch (ES) из пакета программ Elastic Stack. ES – это информационно-поисковая система, одной из функций которой является агрегация данных. Цель работы – продемонстрировать возможности ES в агрегации данных о планах участия преподавателей вуза в научных мероприятиях. С помощью агрегаций термов, количества уникальных значений, количества значений и гистограммы выявлены: 1) подразделения вуза с наибольшим количеством преподавателей, подавших заявки на участие в мероприятиях; 2) мероприятия с наибольшим количеством заявок в одном из подразделений; 3) мероприятия с наибольшим количеством заявок, проводимые в вузе и вне вуза; 4) распределение количества преподавателей в зависимости от числа запланированных ими участий в мероприятиях. По результатам агрегаций автор сделал выводы о неравномерности распределения заявок по подразделениям и предпочтении участия в мероприятиях, организованных вузом, и другие. Запросы агрегаций имеют пояснения. Проведенная агрегация данных показывает недооценку ES при решении этой задачи.

Ключевые слова


Elasticsearch; Elastic Stack; анализ данных; агрегация данных; запросы агрегации; преподаватели; университет; конференция

Полный текст:

PDF

Литература


[Пуз14] Пузина Н. В. Анализ научной активности преподавателей омских вузов // Вестник Сибирского института бизнеса и информационных технологий. 2014. № 2 (10). С. 99-104. EDN: SNRXGH. [[ Puzina N.V. “Analysis of scientific activity of Omsk universities staff // Herald of Siberian Institute of Business and Information Technologies. 2014, no. 2 (10), pp. 99–104. EDN: SNRXGH. (In Russian). ]]

[Мир19] Миролюбова А. А., Ксенофонтова О. Л. Научно-исследовательская деятельность вузов: сравнительный анализ и оценка результатов // Известия вузов. Серия «Экономика, финансы и управление производством». 2019. № 04 (42). С. 131-138. EDN: QUAPSI. [[ Miroljubova A. A., Ksenofontova O. L. “Scientific activity of universities: comparing, analysis, and estimation of results” // Proceedings of Universities. The Economics, Finance, and Production Management Serie. 2019. No. 04 (42), pp. 131–138. EDN: QUAPSI. (In Russian). ]]

[Gén19] Génois M. et al., "Building Connections: How Scientists Meet Each Other During a Conference" // arXiv Preprint, 2019. p. 1901.01182. DOI: 10.48550/arXiv.1901.01182.

[Lut24] Lutter M. et al., "Who Talks to the Prof? Gender Differences in Interaction with Senior Scholars at Four Academic Confer-ences" // Preprint. 2024. DOI: 10.31235/osf.io/9pzym.

[Row18] Rowe N. "When You Get What You Want, But Not What You Need”: The Motivations, Affordances and Shortcomings of Attending Academic/Scientific Conferences" // International Journal of Research in Education and Science. 2018. Vol. 4, No. 2, pp. 714-729. DOI: 10.21890/ijres.438394.

[Бал05] Балабан В.А. Научно-исследовательская работа и участие преподавателей вуза в научных конференциях // Известия Дальневосточного федерального университета. Экономика и управление. 2005. № 4. С. 125-130. EDN: JXUHRX. [[ Balaban V. A. “Research Work and university staff participant in scientific conferences” // Proceedings of the Far-Eastern Federal University. Economics and Management. 2005. No. 4, pp. 125–130. EDN: JXUHRX. (In Russian). ]]

[Sza23] Szasz B. Data Analytics Essentials You Always Wanted to Know. Vibrant Publishers, 2023.

[Fre19] Freeman M., Ross J. Programming Skills for Data Science. Start Writing Code to Wrangle, Analyze, and Visualize Data with R. Addison-Wesley, 2019.

[Kab11] Kabacoff R. R in Action. Data Analysis and Graphics with R. Manning, 2011.

[Ава24] Авачева Т. Г., Пруцков А. В., Медведева О. В. Современные технологии решения задач медицинской статистики // Современные проблемы здравоохранения и медицинской статистики. 2024. № 2. С 292-303. DOI: 10.24412/2312-2935-2024-2-292-303. EDN: ZGNPWH. [[ Avacheva T. G., Prutzkow A. V., Medvedeva O. V. “Modern technologies to solve problems in medical statistics” // Actual Problems of Public Health Medical Statistics. 2024. No. 2, pp. 292–303. DOI: 10.24412/2312-2935-2024-2-292-303. (In Russian). ]]

[Bri17] Brink H. et al. Real-World Machine Learning. Manning, 2017.

[Gra15] Gras J. Data Science from Scratch. O'Reilly, 2015.

[Fos21] Foster I. et al. (eds) Big Data and Social Science. Data Science Methods and Tools for Research and Practice, 2nd ed. Business Expert Press, 2021.

[Sha22] Shan J. et al. SQL for Data Analytics: Harness the Power of SQL to Extract Insights from Data. Packt, 2022.

[Kha22] Khan S. Big Data and Analytics. Notion Press, 2022.

[Per20] Perrin J.-G. Spark in Action: Covers Apache Spark 3 with Examples in Java, Python, and Scala, 2nd ed. Manning, 2020.

[Kni22] Knight D. et al. Microsoft Power BI Quick Start Guide: The Ultimate Beginner's Guide to Data Modeling, Visualization, Digital Storytelling, and More. Packt, 2022.

[Mil22] Milligan J.N. et al. Learning Tableau 2022: Create Effective Data Visualizations, Build Interactive Visual Analytics, and Improve Your Data Storytelling Capabilities. Packt, 2022.

[Vit18] Vitantonio J.I., Mahler M. Mastering Qlik Sense: Expert Techniques on Self-service Data Analytics to Create Enterprise Ready Business Intelligence Solutions. Packt, 2018.

[Ram23] Ramjan S., Sunkpho J. Principles and Theories of Data Mining with RapidMiner. IGI Global, 2023. DOI: 10.4018/978-1-6684-4730-7.

[Gre20] Greco C. Data Science Tools. R, Excel, KNIME, and OpenOffice. Mercury Learning and Information, 2020. DOI: 10.1515/9781683925811.

[For23] Fortino A. Data Mining and Predictive Analytics for Business Decisions. A Case Study Approach. Mercury Learning and Infor-mation, 2023. DOI: 10.1515/9781683926740.

[Lee22a] Lee J., Lee C.-F. Essentials of Excel VBA, Python, and R. Volume I: Financial Statistics and Portfolio Analysis, 2nd ed. Springer, 2022. DOI: 10.1007/978-3-031-14236-9.

[Lee22b] Lee J. et al. Essentials of Excel VBA, Python, and R. Volume II: Financial Derivatives, Risk Management and Machine Learning, 2nd ed. Springer, 2022. DOI: 10.1007/978-3-031-14283-3.

[Mou21] Mount G. Advancing into Analytics. From Excel to Python and R. O'Reilly, 2021.

[Sah21] Sahay A. Essentials of Data Science and Analytics. Statistical Tools, Machine Learning, and R-Statistical Software Overview. Busi-ness Expert Press, 2021. DOI: 10.4128/9781631573460.

[Sco23] Scott-Boyer M.P. et al., "Use of Elasticsearch-Based Business Intelligence Tools for Integration and Visualization of Biological Data" // Briefings in Bioinformatics. 2023. Vol. 24, No. 6, pp. bbad348. DOI: 10.1093/bib/bbad348. EDN: KFJZCW.

[Li19] Li Y. et al. , "A cloud-based framework for large-scale log mining through Apache Spark and Elasticsearch // Applied Science. 2019. Vol. 9, no. 1114, pp. 109-127. DOI: 10.3390/app9061114.

[Cho18] Cholomskis A. et al. , "Cloud Software Performance Metrics Collection and Aggregation for Auto-Scaling Module" // Infor-mation and Software Technologies (ICIST). Communications in Computer and Information Science. 2018, No. 920, pp. 2 10. DOI: 10.1007/978-3-319-99972-2_10.

[Пру23] Пруцков А.В. Способ выявления книг для начального освоения комплекса программ Elastic Stack и его результаты // Int. J. of Open Information Technologies. 2023. Т. 11, № 11. С. 53-57. DOI: 10.13140/RG.2.2.17164.73601. EDN: TKFHUB. [[ Prutzkow A. V. “An approach to identify books for the initial learning of the elastic stack and its results” // Int. J. of Open Information Technologies, 2023. Vol. 11, No. 11, pp. 53-57. DOI: 10.13140/RG.2.2.17164.73601.. (In Russian). ]]

[Pru25] Prutzkow A., "Elasticsearch in Medicine: A Technical Survey" // Information Society. 2025. No. 4, pp.31-38.




DOI: https://doi.org/10.54708/2658-5014-SIIT-2025-no4-p38

Ссылки

  • На текущий момент ссылки отсутствуют.


(c) 2025 А. В. Пруцков