Структурно-семантический анализ научных публикаций выделенной предметной области

М. М. Гаянова, А. М. Вульфин

Аннотация


Рассматриваются вопросы структурно-семантического анализа научных текстов; разработки системы для формирования корпуса текстов и организации хранения на основе единой информационной платформы. Платформа предназначена для широкого круга ученых, и ориентирована на реализацию не только поверхностного анализа (временной, географический), но и глубокого содержательного анализа, в результате которого могут быть выявлены наилучшие результаты в рассматриваемых предметных областях. Представлена структурно-функциональная организация платформы анализа и иерархическая организация корпуса научных текстов. Рассмотрена организация поиска и извлечения текстовых документов с тематических ресурсов в задаче построения корпуса текстов. Проанализированы требования к платформе о поддержке методов интеллектуального анализа с целью автоматизации процесса структурирования накопленных данных, выявления скрытых закономерностей и построения базы знаний предметной области. Рассмотрен пример ручного анализа научных текстов по подборке «Вихревые электромагнитные поля в инфокоммуникационных системах».

Ключевые слова


семантический анализ; обработка слабоструктурированных данных; WORM; корпус текстов; платформа семантического анализа; Text Mining; интеллектуальный анализ данных; нейросетевая модель; извлечение именованных сущностей; структурно-функциональная схема

Полный текст:

PDF

Литература


Липницкий С. Ф. Семантический анализ текста на основе ситуативно-синтагматической сети // Информатика. 2019. № 2 (6). С. 102–110. [ S. F. Lipnitskiyi, “Semantic text analysis based on situational-syntagmatic network”, (in Russian), in Informatika, no. 2 (6), pp. 102-110, 2019. ]

Отделение ГПНТБ СО РАН. Структурно-семантический анализ темы обзора. [Электронный ресурс]. URL: http://www.spsl.nsc.ru/ (дата обращения 10.04.2022). [ Branch of the State Public Scientific and Technical Library of the Siberian Branch of the Russian Academy of Sciences. Structural and semantic analysis of the review topic (2022, Apr. 10). [Online]. Available: http://www.spsl.nsc.ru/ ]

Chowdhary K. R. Natural language processing // Fundamentals of artificial intelligence. 2020. Pp. 603-649.

Cambria E., White B. Jumping NLP curves: A review of natural language processing research // IEEE Computational intelligence magazine. 2014. Vol. 9, No. 2. Pp. 48-57.

Bengfort B., Bilbro R., Ojeda T. Applied text analysis with python: Enabling language-aware data products with machine learning. Sebastopol, CA: O'Reilly Media, Inc., 2018. 332 p.

Юсупова Н. И., Шахмаметова Г. Р. Интеграция инновационных информационных технологий: теория и практика // Вестник УГАТУ. 2010. Т. 14, № 4 (39). С. 112–118. [ N. I. Yusupova, G. R. Shahmametova, “Integration of innovative information technologies: theory and practice”, (in Russian), in Vestnik UGATU, vol. 14, no. 4 (39), pp. 112-118, 2010. ]

Goldberg Y. Neural network methods for natural language processing // Synthesis lectures on human language technologies. 2017. Vol. 10, No. 1. Pp. 1-309.

Razno M. Machine learning text classification model with NLP approach // Computational Linguistics and Intelligent Systems. 2019. Vol. 2. Pp. 71-73.

KIM - a semantic platform for information extraction and retrieval / B. Popov, et al. // Natural language engineering. 2004. Vol. 10, Iss. 3-4. Pp. 375-392.




DOI: https://doi.org/10.54708/26585014_2022_41837

Ссылки

  • На текущий момент ссылки отсутствуют.


(c) 2022 М. М. Гаянова, А. М. Вульфин