Мультипараметрический метод установления авторства текста: интеграция стилометрического, тематического и прагматического анализа

Д. С. Алексеева

Аннотация


В условиях тотальной цифровизации коммуникаций текст стал основным носителем криминалистически значимой информации, что требует развития новых методов его автоматизированного анализа для нужд расследования. Традиционные подходы, такие как стилометрия, семантический или прагматический анализ, применяются изолированно, что ограничивает полноту и надежность лингвистической экспертизы. В данной статье предлагается комплексный мультипараметрический метод атрибуции анонимных или спорных текстов, интегрирующий три независимых лингвистических уровня: формально-статистический (стилометрия на основе дельты Бёрроуза), смысловой (тематическое моделирование с использованием Latent Dirichlet Allocation) и прагматический (оценка достоверности нарратива по критериям CBCA – Criteria-Based Content Analysis). Метод предполагает извлечение соответствующих векторов признаков, вычисление на их основе метрик стилистического, тематического и прагматического сходства и их последующую взвешенную агрегацию в итоговый показатель соответствия (Compliance Indicator), максимизирующий вероятность корректной атрибуции авторства. Теоретическая значимость работы заключается в разработке формальной модели комплексного лингвистического «цифрового профиля», а практическая – в создании методологического базиса для инструментов поддержки принятия решений при расследовании киберпреступлений, экстремизма и других сложно структурированных деяний, опосредованных цифровым текстом.

Ключевые слова


Лингвокриминалистика; атрибуция текста; установление авторства; мультипараметрический анализ; стилометрия; тематическое моделирование (LDA); анализ достоверности (CBCA); цифровая криминалистика.

Полный текст:

PDF

Литература


Blei D. M., Ng A. Y., Jordan M. I. Latent Dirichlet Allocation // J. of Machine Learning Research. 2001. 3. 601-608.

Coulthard M., Johnson A. An Introduction to Forensic Linguistics: Language in Evidence. 2007. DOI: 10.1017/S0272263109090093.

Diesner J. ConText: Network-based analysis of unstructured text data // Alhajj R., Rokne J. (eds.). 2014. DOI: 10.1007/978-1-4939-7131-2.

Grant T. TXTBK 2NVR: The idiolect of a terrorist? The Routledge Handbook of Forensic Linguistics. 2013. Pp. 493-508

Juola P. Authorship Attribution. Foundations and Trends® in Information Retrieval. 2008. DOI: 10.1561/1500000005.

Koppel M., Schler J., Argamon S. Authorship attribution in the wild. Language Resources and Evaluation. 2011. EDN: GQJMZB.

Liu B. Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies. 2012. DOI: 10.1162/COLI_r_00186.

Masip J. Deception Detection: State of the Art and Future Prospects. 2017. EDN: YGJPWY.

Sporer S. Deception and cognitive load: expanding our horizon with a working memory model // Frontiers in Psychology. 2016. 7. DOI: 10.3389/fpsyg.2016.00420.

Stamatatos E. A survey of modern authorship attribution methods // J. American Society for Information Science and Technology. 2009. EDN: MFXHYX.

Turell M. T. The Use of Textual, Grammatical and Sociolinguistic Evidence in Forensic Text Comparison. 2010. DOI: 10.1558/ijsll.v17i2.211.

Villafana T. The Prosody of Deception: A Forensic Phonetic Approach. The Oxford Handbook of Language and Law. 2019.

Vrij A. Detecting lies and deceit: pitfalls and opportunities in nonverbal and verbal lie detection. 2014. DOI: 10.1515/9783110276794.321.

Ишкинин Р. А., Ризванов Д. А. Классификация текстов на основе семантической близости с использованием встраиваемых моделей // СИИТ. 2026. Т. 8, № 1(25). С. 127-133. EDN: DIIKOG. [[Ishkinin R. A., Rizvanov D. A. “Text classification based on semantic similarity using embedding models” // SIIT. 2026. Vol. 8, No. 1(25). P. 127-133. (In Russian).]]

Коровин Е. А., Чиглинцева С. А. и др. Медицинская рекомендательная система на основе автоматического извлечения знаний из текстов // СИИТ. 2024. Т. 6, № 4(19). С. 111-121. EDN: OTVTXR. [[Korovin E. A., Chiglintseva S. A., et al. Medical recommender system based on automatic knowledge extraction from texts // SIIT. 2024. Vol. 6, No. 4(19). P. 111-121. (In Russian).]]

Крылов И. Ф. Криминалистическое учение о следах. Ленинград: Изд-во Ленингр. ун-та, 1976. 197 с. [[Krylov I. F. Forensic Science on Traces. Leningrad: Leningrad University Press, 1976. (In Russian).]]




DOI: https://doi.org/10.54708/SIIT-2026-no2-p73

Ссылки

  • На текущий момент ссылки отсутствуют.


(c) 2026 Д. С. Алексеева