Предсказание наступления страхового случая с помощью трансформерных нейросетей

М. И. Морозов

Аннотация


Одной из актуальных проблем рынка страхования является проблема выявления рисков при заключении договора со страхователем. Страховые организации используют множество методов выявления рисков страхования, такие как: скоринг, обогащение данных из внешних ресурсов, построение гибких систем принятия решений на основе деревьев решений. Системы принятия решений с течением времени показали свою высокую эффективность в процессе сокращения рисков при заключении договоров страхования, однако такие системы имеют ряд проблем, которые вносят неопределенность в прогнозирование убыточности страховой компании. Из основных ключевых проблем деревьев решений можно выделить: чувствительность к изменению данных, наличие линейных границ принятия решений, чувствительность к пропущенным данным. В последнее время нейросетевые технологии показали свою высокую эффективность в решении ряда сложных бизнес-задач. В данной работе мы ставим перед собой задачу преодолеть ограничения деревьев решений с помощью нейронной сети трансформера – TabTransformer в задаче предсказания вероятности наступления страхового случая. В качестве исходного набора данных была взята информация о страховании транспортных средств Эфиопии за 2011–2018 гг. Проведено сравнение эффективности трансформерных нейросетей с методами построения деревьев решений CART и Random Forest. Полученные результаты работы могут быть использованы в дальнейшем для реализации рекомендательной андеррайтинговой системы, целью которой будет помощь в предсказании возможных убытков по страховому полису.

Ключевые слова


деревья решений; трансформерные нейронные сети; машинное обучение; автомобильное страхование; страховой случай

Литература


Бронская Т. А. Искусственный интеллект в страховой сфере как инструмент повышения конкурентоспособности. Белорусск. гос. ун-т, 2023. С. 389-391. EDN ECHUVY. [[ Bronskaya T. A. Artificial Intelligence in the Insurance Sector as a Tool for Increasing Competitiveness. Belarusian State University, 2023, pp. 389-391. EDN ECHUVY. (In Ruussian. ]]

Ritho B. M., Simiyu E., Omagwa J. “The impact of loss ratio on the financial stability of insurance firms in Kenya 4” // Journal of Finance and Accounting. 2023. Vol. 7, no. 4, pp. 22-41. DOI 10.53819/81018102t4161. EDN ACMIPP.

Авдеев Д. А. «Социальный скоринг» как фактор нарушения права на неприкосновенность частной жизни // Международный научно-исследовательский журнал. 2023. № 6 (132). DOI 10.23670/IRJ.2023.132.126. EDN MZQKFG. [[ Avdeev D. A. "Social scoring as a factor in violation of the right to privacy” // International Research journal. 2023. No. 6 (132). DOI 10.23670/IRJ.2023.132.126. EDN MZQKFG. (In Ruussian. ]]

Agarwal P. et al. “A process-aware decision support system for business processes” // Proc. 28th ACM SIGKDD Conf. on Knowledge Discovery and Data Mining. New York, NY, USA Association for Computing Machinery, 2022. pp. 2673-2681. DOI 10.1145/3534678.3539088.

Eling M., Nuessle D., Staubli, J. “The impact of artificial intelligence along the insurance value chain and on the insurability of risks” // Geneva Pap Risk Insur Issues Pract 47. 2022, pp. 205-241. DOI 10.1057/s41288-020-00201-7. EDN QQCAPW.

Mahohoho, Brighton & Chimedza, Charles & Matarise, Florance & Munyira, Sheunesu. (2023). Artificial Intelligence Based Automated Actuarial Loss Reserving Model for the General Insurance Sector. 10.21203/rs.3.rs-3124884/v1.

Breiman L. “Random Forests” // Machine Learning. 2001. Vol. 45, no. 1, pp. 5-32. DOI 10.1023/A:1010933404324. EDN ARROTH.

Breiman L. Classification and Regression Trees. Wadsworth International Group, 1984.

Padhi I. et al. Tabular Transformers for Modeling Multivariate Time Series arXiv:2011.01843. arXiv, 2021. DOI 10.1109/ICASSP39728.2021.9414142.

Huang X. et al. TabTransformer Tabular Data Modeling Using Contextual Embeddings arXiv:2012.06678. arXiv, 2020.

Субботин С. А. Построение деревьев решений для случая малоинформативных признаков // Радіоелектроніка, інформатика, управління. 2019. №1 (48). С. 122-131. [[ Subbotin S. A. “Construction of decision trees for the case of uninformative features” // Radioelectronics, Informatics, Management. 2019. No. 1 (48), pp. 122-131. (In Ruussian. ]]

Bengio Y., Delalleau O., Simard C. “Decision trees do not generalize to new variations” // Computational Intelligence. 2010. Vol. 26, pp. 449-467. DOI 10.1111/j.1467-8640.2010.00366.x.

Vehicle Insurance Data [Online]. Available https://www.kaggle.com/datasets/imtkaggleteam/vehicle-insurance-data (Accessed 22.06.2024).

Google Colab [Online]. Available https://colab.research.google.com/ (Accessed 18.09.2024).

User Guide [Online] // scikit-learn. Available https://scikit-learn/stable/user_guide.html (Accessed 18.09.2024).

Team K. Keras documentation Developer guides [Online]. Available https://keras.io/guides/ (Accessed 18.09.2024).

All symbols in TensorFlow 2 | TensorFlow v2.16.1 [Online] // TensorFlow. Available URL https://www.tensorflow.org/ api_docs/python/tf/all_symbols (Accessed 18.09.2024).

Opitz J. “A closer look at classification evaluation metrics and a critical reflection of common evaluation practice” // Transactions of the Association for Computational Linguistics. 2024. Vol. 12, pp. 820-836. DOI 10.1162/tacl_a_00675. EDN SQAYAZ.

Peiris H. et al. “Integration of traditional and telematics data for efficient insurance claims prediction” // ASTIN Bulletin. The Journal of the IAA. 2024. Vol. 54, no. 2, pp. 263-279. DOI 10.1017/asb.2024.6. EDN OSCGGA.

Duval F., Boucher J.-P., Pigeon M. How Much Telematics Information Do Insurers Need for Claim Classification. arXiv:2105.14055. arXiv, 2021.

Кучкарова Н. В. Оценка актуальных угроз и уязвимостей объектов критической информационной инфраструктуры с использованием технологий интеллектуального анализа текстов // СИИТ. 2024. Т. 6, № 2(17). С. 50-65. EDN NLDWBE. [[ Kuchkarova N. V. “Assessment of current threats and vulnerabilities of critical information infrastructure objects using text mining technologies” // SIIT. 2024. Vol. 6, no. 2(17), pp. 50-65. EDN NLDWBE. (In Ruussian. ]]

Макарова Е. А., Габдуллина Э. Р., Юсупов М. М., Вагапова Г. Р. Алгоритм интеллектуального анализа региональных данных об инвестиционном риске // СИИТ. 2024. Т. 6, № 1(16). С. 77-86. EDN EBASQU. [[ Makarova E. A., Gabdullina E. R., Yusupov M. M., Vagapova G. R. “Algorithm for intellectual analysis of regional data on investment risk” // SIIT. 2024. Vol. 6, no. 1(16), pp. 77-86. EDN EBASQU. (In Ruussian. ]]

Котельников В. А. Поддержка принятия решений при управлении услугами системы моментальных платежей с использованием интеллектуальных технологий // СИИТ. 2023. Т. 5, № 4(13). С. 111-122. EDN KEDROK. [[ Kotelnikov V. A. “Support for decision-making in managing services of the instant payment system using intelligent technologies” // SIIT. 2023. Vol. 5, no. 4(13), pp. 111-122. EDN KEDROK. (In Ruussian. ]]

Шалфеева Е. А. Методология производства жизнеспособных систем доверительного искусственного интеллекта // СИИТ. 2023. Т. 5, № 4(13). С. 28-49. EDN CJTKQH. [[ Shalfeeva E. A. “Methodology to produce viable systems of trustworthy artificial intelligence” // SIIT. 2023. Vol. 5, no. 4(13), pp. 28-49. EDN CJTKQH. (In Ruussian. ]]

Кузнецова В. Ю. Информационная технология принятия решений в микрофинансовой организации // СИИТ. 2023. Т. 5, № 3(12). С. 27-41. EDN PDZIIA. [[ Kuznetsova V. Yu. “Information technology of decision-making in a microfinance organization” // SIIT. 2023. Vol. 5, no. 3(12), pp. 27-41. EDN PDZIIA. (In Ruussian. ]]


Ссылки

  • На текущий момент ссылки отсутствуют.


(c) 2025 М. И. Морозов