Прогнозирование страховых случаев на основе стекинг-ансамблирования

М. И. Морозов

Аннотация


Выявление рисков является неотъемлемой задачей любой финансовой организации, в том числе и автомобильного страхования. В настоящее время в бизнесе используется множество методов выявления рисков, в число которых входит построение моделей машинного обучения и гибких систем на основе деревьев решений. Системы принятия решений показывают высокую эффективность в выявлении рисков, однако такие системы имеют ряд проблем, которые вносят неопределенность в прогнозирование убыточности страховой компании: чувствительность к изменению данных, наличие линейных границ принятия решений, чувствительность к пропущенным данным. В решении ряда сложных бизнес задач высокую эффективность показывают не только нейросети и методы машинного обучения, но и методы, позволяющие объединять прогнозы отдельных моделей – стекинг-ансамблирование. В данной работе мы ставим перед собой задачу преодолеть ограничения деревьев решений на основе ансамбля моделей машинного обучения в задаче предсказания вероятности наступления страхового случая. В качестве исходного набора данных используется информация о страховании автомобилей в России за 2023-2025 г. Проведено сравнение эффективности индивидуальных моделей машинного обучения и методов стекинг ансамблирования. Полученные результаты работы позволяют судить о эффективности применённых методов в предсказании вероятности страхового случая.

Ключевые слова


Деревья решений; нейронные сети; машинное обучение; автомобильное страхование; убыточность; стекинг-ансамблирование.

Полный текст:

PDF

Литература


Baran S., Rola P. Prediction of motor insurance claims occurrence as an imbalanced machine learning problem, Apr. 2022. DOI: 10.48550/arXiv.2204.06109.

Breiman L. Random Forests // Machine Learning, Vol. 45, No. 1, pp. 5–32, Oct. 2001. DOI: 10.1023/A:1010933404324. EDN: ARROTH.

Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System // Proc. 22nd ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining, Aug. 2016, pp. 785–794. DOI: 10.1145/2939672.2939785.

Chenglong Ye, Lin Zhang, et al. Combining predictions of auto insurance claims // Econometrics, Vol. 10, No. 2, pp. 19-19, Apr. 2022. DOI: 10.3390/econometrics10020019. EDN: JIGXLT.

Hornik K., Stinchcombe M., White H. Multilayer feedforward networks are universal approximators // Neural Networks, Vol. 2, No. 5, pp. 359–366, Jan. 1989. DOI: 10.1016/0893-6080(89)90020-8.

Micci-Barreca D. A preprocessing scheme for high-cardinality categorical attributes in classification and prediction problems // SIGKDD Explor. Newsl, Vol. 3, No. 1, pp. 27–32, Jul. 2001. DOI: 10.1145/507533.507538.

Prokhorenkova L., Gusev G., et al. CatBoost: unbiased boosting with categorical features, 20 Jan 2019. DOI: 10.48550/arXiv.1706.09516.

Ritho B. M., Simiyu E., Omagwa J. The Impact of Loss Ratio on the Financial Stability of Insurance Firms in Kenya // Journal of Finance and Accounting, vol. 7, No. 4, Art. No. 4, Jun. 2023, DOI: 10.53819/81018102t4161. EDN: ACMIPP.

Singh U., Arora P., et al. Comparative Analysis of Transformers for Modeling Tabular Data: A Casestudy using Industry Scale Dataset, 24 Nov 2023, arXiv: arXiv:2311.14335. DOI: 10.48550/arXiv.2311.14335.

So B. Enhanced Gradient Boosting for Zero-Inflated Insurance Claims and Comparative Analysis of CatBoost, XGBoost, and LightGBM, 18 Jun 2024. DOI: 10.48550/arXiv.2307.07771.

Ахвледиани Ю. Т. Актуальные направления развития страхового рынка в современных условиях // Роль управления рисками и страхования в обеспечении устойчивости общества и экономики: Сб. тр. XXIV Междунар. науч.-практ. конф., Москва, 01 июня 2023. М.: МГУ, 2023. С. 26-30. EDN: NXNJEF. [[Akhvlediani Yu. T. Current directions of development of the insurance market in modern conditions. Moscow State University, 2023. Pp. 26–30 (In Russian).]]

Бронская Т. А. Искусственный интеллект в страховой сфере как инструмент повышения конкурентоспособности // Тенденции экономического развития в XXI веке: Матер. V Междунар. науч.-практ. конф. Минск, 01 марта 2023. Минск: БГУ, 2023. С. 389-391. EDN: ECHUVY. [[Bronskaya T. A. Artificial intelligence in the insurance sphere as a tool for improving Competitiveness. Belarusian State University, 2023. Pp. 389–391 (In Russian).]]

Кириченко А. О., Золкин А. Л. и др. Прогнозирование страховых рисков с использованием искусственного интеллекта // Прикладные экономические исследования. 2024. № 3. С. 196-203. EDN SLHSLS. [[Kirichenko A. O., Zolkin A. L., et al. Forecasting insurance risks using artificial intelligence // Applied Economic Research, 2024. No. 3. P. 196–203 (In Russian).]]

Котельников В. А. Поддержка принятия решений при управлении услугами системы моментальных платежей с использованием интеллектуальных технологий // СИИТ. 2023. Т. 5, № 4(13). С. 111-122. EDN: KEDROK. [[Kotelnikov V. A. Support for decision-making in managing services of the instant payment system using intelligent technologies // SIIT. 2023. Vol. 5, No. 4(13). P. 111-122. (In Russian).]]

Кузнецова В. Ю. Информационная технология принятия решений в микрофинансовой организации // СИИТ. 2023. Т. 5, № 3(12). С. 27-41. EDN: PDZIIA. [[Kuznetsova V. Yu. Information technology of decision-making in a microfinance organization // SIIT. 2023. Vol. 5, No. 3(12). P. 27-41. (In Russian).]]

Макарова Е. А., Габдуллина Э. Р. и др. Алгоритм интеллектуального анализа региональных данных об инвестиционном риске // СИИТ. 2024. Т. 6, № 1(16). С. 77-86. EDN: EBASQU. [[Makarova E. A., Gabdullina E. R. et al. Algorithm for intellectual analysis of regional data on investment risk // SIIT. 2024. Vol. 6, No. 1(16). P. 77-86. (In Russian).]]

Морозов М. И. Подготовка данных датасета "Vehicle Insurance Data 2018" для предсказания страховой премии // Информационные технологии и математическое моделирование (ИТММ-2024): матер. XXIII Междунар. конф. им. А. Ф. Терпугова, Томск, 20–26 окт. 2024. Томск: ТГУ, 2024. С. 562-568. LQNWDB. [[Morozov M. I. Data Preparation of the Vehicle Insurance Dataset 2018 for Insurance Premium Prediction. 2024, pp. 562–568. (In Russian).]]

Морозов М. И. Предсказание наступления страхового случая с помощью трансформерных нейросетей // СИИТ. 2025. Т. 7, № 2(21). С. 96–102. EDN: FEFPBE. [[Morozov M. I. Prediction of the occurrence of an insured event using transformer neural networks: 2(21) // SIIT. 2025. Vol. 7, No. 2(21). P. 96–102. (In Russian).]]




DOI: https://doi.org/10.54708/SIIT-2026-no1-p93

Ссылки

  • На текущий момент ссылки отсутствуют.


(c) 2026 М. И. Морозов