PreprintPDF Available
Preprints and early-stage research may not have been peer reviewed yet.

Abstract

In Russia nowadays there some significant steps de-veloping the retail insurance market, the lion's share of which is car insurance. No secret that the profitability of this type of insurance activity today is reduced – in particular, because of the growth of fraud. To fight this the security service of insurance companies tries to identify and investigate suspicious losses at the stage of settlement. At the same time, companies spend a lot of time to check problem cases that are not fraudulent. An important step towards the solution to this problem is the creation of an analytical model, which allows determining the likelihood of fraud on the basis of available data on the current insurance cases. The given task is to be solved by the members of the nomination. We offer a solution to this problem with the use of the automated system-cognitive analysis (ASC-analysis) and its program toolkit which is the Universal cognitive analytical system "Eidos". The article provides a detailed numerical example, showing all the stages of the problem solving in the ASC-analysis, from problem definition, data preparation and input into the "Eidos" system, synthesis and verification of the model, the challenges of assessing fraud risk, decision-making and research the subject area by examining its system-cognitive model. This task was set in the Championship RAIF-Challenge 2017: https://raif.jet.su/improject-3
1
УДК 004. 8
UDC 004. 8
05.00.00 Технические науки
Engineering
ПРИМЕНЕНИЕ АСК-АНАЛИЗА И
ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ
«ЭЙДОС» ДЛЯ ОЦЕНКИ РИСКА
МОШЕННИЧЕСТВА В ОСАГО
APPLICATION OF ASC-ANALYSIS AND
"EIDOS" INTELLECTUAL SYSTEM FOR
ASSESSING THE RISK OF FRAUD IN CAR
INSURANCE
Луценко Евгений Вениаминович
д.э.н., к.т.н., профессор
Scopus Author ID: 57191193316
РИНЦ SPIN-код: 9523-7101
prof.lutsenko@gmail.com
Lutsenko Eugeny Veniaminovich
Dr.Sci.Econ., Cand.Tech.Sci., professor
Scopus Author ID: 57191193316
RSCI SPIN-code: 9523-7101
prof.lutsenko@gmail.com
Кубанский государственный аграрный универси-
тет имени И.Т.Трубилина, Краснодар, Россия
Kuban State Agrarian University, Krasnodar, Russia
В России большими шагами развивается рынок
розничного страхования, львиную долю которого
занимает ОСАГО. Не секрет, что рентабельность
этого вида страховой деятельности сегодня сокра-
щается – в том числе из-за роста мошенничества.
Для борьбы с ним службы безопасности страховых
компаний стараются выявлять и расследовать по-
дозрительные убытки на стадии урегулирования.
При этом специалисты компаний тратят немало
времени на проверку проблемных случаев, кото-
рые не являются мошенническими. Важным шагом
на пути решения к решению этой задачи является
создание аналитической модели, которая позволит
на основе имеющихся данных о текущих страхо-
вых случаях определять вероятность мошенниче-
ства. Данную задачу и предстоит решить участни-
кам номинации. Предлагается решение данной
проблемы с применением автоматизированного
системно-когнитивного анализа (АСК-анализ) и
его программного инструментария – Универсаль-
ной когнитивной аналитической системы «Эйдос».
Приводится развернутый численный пример, де-
монстрирующий все этапы решения задачи в АСК-
анализе, от постановки задачи, подготовки исход-
ных данных и ввода их в систему «Эйдос», синтеза
и верификации модели, решения задач оценки
риска мошенничества, принятия решений и иссле-
дования предметной области путем исследования
ее системно-когнитивной модели. Данная задача
была поставлена на Чемпионате RAIF-Challenge
2017: https://raif.jet.su/improject-3
Ключевые слова: АВТОМАТИЗИРОВАННЫЙ
СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ, АСК-
АНАЛИЗ, СИСТЕМА «ЭЙДОС», РИСКИ
МОШЕННИЧЕСТВА, ОСАГО
Doi: 10.13140/RG.2.2.18167.24485
In Russia nowadays there some significant steps de-
veloping the retail insurance market, the lion's share of
which is car insurance. No secret that the profitability
of this type of insurance activity today is reduced in
particular, because of the growth of fraud. To fight this
the security service of insurance companies tries to
identify and investigate suspicious losses at the stage
of settlement. At the same time, companies spend a lot
of time to check problem cases that are not fraudulent.
An important step towards the solution to this problem
is the creation of an analytical model, which allows
determining the likelihood of fraud on the basis of
available data on the current insurance cases. The giv-
en task is to be solved by the members of the nomina-
tion. We offer a solution to this problem with the use
of the automated system-cognitive analysis (ASC-
analysis) and its program toolkit which is the Univer-
sal cognitive analytical system "Eidos". The article
provides a detailed numerical example, showing all the
stages of the problem solving in the ASC-analysis,
from problem definition, data preparation and input
into the "Eidos" system, synthesis and verification of
the model, the challenges of assessing fraud risk, deci-
sion-making and research the subject area by examin-
ing its system-cognitive model. This task was set in the
Championship RAIF-Challenge 2017:
https://raif.jet.su/improject-3
Keywords: AUTOMATED SYSTEM-COGNITIVE
ANALYSIS, ASC-ANALYSIS, SYSTEM "EIDOS",
FRAUD RISKS, INSURANCE
2
СОДЕРЖАНИЕ
1. ВВЕДЕНИЕ ................................................................................................................................................................................................ 2
1.1. ФОРМУЛИРОВКА ЗАДАЧИ С САЙТА ЧЕМПИОНАТА RAIF-CHALLENGE 2017: HTTPS://RAIF.JET.SU/IMPROJECT-3 ..................... 2
1.2. КРАТКО ОБ АВТОМАТИЗИРОВАННОМ СИСТЕМНО-КОГНИТИВНОМ АНАЛИЗЕ И СИСТЕМЕ «ЭЙДОС» ......................................... 3
2. КОГНИТИВНО-ЦЕЛЕВАЯ СТРУКТУРИЗАЦИЯ ПРЕДМЕТНОЙ ОБЛАСТИ ............................................................................. 15
3. ФОРМАЛИЗАЦИЯ ПРЕДМЕТНОЙ ОБЛАСТИ ................................................................................................................................ 16
3.1. ИСХОДНЫЕ ДАННЫЕ И ИХ ИСПРАВЛЕНИЕ ..................................................................................................................................... 17
3.2. УНИВЕРСАЛЬНЫЙ ПРОГРАММНЫЙ ИНТЕРФЕЙС (API) СИСТЕМЫ «ЭЙДОС» ДЛЯ ВВОДА ДАННЫХ ИЗ ВНЕШНИХ
ИСТОЧНИКОВ ДАННЫХ ТИПА ТАБЛИЦ MS EXCEL ............................................................................................................................... 17
3.3. КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ ............................................................................................................................ 21
3.4. ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ ......................................................................................................................................... 22
3.5. ОБУЧАЮЩАЯ ВЫБОРКА .................................................................................................................................................................. 22
4. СИНТЕЗ И ВЕРИФИКАЦИЯ СИСТЕМНО-КОГНИТИВНЫХ МОДЕЛЕЙ .................................................................................... 23
4.1. СИНТЕЗ И ВЕРИФИКАЦИЯ МОДЕЛЕЙ .............................................................................................................................................. 23
4.2. ЧАСТНЫЕ КРИТЕРИИ ЗНАНИЙ, ИСПОЛЬЗУЕМЫЕ В НАСТОЯЩЕЕ ВРЕМЯ В АСК-АНАЛИЗЕ И СИСТЕМЕ «ЭЙДОС» .................. 26
4.3. ОЦЕНКА ДОСТОВЕРНОСТИ МОДЕЛЕЙ ПО F-КРИТЕРИЮ ВАН РИЗБЕРГЕНА И ПО L-КРИТЕРИЯМ .............................................. 27
4.4. ВЫБОР НАИБОЛЕЕ ДОСТОВЕРНОЙ МОДЕЛИ И ПРИДАНИЕ ЕЙ СТАТУСА ТЕКУЩЕЙ .................................................................... 36
5. РЕШЕНИЕ ЗАДАЧИ ОЦЕНКИ РИСКА МОШЕННИЧЕСТВА В АВТОСТРАХОВАНИИ ОСАГО В НАИБОЛЕЕ
ДОСТОВЕРНОЙ МОДЕЛИ ....................................................................................................................................................................... 36
6. РЕШЕНИЕ ЗАДАЧИ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ (ИССЛЕДОВАНИЕ ВЛИЯНИЯ ЗНАЧЕНИЙ ФАКТОРОВ
НА ОЦЕНКУ РИСКА МОШЕННИЧЕСТВА) ........................................................................................................................................... 41
7. РЕШЕНИЕ ЗАДАЧИ ИССЛЕДОВАНИЯ МОДЕЛИРУЕМОЙ ПРЕДМЕТНОЙ ОБЛАСТИ ПУТЕМ ИССЛЕДОВАНИЯ ЕЕ
МОДЕЛИ ....................................................................................................................................................................................................... 45
7.1. АВТОМАТИЗИРОВАННЫЙ SWOT-АНАЛИЗ КЛАССОВ И ЗНАЧЕНИЙ И ЗНАЧЕНИЙ ФАКТОРОВ ................................................... 45
7.2. НЕЛОКАЛЬНЫЕ НЕЙРОНЫ .............................................................................................................................................................. 47
7.3. НЕЛОКАЛЬНАЯ НЕЙРОННАЯ СЕТЬ .................................................................................................................................................. 49
7.4. 2D-СЕМАНТИЧЕСКИЕ СЕТИ ЗНАЧЕНИЙ ФАКТОРОВ ...................................................................................................................... 49
7.5. КОГНИТИВНЫЕ ДИАГРАММЫ КЛАССОВ ........................................................................................................................................ 51
7.6. КОГНИТИВНЫЕ ДИАГРАММЫ ФАКТОРОВ ...................................................................................................................................... 51
7.7. ИНТЕГРАЛЬНЫЕ КОГНИТИВНЫЕ КАРТЫ ....................................................................................................................................... 52
7.8. КОГНИТИВНЫЕ ФУНКЦИИ .............................................................................................................................................................. 52
8. ИСПОЛЬЗОВАНИЕ РАЗРАБОТАННОЙ МЕТОДИКИ В АДАПТИВНОМ РЕЖИМЕ И ЕЕ ЛОКАЛИЗАЦИЯ ДЛЯ
РЕГИОНА ...................................................................................................................................................................................................... 55
9. ИССЛЕДОВАНИЕ ЦЕННОСТИ ФАКТОРОВ И ИХ ЗНАЧЕНИЙ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ОЦЕНКИ РИСКОВ
МОШЕННИЧЕСТВА В ОСАГО И ОПТИМИЗАЦИЯ СИСТЕМЫ ФАКТОРОВ ............................................................................... 55
10. ВЫВОДЫ ............................................................................................................................................................................................... 59
ЛИТЕРАТУРА: ............................................................................................................................................................................................. 61
1. Введение
1.1. Формулировка задачи с сайта Чемпионата России по искус-
ственному интеллекту RAIF-Challenge 2017: https://raif.jet.su/improject-
3
В России большими шагами развивается рынок розничного страхо-
вания, львиную долю которого занимает ОСАГО. Не секрет, что рента-
бельность этого вида страховой деятельности сегодня сокращается в том
числе из-за роста мошенничества. Для борьбы с ним службы безопасности
страховых компаний стараются выявлять и расследовать подозрительные
убытки на стадии урегулирования. При этом специалисты компаний тратят
немало времени на проверку проблемных случаев, которые не являются
3
мошенническими. Важным шагом на пути решения к решению этой задачи
является создание аналитической модели, которая позволит на основе
имеющихся данных о текущих страховых случаях определять вероятность
мошенничества. Данную задачу и предстоит решить участникам номина-
ции.
1.2. Кратко об автоматизированном системно-когнитивном ана-
лизе и системе «Эйдос»
1.2.1. Что же такое АСК-анализ?
Автоматизированный системно-когнитивный анализ (АСК-анализ)
это новый универсальный метод искусственного интеллекта, представля-
ющий собой единственный в настоящее время вариант автоматизирован-
ного системного анализа, а именно, системный анализ, структурированный
по базовым когнитивным операциям.
Известно, что системный анализ является одним из общепризнанных
в науке методов решения проблем и многими учеными рассматривается
вообще как методология научного познания. Однако как впервые заметил
еще в 1984 году проф. И. П. Стабин
1
практическое применение системного
анализа наталкивается на проблему, суть которой состоит в том, что мето-
дология системного анализа успешно применяется в сравнительно простых
случаях, в которых в принципе можно обойтись и без нее, тогда как в ре-
альных сложных ситуациях, она чрезвычайно востребован и у нее нет аль-
тернатив, сделать это удается очень редко. Проф. И. П. Стабин первым
предложил и путь решения этой проблемы, состоящий в автоматизации
системного анализа, он же ввел и термин: «Автоматизированный систем-
ный анализ» (АСА).
1.2.2. Работы каких ученых сыграли большую роль в создании
АСК-анализа?
Автора идеи АСА мы упомянули выше.
Теперь необходимо отметить отечественных классиков методологии
системного анализа проф. Ф. И. Перегудова и проф. Ф. П. Тарасенко, кото-
рые в своих фундаментальных работах
2
подробно рассмотрели математи-
ческие методы, которые могли бы быть успешно применены для автомати-
зации отдельных этапов системного анализа. Однако даже самые лучшие
математические методы не могут быть использованы на практике без эф-
фективно реализующих их программных средств, а путь от научного мето-
да, реализуемого с помощью математики к его эффективной программной
1
Стабин И.П., Моисеева B.C. Автоматизированный системный анализ.- М.: Машиностроение,
1984. 309 с.
2
Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ. М.: Высшая школа, 1989. - 320
с., Перегудов Ф. И., Тарасенко Ф. П.. Основы системного анализа. Томск Изд-во науч.-техн. лит.
1997. 389с.
4
системе долог и сложен. Обусловлено это тем обстоятельством, что ЦЭВМ
это дискретный автомат, работающий только в рамках дискретной мате-
матики. Для использования ЦЭВМ необходимо разработать численные ме-
тоды или методики их реализации на компьютере. А затем реализовать и
отладить компьютерную программу, основанную на этом численном мето-
де. В числе первых попыток реального использования автоматизирован-
ного системного анализа следует отметить монографию [4]
3
и докторскую
диссертацию проф. В. С. Симанкова (2002). В этих работах идея автомати-
зации системного анализа была основана на высокой детализации этапов
системного анализа и подборе уже существующих программных систем,
автоматизирующих эти этапы. Эта попытка была реализована проф. В. С.
Симанковым, однако лишь для специального случая исследования в обла-
сти возобновляемой энергетики, где использовались системы разных раз-
работчиков, созданные с помощью различного инструментария и не име-
ющие программных интерфейсов друг с другом, т. е. не образующие еди-
ной автоматизированной системы. Эта попытка, безусловно, была боль-
шим шагом по пути, предложенному проф. И. П. Стабиным, но ее нельзя
признать обеспечившей достижение поставленной им цели: создание рабо-
тающего автоматизированного системного анализа. Эта работа не привела
к созданию единой универсальной программной системы, автоматизиру-
ющий системный анализ, которую можно было бы успешно применять в
различных предметных областях.
1.2.3. Кем и когда создан АСК-анализ?
Автоматизированный системно-когнитивный анализ, как реально ра-
ботающий АСА, предложен и разработан проф. Е. В. Луценко в 2002 году
[5] и получил детальное и всестороннее развитие в десятках монографий и
сотнях научных статей [1-40]
4
.
Основная идея Е. В. Луценко, позволившая сделать это, состоит в
рассмотрении автоматизированного системного анализа как метода позна-
ния (отсюда и использование термина: «когнитивный» от «cognitio» зна-
ние, познание, лат. ).
Эта идея позволила структурировать автоматизированный систем-
ный анализ не по этапам, как это пытались сделать другие ученые, а по
конкретным базовым когнитивным операциям (БКОСА), т. е. таким опера-
циям, из комбинаций которых конструируются всевозможные операции
3
Симанков В.С., Луценко Е.В., Лаптев В.Н. Системный анализ в адаптивном управлении: Мо-
нография (научное издание). /Под науч. ред. В.С.Симанкова. Краснодар: ИСТЭК КубГТУ, 2001. 258с.
4
Ссылки на некоторые из них приведены здесь:
http://lc.kubagro.ru/aidos/_Aidos-X.htm
http://lc.kubagro.ru/aidos/Sprab0802.pdf
5
системного анализа. Таких базовых операций оказалось 10 и они образуют
когнитивный конфигуратор:
1) присвоение имен;
2) восприятие;
3) обобщение (синтез, индукция);
4) абстрагирование;
5) оценка адекватности модели;
6) сравнение, идентификация и прогнозирование;
7) дедукция, силлогизм и абдукция;
8) классификация и генерация конструктов;
9) содержательное сравнение;
10) планирование и принятие решений об управлении.
Каждая из этих операций достаточно элементарна для формализации
и программной реализации.
Рассмотрим чуть подробнее п. 7. Пример силлогизма (или дедуктив-
ного рассуждения «от общего к частному»):
Всякий человек смертен (большая посылка)
Сократ – человек (меньшая посылка)
------------
Сократ смертен (заключение)
Абдукция представляет вид вывода с той особенностью, что из по-
сылки, которая является условным высказыванием, и заключения вытекает
вторая посылка. Например, если рассмотреть тот же пример Сократом:
Всякий человек смертен (большая посылка)
Сократ смертен (заключение)
------------
Мы можем предположить, что меньшая посылка: «Сократ – человек
(меньшая посылка)».
Однако, кроме указания одного признака Сократа: что он смертен,
мы можем привести и другие его признаки, которые могут помочь иден-
тифицировать его как человека или препятствовать этому.
По сути, при абдукции мы по признакам объекта, его экстенсиональ-
ному описанию, относим его к обобщающим категориям: референтным
классам, т. е. восстанавливаем его интенсиональное описание, и делаем это
путем решения задачи определения степени релевантности объекта классу
или решения задачи классификации (идентификации, распознавания, про-
гнозирования, классификации, диагностики). При этом мы никогда не мо-
жем точно установить принадлежит ли объект классу, но можем лишь вы-
сказать гипотезу [31] об этом и оценить степень достоверности этой гипо-
тезы (ее релевантности). Поэтому абдукция имеет широкое применение в
системах искусственного интеллекта, в т. ч. в системе «Эйдос».
6
1.2.4. Что включает в себя АСК-анализ?
АСК-анализ Е. В. Луценко представляет собой единственный суще-
ствующий в настоящее время реально работающий вариант автоматизиро-
ванного системного анализа. Но, конечно, это совершенно не исключает
того, что в будущем, возможно, будут разработаны и другие его варианты.
Автоматизированный системно-когнитивный анализ включает: фор-
мализуемую когнитивную концепцию, математическую модель, методику
численных расчетов и реализующий их программный инструментарий, в
качестве которого в настоящее время выступает постоянно совершенству-
емая автором универсальная когнитивная аналитическая система "Эйдос".
Компоненты АСК-анализа:
формализуемая когнитивная концепция и следующий из нее когни-
тивный конфигуратор;
теоретические основы, методология, технология и методика АСК-
анализа;
обобщенная и частные математические модели АСК-анализа, осно-
ванная на системном обобщении теории информации;
методика численных расчетов, в универсальной форме реализую-
щая математическую модель АСК-анализа на компьютерах, включающая
иерархическую структуру данных и 24 детальных алгоритма 10 БКОСА;
специальное инструментальное программное обеспечение, реали-
зующее математическую модель и численный метод АСК-анализа Уни-
версальная когнитивная аналитическая система "Эйдос".
Этапы АСК-анализа:
1) когнитивно-целевая структуризация предметной области;
2) формализация предметной области (конструирование классифика-
ционных и описательных шкал и градаций и подготовка обучающей вы-
борки);
3) синтез системы обобщенных и частных моделей предметной обла-
сти настоящее время система «Эйдос» поддерживает 3 статистические
модели и 7 системно-когнитивных моделей);
4) оценка достоверности (верификация) системы моделей предмет-
ной области;
5) повышение достоверности системы моделей, в т. ч. адаптация и
пересинтез этих моделей;
6) решение задач идентификации, прогнозирования и поддержки
принятия решений;
7) исследование объекта моделирования (процесса, явления) путем
исследования его моделей: кластерно-конструктивный анализ классов и
факторов; содержательное сравнение классов факторов; изучение системы
детерминации состояний моделируемого объекта, нелокальные нейроны и
интерпретируемые нейронные сети прямого счета; построение классиче-
7
ских когнитивных моделей (когнитивных карт); построение интегральных
когнитивных моделей (интегральных когнитивных карт).
1.2.5. Какие ученые принимали и сейчас принимают участие в
развитии АСК-анализа?
Необходимо отметить, что в развитии различных теоретических ос-
нов и практических аспектов АСК-анализа приняли участие многие уче-
ные: д. э. н. , к. т. н. , проф. Луценко Е. В. , Засл. деятель науки РФ, д. т. н. ,
проф. Лойко В. И. , к. ф. -м. н. , Ph. D. , проф. , Трунев А. П. (Канада), д. э.
н. , д. т. н. , к. ф. -м. н. , проф. Орлов А. И. , к. т. н. , доц. Коржаков В. Е. , д.
э. н. , проф. Барановская Т. П. , д. э. н. , к. т. н. , проф. Ермоленко В. В. , к.
пс. н. Наприев И. Л. , к. пс. н. , доц. Некрасов С. Д. , к. т. н. , доц. Лаптев В.
Н. , к. пс. н, доц. Третьяк В. Г. , к. пс. н. , Щукин Т. Н. , д. т. н. , проф. Си-
манков В. С. , д. э. н. , проф. Ткачев А. Н. , д. т. н. , проф. Сафронова Т. И. ,
д. э. н. , доц. Горпинченко К. Н. , к. э. н. , доц. Макаревич О. А. , к. э. н. ,
доц. Макаревич Л. О. , к. м. н. Сергеева Е. В. (Лаптева Е. В. ), Бандык Д. К.
(Белоруссия), Чередниченко Н. А. , к. ф. -м. н. Артемов А. А. , д. э. н. ,
проф. Крохмаль В. В. , д. т. н. , проф. Рябцев В. Г. , к. т. н. , доц. Марченко
А. Ю. , д. т. н. , проф. Фролов В. Ю. , д. ю. н, проф. Швец С. В. , Засл. дея-
тель науки Кубани, д. б. н. , проф. Трошин Л. П. , Засл. изобр. РФ, д. т. н. ,
проф. Серга Г. В. , Сергеев А. С. , д. б. н. , проф. Стрельников В. В. и дру-
гие. 1.2.6. Каков индекс цитирования ученых, принимающих уча-
стие в развитии АСК-анализа?
Работы по АСК-анализу вызывают большой интерес у научной об-
щественности. Это подтверждается высокими индексами цитирования
этих ученых (например, проф. Е. В. Луценко занимает 1-ю позицию в Рос-
сии по индексу Хирша (36-35) среди ученых в области кибернетики, к ко-
торой относится искусственный интеллект,).
1.2.7. Докторские и кандидатские диссертации защищенные с
применением АСК-анализа в различных областях науки
Метод системно-когнитивного анализа и его программный инстру-
ментарий интеллектуальная система "Эйдос" были успешно применены
при проведении ряда кандидатских и докторских диссертационных работ в
ряде различных предметных областей по экономическим, техническим,
психологическим и медицинским наукам. С применением АСК-анализа
проведены исследования и защищены диссертации:
- доктора экономических наук – 4:
Е. В. Луценко: http://ej.kubagro.ru/a/viewaut.asp?id=11
А. Н. Ткачев: http://ej.kubagro.ru/a/viewaut.asp?id=20
В. В. Крохмаль: http://ej.kubagro.ru/a/viewaut.asp?id=22
К. Н. Горпинченко: http://ej.kubagro.ru/a/viewaut.asp?id=646
доктора технических наук – 2:
В. С. Симанков:http://www.yandex.ru/yandsearch?text=профессор Симанков Вла-
димир Сергеевич
Т. И. Сафронова: http://ej.kubagro.ru/a/viewaut.asp?id=111
8
кандидата психологических наук – 4:
С. Д. Некрасов: http://manag.kubsu.ru/index.php/ofup/kafedry/174-nekrasov
В. Г. Третьяк: http://law.edu.ru/person/person.asp?persID=1345265
Т. Н. Щукин: http://ej.kubagro.ru/a/viewaut.asp?id=94 http://2045. ru/expert/27.html
И. Л. Наприев: http://ej.kubagro.ru/a/viewaut.asp?id=573
- кандидат технических наук – 1:
Е. В. Луценко: http://ej.kubagro.ru/a/viewaut.asp?id=11
- кандидат экономических наук – 1:
Л. О. Макаревич: http://www.
mesi.ru/upload/iblock/b5a/Автореферат%20Макаревич%20ЛО.pdf
http://ej.kubagro.ru/a/viewaut.asp?id=1377
- кандидат медицинских наук – 1:
Сергеева Е. В. (Лаптева Е. В. ): http://ej.kubagro.ru/a/viewaut.asp?id=1034
На текущий момент времени в процессе выполнения, выхода на за-
щиту и утверждения в ВАК находится еще несколько диссертаций на со-
искание ученых степеней кандидатов и докторов наук.
1.2.8. Сколько грантов РФФИ и РГНФ выполнено и выполняет-
ся с применением АСК-анализа?
С применением АСК-анализа с использованием системы "Эйдос"
были выполнены (или находятся в процессе выполнения) следующие гран-
ты РФФИ и РГНФ (пронумерованы только одобренные проекты):
РФФИ:
Номер проекта
Название проекта
Начало -
окончание
02-01-00035-а
Разработка компьютерных методов изучения эмерджентных
свойств плодовых культур с дальнейшим использованием их для
оптимизации выращивания
2002 -2004
1
02-05-64234-а
Разработка теории многокритериальной оценки ландшафтных и
метеорологических характеристик юга России для увеличения
продуктивности плодовых культур на основе создания системы
банков данных и компьютерного моделирования.
2002 - 2003
2
03-04-96771-
р2003юг_а
Разработка новой методологии районирования сортов сельско-
хозяйственных культур на основе системного подхода при ана-
лизе и математическом прогнозе их жизнеобеспечения и про-
дуктивности
2003 - 2005
3
03-07-96801-
р2003юг_в
Создание системы мониторинга, прогнозирования, анализа и
поддержки управленческих решений по продуктивности плодо-
вых культур на основе электронных баз данных
2003- 2005
06-06-96644-
р_юг_а
Семантические информационные модели управления агропро-
мышленным комплексом
2006 - 2008
07-07-13510-
офи_ц
Инвестиционное управление АПК на основе методологии си-
стемно-когнитивного анализа
2007 - 2008
08-06-99005-
р_офи
Управление в АПК исходя из критерия качества жизни
2008 - 2009
09-06-13509-
офи_ц
Системно-когнитивные основы инвестиционного управления
региональным агропромышленным комплексом
2009 - 2010
4
11-06-96508-
Системно-когнитивные основы инвестиционного управления
2011 - 2012
9
р_юг_ц
региональным агропромышленным комплексом
13-07-96507
Принципы создания облачного сервиса по курсу математики с
визуализацией понятийного аппарата, процесса доказательств
теорем и выполнения практических заданий
2013 - 2014
5
15-06-02569
Когнитивные модели прогнозирования развития многоотрасле-
вой корпорации
2015 - 2017
6
16-06-00114
Разработка интеллектуальной технологии исследования влияния
экологических факторов на различные аспекты качества жизни
населения региона
2016 2018
15-29-02530
Управление генресурсами семейства Rosaceae и Juglandacea для
сохранения и использования биораpнообразия культурных рас-
тений на основе информационной системы, включая оцифровку
коллекций
2015 - 2017
15-29-02545
Ампелографическое и молекулярно-генетическое изучение про-
исхождения, структуры, динамики генетических ресурсов рода
Vitis (Tournef) L. , их систематизация и оцифровка для эффек-
тивного управления биоресурсами
2015 - 2017
РГНФ:
Номер проек-
та
Название проекта
Начало -
окончание
1
13-02-00440а
Методологические основы управления экономической устойчи-
востью перерабатывающего комплекса региона с применением
технологий искусственного интеллекта
2013 - 2015
16-02-00185а
Управление качеством жизни населения региона через объемы и
направленность инвестиций в АПК на примере Краснодарского
края
2018 2018
2
17-02-00064а
Системно-когнитивный анализ в управлении номенклатурой и
объемами закупки-реализации продукции в торговой агрофирме
2017 2019
1.2.9. Сколько монографий, патентов, публикаций, входящих в
Перечень ВАК есть по АСК-анализу?
По проблематике АСК-анализа издано 25 монографий [1-40] (еще
несколько в стадии подготовки к печати), получено 29 патентов на систе-
мы искусственного интеллекта, их подсистемы (еще один на рассмотре-
нии), режимы и приложения, издано 238 статей в изданиях, входящих в
Перечень ВАК РФ. В одном только Научном журнале КубГАУ (входит в
Перечень ВАК РФ с 26-го марта 2010 года) автором АСК-анализа и разра-
ботчиком системы «Эйдос» проф. Е. В. Луценко опубликовано: 210, об-
щим объёмом 378,434 у.п.л., в среднем 1,802 у.п.л. на одну статью
5
.
1.2.10. В каких областях и где уже применялись АСК-анализ и
система «Эйдос»?
Анализ приведенных выше грантов, диссертаций и публикаций поз-
воляет констатировать, что АСК-анализ успешно применяется в следую-
щих предметных областях и научных исследованиях:
5
http://ej.kubagro.ru/a/viewaut.asp?id=11
10
- региональная экономика;
- отраслевая экономика;
- экономика предприятий;
- технические науки интеллектуальные системы управления в воз-
обновляемой энергетике;
- технические науки – мелиорация и управление мелиоративными
системами;
- психология личности;
- психология экстремальных ситуаций;
- психология профессиональных и учебных достижений;
- медицинская диагностика;
- прогнозирование результатов применения агротехнологий;
- принятие решений по выбору рациональных агротехнологий;
- геофизика: прогнозирование землетрясений;
- геофизика: прогнозирование параметров магнитного поля Земли;
- геофизика: прогнозирование движения полюсов Земли.
На рисунке ниже представлены использование системы «Эйдос» в
различных странах мира, причем в основном, к сожалению, не в России
(рисунок 1):
11
Рисунок 1. Карта и база данных системы «Эйдос» с информацией о запус-
ках системы «Эйдос » в мире с 09.12.2016 по 06.10.2017
Вместо пояснения по рисунку приведем ниже экранную форму по-
мощи по режиму, обеспечивающему отображение на карте мира и в базе
данных информации о запусках системы «Эйдос» (рисунок 2):
Рисунок 2. Экранная форма Help по режиму 6. 9 системы «Эйдос»:
Исследования по некоторым из перечисленных направлений мы по-
стараемся отразить в данной работе.
Две монографии проф. Е. В. Луценко размещены в библиотеке кон-
гресса США [3, 16]:
Симанков В. С. , Луценко Е. В. Адаптивное управление сложными
системами на основе теории распознавания образов. Монография (научное
издание). Краснодар: ТУ КубГТУ, 1999. - 318с.
http://elibrary.ru/item.asp?id=18828433.
12
Трунев А. П. , Луценко Е. В. Автоматизированный системно-
когнитивный анализ влияния факторов космической среды на ноосферу,
магнитосферу и литосферу Земли: Под науч. ред. д. т. н. , проф. В. И. Лой-
ко. Монография (научное издание). Краснодар, КубГАУ. 2012. 480 с.
ISBN 978-5-94672-519-4. http://elibrary.ru/item.asp?id=21683737.
1.2.11. В каких областях может применяться АСК-анализ?
По мнению авторов АСК-анализ, как метод искусственного интел-
лекта, может успешно применяться во всех областях, в которых для реше-
ния своих профессиональных задач специалист использует свой есте-
ственный интеллект, при этом АСК-анализ выступает в качестве инстру-
мента, многократно увеличивающего возможности естественного интел-
лекта.
АСК-анализ может применяться во всех предметных областях, где
ученый или практики решает свои профессиональные задачи и проблемы,
постоянно развивает свои знания, используя новейшие достижения в сфере
искусственного интеллекта.
Главный вывод: автоматизированный системно-когнитивный анали-
зу присущи все основные признаки нового перспективного междисципли-
нарного научного направления в рамках автоматизированного системного
анализа.
1.2.12. Internet-ссылки по АСК-анализу
Интернет-ссылки по АСК-анализу лучше всего представлены на сай-
те проф. Е. В. Луценко: http://lc.kubagro.ru/. Данный сайт посетило уже более
500000 посетителей с уникальными IP-адресами.
Страничка проф. Е. В. Луценко имеется на сайте Научного журнала
КубГАУ: http://ej.kubagro.ru/a/viewaut.asp?id=11. В расчете на фамилию автора
приходится более 295000 прочтений статей.
1.2.13. О плагиаторах, использующих работы по АСК-анализу,
находящиеся в Internet в открытом доступе
Все авторы научных работ по АСК-анализу всегда размещали и раз-
мещают их в свободном открытом бесплатном доступе, чем не преминули
воспользоваться плагиаторы. Лучше всего их деятельность описана в ста-
тье «Групповой плагиат: от студента до министра»
6
. Чтобы найти много-
численные «труды» плагиаторов, включая диссертации, достаточно в лю-
бой поисковой системе Internet сделать запрос, например: «Коэффициенты
эмерджентности Хартли, Харкевича, Шеннона», которые автор системной
теории информации (СТИ) проф. Е. В. Луценко назвал так в честь этих вы-
дающихся ученых в области теории информации. При этом автор следовал
сложившейся научной традиции называть единицы измерения и математи-
6
Вяткин В.Б. Групповой плагиат: от студента до министра. - Троицкий вариант Наука -
http://trv-science.ru - [Электронный ресурс]. Адрес доступа: http://trv-science.ru/2011/11/08/gruppovojj-
plagiat-ot-studenta-do-ministra/ или: http://trv-science.ru/2011/11/08/gruppovojj-plagiat-ot-studenta-do-
ministra/print/
13
ческие выражения в честь выдающихся ученых (Ом, Джоуль, Ватт, Нью-
тон, Тесла и т.д). Причем часто плагиаторы даже не понимают, что сами
основоположники и классики теории информации не предлагали этих ко-
эффициентов, а предложены они были в работах проф. Е. В. Луценко [5]
7
.
Наверное, поэтому они и не считают нужным делать ссылки и пишут,
например:
1. «По Харкевичу коэффициент эмерджентности определяет степень
детерменированности ситемы…» (подчеркнуто нами, авт. , в цитате сохра-
нены орфографические ошибки плагиатора).
2. «Отсюда строится системная численная мера количества инфор-
мации в ИС на основе оценки эмерджентности системы (по Хартли и
Харкевичу)» (выделено плагиатором).
Эти фразы легко найти в Internet. Здесь автор не считает нужным
уделять вопросу о плагиате большего внимания. Отметим лишь, что эта
плагиаторская деятельность не просто продолжается, а даже набирает обо-
роты.
Перейдем теперь к описанию применения АСК-анализа и его про-
граммного инструментария интеллектуальной системы «Эйдос», для ре-
шения поставленной задачи.
При этом мы будем следовать этапам АСК-анализа и порядку преоб-
разования данных в информацию, а ее в знания, принятым в АСК-анализе,
приведенным ниже:
Процесс преобразования данных в информацию, а ее в знания назы-
вается анализ. Основные его этапы приведены на рисунке 3:
7
См., также: Луценко Е.В. Подборка публикаций по вопросам системного обобщения
математики, теории множеств и теории информации: http://www.twirpx.com/file/780491/
14
ДАННЫЕ
(ИНФОРМАЦИЯ, ЗАПИСАННАЯ
НА КАКОМ-ЛИБО ЯЗЫКЕ ИЛИ В СИСТЕМЕ КОДИРОВАНИЯ
НА НОСИТЕЛЕ ИЛИ НАХОДЯЩАЯСЯ В КАНАЛЕ СВЯЗИ
И РАССМАТРИВАЕМАЯ БЕЗОТНОСИТЕЛЬНО
К ЕЕ СМЫСЛОВОМУ СОДЕРЖАНИЮ)
ИНФОРМАЦИЯ
(ОСМЫСЛЕННЫЕ ДАННЫЕ, Т.Е. СОГЛАСНО КОНЦЕПЦИИ
СМЫСЛА ШЕНКА-АБЕЛЬСОНА ДАННЫЕ, В КОТОРЫХ
ВЫЯВЛЕНЫ ПРИЧИННО-СЛЕДСТВЕННЫЕ ЗАВИСИМОСТИ)
ЗНАНИЯ
(ИНФОРМАЦИЯ, ПОЛЕЗНАЯ
ДЛЯ ДОСТИЖЕНИЯ ЦЕЛЕЙ,
Т.Е. УПРАВЛЕНИЯ)
Постановка целей,
оценка знака и степени
влияния информации
на их достижение
Анализ данных -
выявление в них
событий и причинно-
следственных связей
между событиями
О соотношении содержания понятий: «Данные», «Информация» и «Знания»
Рисунок 3. Преобразование данных в информацию, а ее знания
В системе «Эйдос» этот процесс осуществляется в следующей по-
следовательности (рисунок 4).
Основные публикации автора по вопросам выявления, представле-
ния и использования знаний [1-40].
Из вышеизложенного можно сделать обоснованный вывод о том, что
АСК-анализ и система «Эйдос» обеспечивают движение познания от эм-
пирических данных к информации, а от нее к знаниям. По сути, это дви-
жение от феноменологических моделей, описывающих явления внешне, к
содержательным теоретическим моделям [31].
Появляется все больше сайтов, посвященных искусственному интел-
лекту, в открытом доступе появляются базы данных для машинного обу-
чения (UCI
8
, Kaggle
9
и другие) и даже on-line интеллектуальные
Однако учащиеся и ученые до сих пор практически не замечают, что
уже давно существует и действует открытая масштабируемая интерактив-
ная интеллектуальная on-line среда для обучения и научных исследований
в области искусственного интеллекта, основанная на автоматизированном
системно-когнитивном анализе (АСК-анализ) и его программном инстру-
ментарии – интеллектуальной системе «Эйдос», а также сайте автора.
8
http://archive.ics.uci.edu/ml/datasets.html
9
https://www.kaggle.com/datasets
15
Последовательность обработки данных, информации и знаний в системе «Эйдос-Х++»
Когнитивно-целевая структуризация предметной области
(неавтоматизированный в системе «Эйдос-Х++» этап АСК-анализа)
Формализация предметной области
Class_Sc, Gr_ClSc
Классификационные
шкалы и градации Opis_Sc, Gr_OpSc
Описательные
шкалы и градации
Inp_data, Inp_data.xls
Исходные данные
Обучающая выборка,
эвентологическая
база данных Obi_zag
Заголовки объектов
обучающей выборки
Obi_Kcl
Коды классов объектов
обучающей выборки Obi_Krg
Коды признаков объектов
обучающей выборки
Средства кодирования
исходных данных
Синтез и верификация моделей
Статистические
модели
Системно-когнитивные
модели (модели знаний)
(многопараметрическая
типизация)
Abs
Матрица абсолютных частот
(матрица сопряженности,
корреляционная матрица)
Prc2
Матрица условных
и безусловных процентных
распределений, расчитанная
по числу объектов классов
Prc1
Матрица условных
и безусловных процентных
распределений, расчитанная
по числу признаков классов
INF3
разности между
фактическими и
теоретически
ожидаемыми
частотами
INF2
Количество
знаний по
А.Харкевичу
INF5
ROI-return on
investment
INF6
Разность
условной и
безусловной
вероятностей
INF1
Количество
знаний по
А.Харкевичу
INF4
ROI-return on
investment
INF6
Разность
условной и
безусловной
вероятностей
Выбор
наиболее достоверной
модели
Решение задач распознавания
системной идентификации
и прогнозирования
Решение
задач Решение задач управления
(поддержки принятия решений)
Решение задач исследования
предметной области путем
исследования ее модели
Рисунок 4. Преобразование данных в информацию, а ее знания
в системе «Эйдос»
2. Когнитивно-целевая структуризация предметной обла-
сти На этом этапе АСК-анализа разработчик интеллектуального прило-
жения решает, что оно должно прогнозировать и на основе чего, т.е. что
является классами, а что факторами, под влиянием которых объект моде-
лирования оказывается в состояниях, соответствующих классам.
Это единственный не автоматизированный этап АСК-анализа. Все
остальные его этапы автоматизированы в его программном инструмента-
рии – интеллектуальной системе «Эйдос».
Очевидно, в нашем случае классами является риск мошенничества в
ОСАГО, а факторами – различные характеристики страхующегося и его
автомобиля. Эта информация приведена в таблице
16
Attributes_AlfaInsurance_170918.xlsx (таблица 1), которая скачивается с
сайта чемпионата: https://raif.jet.su/improject-3 по ссылке:
https://jdisk.jet.su/index.php/s/UIkHXnH4GY6OX4f/authenticate.
Таблица 1 Имена, типы данных и смысловые значения полей
файла исходных данных
bad
бинарный (0,1)
0
целевое событие (мошенничество по убытку)
claim_id
текстовый
0305/133/00001/17
номер убытка
Claim_type
числовой
0
Тип обращения по убытку
Damage_count
числовой
2
количество выплат по убытку
Event_type
текстовый
Классика
тип страхового события
FLAG_bad_region
бинарный (0,1)
0
флаг токисчного региона регистрации собственника ТС
FLAG_dsago
бинарный (0,1)
0
флаг наличия полиса ДСАГО у страхователя
FLAG_Insurer_bl
бинарный (0,1)
0
флаг наличия страхователя в черном списке на дату
заявления убытка
FLAG_Owner_bl
бинарный (0,1)
0
флаг наличие собственника ТС в черном списке на дату
заявления убытка
FLAG_Policy_KO
бинарный (0,1)
1
флаг неограниченного списка допущенных к управлению
ТС
FLAG_Policy_KP
бинарный (0,1)
1
флаг срока страхования по полису 10 месяцев и более
FLAG_Policy_KPR
бинарный (0,1)
0
флаг страхования с прицепом
FLAG_Policy_type
бинарный (0,1)
0
флаг полиса, в который вносились изменения
FLAG_prolong
бинарный (0,1)
0
флаг пролонгированного полиса
FLAG_trial
бинарный (0,1)
0
флаг обращения в суд по убытку
Insurer_type
текстовой
Физическое Лицо
тип страхователя
Owner_region
текстовый
Московская область
регион регистрации собственника ТС
Owner_type
текстовый
Физическое Лицо
тип собственника ТС
Period_EvCl
числовой
19
период в днях от даты страхового события до даты за-
явления
Period_StEv
числовой
31
период в днях от даты начала договора до даты события
Policy_agent_cat
числовой
0,051589363
числовая характеристика агента, продавшего полис
Policy_KBM
числовой
1
коэффициент по полису за бонус-малус (историю стра-
хования)
Policy_KS
числовой
1
коэффициент по полису за период использования ТС
Policy_KT
числовой
1,7
коэффициент по полису в зависимости от территории
преимущественного использования
Policy_KVS
числовой
1
коэффициент по полису за возраст и стаж допущенных к
управлению
Policy_loss_count
числовой
0
количество убытков, заявленных по полису на момент
заявления текущего убытка
Sales_channel
текстовый
Агенты и РБ
канал продаж полиса
VEH_age
числовой
16
возраст застрахованного ТС
VEH_aim_use
текстовый
Личные
цель использования застрахованного ТС
VEH_capacity_type
числовой
5
тип по мощности застрахованного ТС (с 1 до 6 только
для легковых ТС, 7 - для всех остальных)
VEH_model
текстовый
CHRYSLER VOYAGER
модель застрахованного ТС
VEH_type_name
текстовый
Легковой
тип застрахованного ТС
Разработчики данного задания для чемпионата отметили желтым
фоном целевое событие: мошенничество по убытку, которое необходимо
оценить, а остальные поля содержат данные для решения этой задачи.
3. Формализация предметной области
На этапе формализации предметной области разрабатываются клас-
сификационные и описательные шкалы и градации, которые затем исполь-
зуются для кодирования исходных данных, в результате чего формируется
17
обучающая выборка, т.е. по сути производится нормализация исходных
данных. Необходимо отметить, что нормализация исходных данных осу-
ществляется в форме, удобной для дальнейшей обработки данных в систе-
ме «Эйдос».
3.1. Исходные данные и их исправление
Исходные данные для решения поставленной задачи скачиваются с
сайта чемпионата: https://raif.jet.su/improject-3 по ссылке:
https://jdisk.jet.su/index.php/s/UIkHXnH4GY6OX4f/authenticate в виде файла:
Data_AlfaInsurance_170918.csv. Фрагмент исходных данных приведен на
рисунке 5:
Рисунок 5. Фрагмент исходных данных без каких-либо корректировок
3.2. Универсальный программный интерфейс (API) системы
«Эйдос» для ввода данных из внешних источников данных типа таб-
лиц MS Excel
В системе «Эйдос» есть универсальный программный интерфейс
(API) для ввода данных из внешних источников данных типа таблиц MS
Excel. Экранные формы этого интерфейса приведены ниже на рисунке 6:
18
Рисунок 6. Экранная форма программного интерфейса (API)
системы «Эйдос» для ввода данных из внешних таблиц MS Excel
Вместо описания данного API приведем ниже его HELP (рисунок 7):
19
Рисунок 7. Экранная форма HELP программного интерфейса (API)
системы «Эйдос» для ввода данных из внешних таблиц MS Excel
Данный программный интерфейс имеет развитие средства анализа
корректности исходных данных. В результате его применения непосред-
ственно на исходных данных, не подвергавшихся каким-либо изменениям
(единственное, колонка: «Bad» была сделана 2-й) было выявлено, что в не-
которых колонках числового типа были также данные текстового типа
(пробелы). В этом случае вся колонка рассматривается как текстовая. По-
этому вместо текстовых данных были поставлены нули.
Кроме того в колонках логического типа (бинарных) 0 были замене-
ны на «нет», а 1 на «да» и для всех колонок был выполнен автоподбор ши-
рины. В результате файл исходных данных принял вид, приведенный на
рисунке 8:
20
Рисунок 8. Фрагмент исходных данных после корректировок
Данный программный интерфейс запускается с параметрами, приве-
денными на экранной форме на рисунке 6.
После этого программный интерфейс конвертирует Excel-таблицу в
dbf-файл, находит в нем классификационные и описательные шкалы и гра-
дации, и, если среди них есть числовые по типу данных, то запрашивает
число интервальных числовых значений, на которое разбивать диапазон
изменения значений числовой шкалы (рисунок 9):
Рисунок 9. Внутренний калькулятор API системы «Эйдос»
В численных экспериментах мы задавали различное число и способы
разбиения числовых шкал:
21
но в результате остановились на варианте их разбиения на три интерваль-
ных числовых значения с примерно равным числом наблюдений: 2840 на
адаптивный интервал.
При выходе на формирование моделей API автоматически дал ре-
зультаты, приведенные на рисунке 10 и ниже в последующих разделах.
Рисунок 10. Описательные шкалы и градации (фрагмент)
3.3. Классификационные шкалы и градации
В для создания моделей используется одна классификационная шка-
ла: «Bad» у которой есть две градации: «да» и «нет» (рисунок 11):
Рисунок 11. Классификационная шкала и ее градации (классы)
22
3.4. Описательные шкалы и градации
В для создания моделей используется 30 описательных шкал с сум-
марным числом градаций 978 (рисунок 12):
Рисунок 12. Описательные шкалы и градации (фрагмент)
3.5. Обучающая выборка
Исходные данные, закодированные (рисунок 8) с помощью класси-
фикационных и описательных шкал и градаций (рисунки 9 - 12), представ-
лена на рисунке 13:
Рисунок 13. Обучающая выборка (фрагмент)
Всего в обучающей выборке представлено 8519 наблюдений. По су-
ти обучающая выборка (рисунок 13) представляет собой базу исходных
данных (рисунок 8), нормализованную с помощью классификационных и
описательных шкал и градаций (рисунки 9 - 12).
23
Формализация исходных данных создает все необходимые и доста-
точные предпосылки для синтеза и верификации статистических и систем-
но-когнитивных моделей.
4. Синтез и верификация системно-когнитивных моделей
4.1. Синтез и верификация моделей
Синтез и верификация статистических и системно-когнитивных мо-
делей осуществляется в режиме 3.5 системы «Эйдос» (рисунок 14):
Рисунок 14. Экранные формы режима синтеза и верификации
статистических и системно-когнитивных моделей системы «Эйдос»
Синтез и верификация всех 10 моделей занял 53 минуты 36 секунд.
В результате выполнения данного режима создается три статистиче-
ских и 7 системно-когнитивных моделей, фрагменты некоторых из кото-
рых приведены на рисунках 15-17. Полностью модели не приводятся из-за
их большой размерности: это таблица из 7 колонок и 983 строк.
24
Рисунок 15. Модель ABS (фрагмент)
Рисунок 16. Модель PRC2 (фрагмент)
25
Рисунок 17. Модель INF1 (фрагмент)
Рисунок 18. Модель INF3 (фрагмент)
26
Модель ABS представляет собой матрицу абсолютных частот фактов
наблюдения определенного значения описательной шкалы при определен-
ном значении классификационной шкалы.
4.2. Частные критерии знаний, используемые в настоящее время
в АСК-анализе и системе «Эйдос»
Приведенные выше и другие статистические и системно-
когнитивные модели рассчитываются на основе матрицы абсолютных ча-
стот с применением различных частных критериев знаний, описанных ни-
же в таблице 2:
Таблица 2 – Частные критерии знаний, используемые
в настоящее время в АСК-анализе и системе «Эйдос»
Наименование модели знаний
и частный критерий
Выражение для частного критерия
через
относительные частоты
через
абсолютные частоты
INF1, частный критерий: количество знаний по
А.Харкевичу, 1-й вариант расчета относительных ча-
стот: Nj суммарное количество признаков по j-му
классу. Относительная частота того, что если у объек-
та j-го класса обнаружен признак, то это i-й признак
i
ij
ij P
P
LogI 2
ji
ij
ij NN
NN
LogI 2
INF2, частный критерий: количество знаний по
А.Харкевичу, 2-й вариант расчета относительных ча-
стот: Nj суммарное количество объектов по j-му
классу. Относительная частота того, что если предъ-
явлен объект j-го класса, то у него будет обнаружен i-й
признак.
i
ij
ij P
P
LogI 2
ji
ij
ij NN
NN
LogI 2
INF3, частный критерий: Хи-квадрат: разности между
фактическими и теоретически ожидаемыми абсолют-
ными частотами
---
N
NN
NI ji
ijij
INF4, частный критерий: ROI - Return On Investment, 1-
й вариант расчета относительных частот: Nj суммар-
ное количество признаков по j-му классу10
i
iij
i
ij
ij P
PP
P
P
I
1
1
ji
ij
ij NN
NN
I
INF5, частный критерий: ROI - Return On Investment, 2-
й вариант расчета относительных частот: Nj суммар-
ное количество объектов по j-му классу
i
iij
i
ij
ij P
PP
P
P
I
1
1
ji
ij
ij NN
NN
I
INF6, частный критерий: разность условной и без-
условной относительных частот, 1-й вариант расчета
относительных частот: Nj суммарное количество
признаков по j-му классу
iijij PPI
N
N
N
N
Ii
j
ij
ij
INF7, частный критерий: разность условной и без-
условной относительных частот, 2-й вариант расчета
относительных частот: Nj суммарное количество
объектов по j-му классу
iijij PPI
N
N
N
N
Ii
j
ij
ij
10
Применение предложено Л.О. Макаревич
27
Обозначения:
i значение прошлого параметра;
j - значение будущего параметра;
Nij количество встреч j-го значения будущего параметра при i-м значении
прошлого параметра;
M суммарное число значений всех прошлых параметров;
W - суммарное число значений всех будущих параметров.
Ni количество встреч i-м значения прошлого параметра по всей выборке;
Nj количество встреч j-го значения будущего параметра по всей выборке;
N количество встреч j-го значения будущего параметра при i-м значении
прошлого параметра по всей выборке.
Iij частный критерий знаний: количество знаний в факте наблюдения i-го
значения прошлого параметра о том, что объект перейдет в состояние, соответ-
ствующее j-му значению будущего параметра;
Ψ нормировочный коэффициент (Е.В.Луценко, 2002), преобразующий количе-
ство информации в формуле А.Харкевича в биты и обеспечивающий для нее соблюде-
ние принципа соответствия с формулой Р.Хартли;
Pi безусловная относительная частота встречи i-го значения прошлого пара-
метра в обучающей выборке;
Pij условная относительная частота встречи i-го значения прошлого пара-
метра при j-м значении будущего параметра .
Все эти способы метризации с применением 7 частных критериев
знаний реализованы в системно-когнитивном анализе и интеллектуальной
системе «Эйдос» и обеспечивают сопоставление градациям шкал числовых
значений, имеющих смысл количества информации в градации о принад-
лежности объекта к классу. Это делается совершенно одинаково для гра-
даций всех шкал, независимо от их типа (номинальные, порядковые и чис-
ловые) и независимо от единиц измерения, используемых в этих шкалах.
4.3. Оценка достоверности моделей по F-критерию Ван Ризберге-
на и по L-критериям
Для оценки достоверности статистических и системно-когнитвиных
моделей в системе «Эйдос» используются классическая F-мера (критерий)
Ван Ризбергена и его инвариантное относительно объема исследуемой вы-
борки нечеткое мультиклассовое обобщение L-мера, предложенная проф.
Е.В.Луценко [32].
Поскольку разработчиками задачи была предоставлена лишь одна
выборка, то она была использована и как обучающая для синтеза модели, и
как тестовая для ее верификации.
В системе «Эйдос» есть 7 выходных форм с оценкой достоверности
распознавания:
28
Классическая F-мера Ван Ризбергена дает для наиболее достоверной
из полученных моделей INF5 и INF7 при интегральном критерии «Резо-
нанс знаний»
11
неплохой результат: 0,765 (рисунок 19-А).
L1-мера для этих моделей дает еще лучший результат: 0,840 (рису-
нок 19-Б), а L2-мера еще лучший: 0,914 (но для другой модели: ABS) и-
сунок 19-В).
Если же оценивать эффективность использования модели по крите-
рию сравнения достоверности полученных в ней результатов истинной и
ложной идентификации и не идентификации со случайным угадыванием,
то наиболее эффективной моделью является INF5 (рисунок 19-Г). Эта мо-
дель обеспечивает в среднем в 5,29 раз более высокую вероятность пра-
вильной классификации страховых случаев на связанные и не связанные с
мошенничеством по сравнению со случайным угадыванием.
Подробная информация по оценке достоверности моделей в разрезе
по классам приведена в таблице 3.
11
Будет описан ниже
29
А)
Б)
В)
30
Г)
Рисунок 19. Оценка достоверности моделей по F-критерию Ван Ризбергена
и L-критериям Е.В.Луценко и путем сравнения достоверности
распознавания в модели со случайным угадыванием
Вместо объяснения сути L-критериев проф.Е.В.Луценко приведем
HELP данного режима (рисунок 20) и сошлемся на статью [32], в которой
они подробно описаны:
Рисунок 20. Описание сути F-критерия Ван Ризбергена
и L-критериев проф.Е.В.Луценко [32]
На рисунке 21 приведены частотные распределения уровней сход-
ства-различия при истинно и ложно положительных и отрицательных ре-
шениях и их разности для модели INF6.
31
А)
Б)
Рисунок 21.Частотные распределения уровней сходства-различия
истинно и ложно положительных и отрицательных решений и их разности
в модели INF6, наиболее достоверной при F-критерию Ван Ризбергена
32
На рисунке 22 приведено частотное распределение разности истин-
ных и ложных решений, как положительных (справа), так и отрицательных
(слева) в процентах от общего количества всех решений в модели INF6.
Рисунок 22. Частотное распределение разности истинных и ложных
решений, как положительных (справа), так и отрицательных (слева)
в процентах от общего количества всех решений в модели INF6
Из рисунка 21а видно, что частотные распределения уровней сход-
ства истинных и ложных, положительных и отрицательных решений по-
хожи на сдвинутые относительно друг друга немного деформированные
нормальные распределения. Величина этого сдвига довольно велика и по-
казывает, что случаи истинных и ложных , положительных и отрицатель-
ных решений легко разделимы за счет того, что:
для ложных решений характерны низкие уровни сходства-
различия: чем модуль сходства-различия ближе к нулю, тем чаще встреча-
ются такие случаи;
для истинных решений характерны высокие уровни сходства-
различия: чаще всего модуль сходства-различия находится в диапазоне
30% 60% (это видно из рисунка 2);
практически при всех значениях уровней сходства-различия доля
истинных решений значительно выше, чем частота ложных решений, при-
чем доля истинных решений, как положительных, так и отрицательных,
возрастает при возрастании модуля сходства-различия (рисунок 22).
33
Рассмотрим формы, аналогичные приведенным на рисунках 21 и 22
для модели INF5, наиболее эффективной по сравнению со случайным уга-
дыванием.
На рисунке 23 приведены частотные распределения уровней сход-
ства-различия при истинно и ложно положительных и отрицательных ре-
шениях для модели INF5.
На рисунке 24 приведена разность частотных распределений истин-
ных и ложных решений, слева отрицательных, а справа положительных
для модели INF5.
Рисунок 23.Частотные распределения уровней сходства-различия
истинно и ложно положительных и отрицательных решений в модели
INF5, наиболее эффективной по сравнению со случайным угадыванием
Из рисунков 23 и 24 видно, что:
для основной массы истинно-отрицательных решений характерны
уровни различия от 10% до 25%;
для истинно-положительных решений характерны уровни сходства
от 1% до 4%.
Это означает, что если в выходных формах по результатам распо-
знавания учитывать только результаты с указанными диапазонами
сходства и различия, то в основном результаты будут правильными.
Этот вывод мы используем при интерпретации этих выходных форм.
34
Рисунок 24. Разность частотных распределений истинных и ложных
решений: слева отрицательных, а справа положительных в модели
INF5, наиболее эффективной по сравнению со случайным угадыванием
Рассмотрим таблицу 3 (“VerModCls.dbf”). В этой таблице приведены
подробные данные в разрезе по классам по оценке достоверности моделей
по F-критерию Ван Ризбергена, L-критериям Е.В.Луценко и по критерию
сравнения достоверности распознавания в модели со случайным угадыва-
нием. Из этой таблицы мы видим, что в обучающей выборке 747 примеров
страховых случаев с мошенничеством и 7772 случая без него, всего 8519
примеров. Следовательно вероятность случайного угадывания составляет:
мошенничества 747/8519*100=8,7%.
отсутствия мошенничества: 7772/8519*100=91,3%.
Средневзвешенная вероятность случайного угадывания мошенниче-
ства или его отсутствия: (747*8,7+7772*91,3)/(747+7772) = 84,05%.
Достоверность распознавания мошенничества в модели INF5 состав-
ляет 87,7%, что в 10 раз выше вероятности случайного угадывания.
35
Таблица 3 – Оценка достоверности моделей по F-критерию Ван Ризбергена, L-критериям Е.В.Луценко
и путем сравнения достоверности распознавания в модели со случайным угадыванием (“VerModCls.dbf”)
MODINTKRIT
KOD_CLS
NAME_CLS
N_LOGOBJ
N_T_IDENT
N_F_NIDENT
N_F_IDENT
N_T_NIDENT
DVMOD
PRECISION
RECALL
F_MERA
P_T_IDENT
P_T_NIDENT
P_F_IDENT
P_F_NIDENT
P_SLUG_ID
P_SLUG_NID
EFFMOD_ID
EFFMOD_NID
AVR_EFFMOD
S_T_IDENT
S_F_NIDENT
S_F_IDENT
S_T_NIDENT
SPRECISION
SRECALL
L1_MERA
A_T_IDENT
A_F_NIDENT
A_F_IDENT
A_T_NIDENT
APRECISION
ARECALL
L2_MERA
01_Abs_k
1,0
BAD-1/2-да
747,0
747,0
0,0
7772,0
0,0
0,1
0,1
1,0
0,2
100,0
0,0
100,0
0,0
8,8
91,2
11,4
0,0
5,7
672,7
0,0
6996,0
0,0
0,1
1,0
0,2
0,9
0,0
0,9
0,0
0,5
1,0
0,7
01_Abs_k
2,0
BAD-2/2-нет
7772,0
7772,0
0,0
747,0
0,0
0,9
0,9
1,0
1,0
100,0
0,0
100,0
0,0
91,2
8,8
1,1
0,0
0,5
7050,8
0,0
667,4
0,0
0,9
1,0
1,0
0,9
0,0
0,9
0,0
0,5
1,0
0,7
02_Abs_i
1,0
BAD-1/2-да
747,0
747,0
0,0
7772,0
0,0
0,1
0,1
1,0
0,2
100,0
0,0
100,0
0,0
8,8
91,2
11,4
0,0
5,7
64,5
0,0
670,9
0,0
0,1
1,0
0,2
0,1
0,0
0,1
0,0
0,5
1,0
0,7
02_Abs_i
2,0
BAD-2/2-нет
7772,0
7772,0
0,0
747,0
0,0
0,9
0,9
1,0
1,0
100,0
0,0
100,0
0,0
91,2
8,8
1,1
0,0
0,5
7081,9
0,0
670,9
0,0
0,9
1,0
1,0
0,9
0,0
0,9
0,0
0,5
1,0
0,7
03_Prc1_k
1,0
BAD-1/2-да
747,0
747,0
0,0
7772,0
0,0
0,1
0,1
1,0
0,2
100,0
0,0
100,0
0,0
8,8
91,2
11,4
0,0
5,7
672,7
0,0
6996,0
0,0
0,1
1,0
0,2
0,9
0,0
0,9
0,0
0,5
1,0
0,7
03_Prc1_k
2,0
BAD-2/2-нет
7772,0
7772,0
0,0
747,0
0,0
0,9
0,9
1,0
1,0
100,0
0,0
100,0
0,0
91,2
8,8
1,1
0,0
0,5
7050,8
0,0
667,4
0,0
0,9
1,0
1,0
0,9
0,0
0,9
0,0
0,5
1,0
0,7
04_Prc1_i
1,0
BAD-1/2-да
747,0
747,0
0,0
7772,0
0,0
0,1
0,1
1,0
0,2
100,0
0,0
100,0
0,0
8,8
91,2
11,4
0,0
5,7
671,1
0,0
6980,0
0,0
0,1
1,0
0,2
0,9
0,0
0,9
0,0
0,5
1,0
0,7
04_Prc1_i
2,0
BAD-2/2-нет
7772,0
7772,0
0,0
747,0
0,0
0,9
0,9
1,0
1,0
100,0
0,0
100,0
0,0
91,2
8,8
1,1
0,0
0,5
7081,9
0,0
670,9
0,0
0,9
1,0
1,0
0,9
0,0
0,9
0,0
0,5
1,0
0,7
05_Prc2_k
1,0
BAD-1/2-да
747,0
747,0
0,0
7772,0
0,0
0,1
0,1
1,0
0,2
100,0
0,0
100,0
0,0
8,8
91,2
11,4
0,0
5,7
672,7
0,0
6996,0
0,0
0,1
1,0
0,2
0,9
0,0
0,9
0,0
0,5
1,0
0,7
05_Prc2_k
2,0
BAD-2/2-нет
7772,0
7772,0
0,0
747,0
0,0
0,9
0,9
1,0
1,0
100,0
0,0
100,0
0,0
91,2
8,8
1,1
0,0
0,5
7050,8
0,0
667,4
0,0
0,9
1,0
1,0
0,9
0,0
0,9
0,0
0,5
1,0
0,7
06_Prc2_i
1,0
BAD-1/2-да
747,0
747,0
0,0
7772,0
0,0
0,1
0,1
1,0
0,2
100,0
0,0
100,0
0,0
8,8
91,2
11,4
0,0
5,7
671,1
0,0
6980,0
0,0
0,1
1,0
0,2
0,9
0,0
0,9
0,0
0,5
1,0
0,7
06_Prc2_i
2,0
BAD-2/2-нет
7772,0
7772,0
0,0
747,0
0,0
0,9
0,9
1,0
1,0
100,0
0,0
100,0
0,0
91,2
8,8
1,1
0,0
0,5
7081,9
0,0
670,9
0,0
0,9
1,0
1,0
0,9
0,0
0,9
0,0
0,5
1,0
0,7
07_Inf1_k
1,0
BAD-1/2-да
747,0
14,0
733,0
2,0
7770,0
0,9
0,9
0,0
0,0
1,9
100,0
0,0
98,1
8,8
91,2
0,2
1,1
0,7
0,4
218,4
0,0
3575,3
0,9
0,0
0,0
0,0
0,3
0,0
0,5
0,7
0,1
0,2
07_Inf1_k
2,0
BAD-2/2-нет
7772,0
1,0
7771,0
0,0
747,0
0,1
1,0
0,0
0,0
0,0
100,0
0,0
100,0
91,2
8,8
0,0
11,4
5,7
0,0
1700,7
0,0
236,8
1,0
0,0
0,0
0,0
0,2
0,0
0,3
1,0
0,0
0,0
08_Inf1_i
1,0
BAD-1/2-да
747,0
581,0
166,0
2453,0
5319,0
0,7
0,2
0,8
0,3
77,8
68,4
31,6
22,2
8,8
91,2
8,9
0,8
4,8
146,8
23,2
372,0
1237,2
0,3
0,9
0,4
0,3
0,1
0,2
0,2
0,6
0,6
0,6
08_Inf1_i
2,0
BAD-2/2-нет
7772,0
4559,0
3213,0
96,0
651,0
0,6
1,0
0,6
0,7
58,7
87,1
12,9
41,3
91,2
8,8
0,6
9,9
5,3
87,0
71,8
1,0
27,9
1,0
0,5
0,7
0,0
0,0
0,0
0,0
0,6
0,5
0,5
09_Inf2_k
1,0
BAD-1/2-да
747,0
14,0
733,0
2,0
7770,0
0,9
0,9
0,0
0,0
1,9
100,0
0,0
98,1
8,8
91,2
0,2
1,1
0,7
0,4
218,4
0,0
3575,3
0,9
0,0
0,0
0,0
0,3
0,0
0,5
0,7
0,1
0,2
09_Inf2_k
2,0
BAD-2/2-нет
7772,0
1,0
7771,0
0,0
747,0
0,1
1,0
0,0
0,0
0,0
100,0
0,0
100,0
91,2
8,8
0,0
11,4
5,7
0,0
1700,6
0,0
236,8
1,0
0,0
0,0
0,0
0,2
0,0
0,3
1,0
0,0
0,0
10_Inf2_i
1,0
BAD-1/2-да
747,0
581,0
166,0
2453,0
5319,0
0,7
0,2
0,8
0,3
77,8
68,4
31,6
22,2
8,8
91,2
8,9
0,8
4,8
146,8
23,2
372,0
1237,3
0,3
0,9
0,4
0,3
0,1
0,2
0,2
0,6
0,6
0,6
10_Inf2_i
2,0
BAD-2/2-нет
7772,0
4559,0
3213,0
96,0
651,0
0,6
1,0
0,6
0,7
58,7
87,1
12,9
41,3
91,2
8,8
0,6
9,9
5,3
87,0
71,8
1,0
27,9
1,0
0,5
0,7
0,0
0,0
0,0
0,0
0,6
0,5
0,5
11_Inf3_k
1,0
BAD-1/2-да
747,0
375,0
372,0
1633,0
6139,0
0,8
0,2
0,5
0,3
50,2
79,0
21,0
49,8
8,8
91,2
5,7
0,9
3,3
100,4
95,8
349,9
2221,6
0,2
0,5
0,3
0,3
0,3
0,2
0,4
0,6
0,5
0,5
11_Inf3_k
2,0
BAD-2/2-нет
7772,0
6139,0
1633,0
372,0
375,0
0,8
0,9
0,8
0,9
79,0
50,2
49,8
21,0
91,2
8,8
0,9
5,7
3,3
2221,6
349,9
95,8
100,4
1,0
0,9
0,9
0,4
0,2
0,3
0,3
0,6
0,6
0,6
12_Inf3_i
1,0
BAD-1/2-да
747,0
375,0
372,0
1633,0
6139,0
0,8
0,2
0,5
0,3
50,2
79,0
21,0
49,8
8,8
91,2
5,7
0,9
3,3
100,4
95,8
349,9
2221,6
0,2
0,5
0,3
0,3
0,3
0,2
0,4
0,6
0,5
0,5
12_Inf3_i
2,0
BAD-2/2-нет
7772,0
6139,0
1633,0
372,0
375,0
0,8
0,9
0,8
0,9
79,0
50,2
49,8
21,0
91,2
8,8
0,9
5,7
3,3
2221,6
349,9
95,8
100,4
1,0
0,9
0,9
0,4
0,2
0,3
0,3
0,6
0,6
0,6
13_Inf4_k
1,0
BAD-1/2-да
747,0
1,0
746,0
0,0
7772,0
0,9
1,0
0,0
0,0
0,1
100,0
0,0
99,9
8,8
91,2
0,0
1,1
0,6
0,0
325,3
0,0
4115,6
1,0
0,0
0,0
0,0
0,4
0,0
0,5
1,0
0,0
0,1
13_Inf4_k
2,0
BAD-2/2-нет
7772,0
0,0
7772,0
0,0
747,0
0,1
0,0
0,0
0,0
0,0
100,0
0,0
100,0
91,2
8,8
0,0
11,4
5,7
0,0
3497,7
0,0
435,7
0,0
0,0
0,0
0,0
0,5
0,0
0,6
0,0
0,0
0,0
14_Inf4_i
1,0
BAD-1/2-да
747,0
655,0
92,0
3477,0
4295,0
0,6
0,2
0,9
0,3
87,7
55,3
44,7
12,3
8,8
91,2
10,0
0,6
5,3
133,8
5,0
346,8
331,8
0,3
1,0
0,4
0,2
0,1
0,1
0,1
0,7
0,8
0,7
14_Inf4_i
2,0
BAD-2/2-нет
7772,0
4679,0
3093,0
97,0
650,0
0,6
1,0
0,6
0,7
60,2
87,0
13,0
39,8
91,2
8,8
0,7
9,9
5,3
42,3
29,9
0,5
11,5
1,0
0,6
0,7
0,0
0,0
0,0
0,0
0,6
0,5
0,5
15_Inf5_k
1,0
BAD-1/2-да
747,0
1,0
746,0
0,0
7772,0
0,9
1,0
0,0
0,0
0,1
100,0
0,0
99,9
8,8
91,2
0,0
1,1
0,6
0,0
325,3
0,0
4115,6
1,0
0,0
0,0
0,0
0,4
0,0
0,5
1,0
0,0
0,1
15_Inf5_k
2,0
BAD-2/2-нет
7772,0
0,0
7772,0
0,0
747,0
0,1
0,0
0,0
0,0
0,0
100,0
0,0
100,0
91,2
8,8
0,0
11,4
5,7
0,0
3497,7
0,0
435,7
0,0
0,0
0,0
0,0
0,5
0,0
0,6
0,0
0,0
0,0
16_Inf5_i
1,0
BAD-1/2-да
747,0
655,0
92,0
3477,0
4295,0
0,6
0,2
0,9
0,3
87,7
55,3
44,7
12,3
8,8
91,2
10,0
0,6
5,3
133,8
5,0
346,7
331,8
0,3
1,0
0,4
0,2
0,1
0,1
0,1
0,7
0,8
0,7
16_Inf5_i
2,0
BAD-2/2-нет
7772,0
4680,0
3092,0
97,0
650,0
0,6
1,0
0,6
0,7
60,2
87,0
13,0
39,8
91,2
8,8
0,7
9,9
5,3
42,3
29,9
0,5
11,5
1,0
0,6
0,7
0,0
0,0
0,0
0,0
0,6
0,5
0,5
17_Inf6_k
1,0
BAD-1/2-да
747,0
369,0
378,0
1606,0
6166,0
0,8
0,2
0,5
0,3
49,4
79,3
20,7
50,6
8,8
91,2
5,6
0,9
3,3
97,6
98,6
338,1
2265,9
0,2
0,5
0,3
0,3
0,3
0,2
0,4
0,6
0,5
0,5
17_Inf6_k
2,0
BAD-2/2-нет
7772,0
6133,0
1639,0
371,0
376,0
0,8
0,9
0,8
0,9
78,9
50,3
49,7
21,1
91,2
8,8
0,9
5,7
3,3
2215,4
350,9
95,5
100,6
1,0
0,9
0,9
0,4
0,2
0,3
0,3
0,6
0,6
0,6
18_Inf6_i
1,0
BAD-1/2-да
747,0
375,0
372,0
1635,0
6137,0
0,8
0,2
0,5
0,3
50,2
79,0
21,0
49,8
8,8
91,2
5,7
0,9
3,3
100,4
95,8
350,4
2219,3
0,2
0,5
0,3
0,3
0,3
0,2
0,4
0,6
0,5
0,5
18_Inf6_i
2,0
BAD-2/2-нет
7772,0
6139,0
1633,0
372,0
375,0
0,8
0,9
0,8
0,9
79,0
50,2
49,8
21,0
91,2
8,8
0,9
5,7
3,3
213,5
33,6
9,2
9,7
1,0
0,9
0,9
0,0
0,0
0,0
0,0
0,6
0,6
0,6
19_Inf7_k
1,0
BAD-1/2-да
747,0
369,0
378,0
1606,0
6166,0
0,8
0,2
0,5
0,3
49,4
79,3
20,7
50,6
8,8
91,2
5,6
0,9
3,3
97,6
98,6
338,1
2265,9
0,2
0,5
0,3
0,3
0,3
0,2
0,4
0,6
0,5
0,5
19_Inf7_k
2,0
BAD-2/2-нет
7772,0
6133,0
1639,0
371,0
376,0
0,8
0,9
0,8
0,9
78,9
50,3
49,7
21,1
91,2
8,8
0,9
5,7
3,3
2215,4
350,9
95,5
100,6
1,0
0,9
0,9
0,4
0,2
0,3
0,3
0,6
0,6
0,6
20_Inf7_i
1,0
BAD-1/2-да
747,0
375,0
372,0
1635,0
6137,0
0,8
0,2
0,5
0,3
50,2
79,0
21,0
49,8
8,8
91,2
5,7
0,9
3,3
100,4
95,8
350,4
2219,3
0,2
0,5
0,3
0,3
0,3
0,2
0,4
0,6
0,5
0,5
20_Inf7_i
2,0
BAD-2/2-нет
7772,0
6139,0
1633,0
372,0
375,0
0,8
0,9
0,8
0,9
79,0
50,2
49,8
21,0
91,2
8,8
0,9
5,7
3,3
213,5
33,6
9,2
9,7
1,0
0,9
0,9
0,0
0,0
0,0
0,0
0,6
0,6
0,6
36
4.4. Выбор наиболее достоверной модели и придание ей статуса
текущей
Из предыдущего раздела мы видим, что наиболее достоверной моде-
лью по сравнению со случайным угадыванием является системно-
когнитивная модель INF5 с интегральным критерием «Сумма знаний». По-
этому в соответствии со схемой преобразования данных в информацию, а
ее в знания, приведенной на рисунке 4, придадим ей статус текущей моде-
ли (рисунок 25).
Рисунок 25. Придание наиболее достоверной системно-когнитивной
модели INF5 статуса текущей модели
5. Решение задачи оценки риска мошенничества
в автостраховании ОСАГО в наиболее достоверной модели
Все способы метризации шкал с применением 7 частных критериев
знаний, приведенные в таблице 2, реализованы в системно-когнитивном
анализе и интеллектуальной системе «Эйдос» и обеспечивают сопоставле-
ние градациям шкал числовых значений, имеющих смысл количества ин-
формации в градации о принадлежности объекта к классу. Это делается
совершенно одинаково для градаций всех шкал, независимо от их типа
(номинальные, порядковые и числовые) и независимо от единиц измере-
ния, используемых в этих шкалах.
Это обеспечивает сопоставимость обработки разнородных типов
данных в системно-когнитивных моделях. Поэтому является корректным
применение интегральных критериев, включающих операции умножения и
суммирования, для обработки числовых значений, соответствующих гра-
дациям шкал. Это позволяет единообразно и сопоставимо обрабатывать
эмпирические данные, полученные с помощью любых типов шкал, приме-
няя при этом все математические операции [29].
Рассмотрим интегральные критерии знаний, используемые в насто-
ящее время в АСК-анализе и системе «Эйдос-Х++» для верификации мо-
делей и решения задач идентификации и прогнозирования.
37
1-й интегральный критерий «Сумма знаний» представляет собой
суммарное количество знаний, содержащееся в системе факторов различ-
ной природы, характеризующих сам объект управления, управляющие
факторы и окружающую среду, о переходе объекта в будущие целевые или
нежелательные состояния.
Интегральный критерий представляет собой аддитивную функцию
от частных критериев знаний и имеет вид::
).,( iijjLII
В выражении круглыми скобками обозначено скалярное произведе-
ние. В координатной форме это выражение имеет вид:
,
1
M
iiijjLII
где: M – количество градаций описательных шкал (признаков);
}I{I ijij
вектор состояния j–го класса;
}L{L ii
вектор состояния распознаваемого объекта, включающий все виды фак-
торов, характеризующих сам объект, управляющие воздействия и окружающую среду (мас-
сив–локатор), т.е.:
.,0
;,0:,
;,1
действуетнефакторйiесли
nюистинностьсдействуетфакторйiеслиnгдеn
действуетфакторйiесли
Li
В текущей версии системы «Эйдос-Х++» значения координат векто-
ра состояния распознаваемого объекта принимались равными либо 0, если
признака нет, или n, если он присутствует у объекта с интенсивностью n,
т.е. представлен n раз (например, буква «о» в слове «молоко» представлена
3 раза, а буква «м» - один раз).
2-й интегральный критерий «Семантический резонанс знаний» пред-
ставляет собой нормированное суммарное количество знаний, содержаще-
еся в системе факторов различной природы, характеризующих сам объект
управления, управляющие факторы и окружающую среду, о переходе объ-
екта в будущие целевые или нежелательные состояния.
Интегральный критерий представляет собой аддитивную функцию
от частных критериев знаний и имеет вид:
 
 
,
1
1
M
iijij
lj
jLLII
M
I
где:
M количество градаций описательных шкал (признаков);
38
j
I
средняя информативность по вектору класса;
L
среднее по вектору объекта;
j
среднеквадратичное отклонение частных критериев знаний вектора класса;
l
среднеквадратичное отклонение по вектору распознаваемого объекта.
Приведенное выражение для интегрального критерия «Семантиче-
ский резонанс знаний» получается непосредственно из выражения для
критерия «Сумма знаний» после замены координат перемножаемых векто-
ров их стандартизированными значениями:
.,
l
i
i
j
jij
ij LL
L
II
I
Свое наименование интегральный критерий сходства «Семантиче-
ский резонанс знаний» получил потому, что по своей математической
форме является корреляцией двух векторов: состояния j–го класса и состо-
яния распознаваемого объекта.
Итак, в системно-когнитивной модели для каждой градации описа-
тельной шкалы, т.е. признака, содержится информация о принадлежности
объекта с этим признаком к каждому из классов, т.е. признаки рассматри-
ваются как частные критерии. А интегральные критерии позволяют посчи-
тать суммарное количество информации во всей системе признаков объек-
та о его принадлежности к каждому из классов.
На рисунке 26 мы видим отображение стадий процесса оценки рис-
ков для всех 8519 страховых случаев, приведенных в исходный выборке.
Обратим внимание на то, что весь этот процесс занял 5 минуты 9 секунд.
Рисунок 26. Экранная форма, отображающая стадии процесса оценки
рисков для всех страховых случаев, приведенных в исходный выборке
39
В системе «Эйдос» есть 5 выходных форм с результатами распозна-
вания и 7 форм с оценкой достоверности распознавания:
Рассмотрим форму 4.1.3.1 (рисунок 27):
Результатом распознавания (идентификации, диагностики, прогно-
зирования, оценки риска) некоторого объекта является список всех клас-
сов, ранжированный в порядке убывания сходства этого объекта с класса-
ми (рисунок 27).
Рисунок 27. Результат оценки риска мошенничества
при страховом случае, выделенном курсором на левом окне
40
Рассмотрим форму 4.1.3.2 (рисунок 28):
Выше мы уже видели, что сходство объекта с классом измеряется
суммарным количеством информации в признаках этого объекта о его
принадлежности к данному классу. Класс, к которому действительно отно-
сится распознаваемый объект, отмечен «птичкой».
Рисунок 28. Результат оценки риска мошенничества
для всех страховых случаев
41
6. Решение задачи поддержки принятия решений (иссле-
дование влияния значений факторов на оценку риска мошен-
ничества)
Выше мы уже видели, что в системно-когнитивной модели для каж-
дой градации описательной шкалы, т.е. признака, содержится информация
о принадлежности объекта с этим признаком к каждому из классов, т.е.
признаки рассматриваются как частные критерии. На этой основе могут
быть решены и задача оценки рисков мошенничества, и задача поддержки
принятия решений о политике, уменьшающей риск мошенничества.
Задача поддержки принятия решений является обратной задачей по
отношению к задаче оценки рисков.
При оценке риска мошенничества (распознавании, идентификации) с
помощью используются интегральные критерии, с помощью которых рас-
считывается суммарное количество информации во всей системе призна-
ков объекта (т.е. частных критериев) о его принадлежности к каждому из
классов.
При поддержке принятия решений, наоборот, по заданному классу
(наличие либо отсутствие мошенничества) определяется система призна-
ков, способствующая возникновения страхового случая, соответствующего
классу.
Эта информация выводится в различных выходных формах: в ин-
формационных портретах, нелокальных нейронов и SWOT-диаграмм клас-
сов. В данном разделе в рисунках 29 и 30 приведены информационные
портреты классов, а остальные формы мы приведем в следующем разделе.
Рисунок 29. Система детерминации страховой ситуации:
«Есть риск мошенничества» в системно-когнитивной модели INF5
42
Рисунок 30. Система детерминации страховой ситуации:
«Риск мошенничества отсутствует» в системно-когнитивной модели INF5
На рисунках 29 и 30 мы видим не только сами значения факторов,
обуславливающие состояния объекта моделирования, но и силу и направ-
ление их влияния в виде весовых коэффициентов.
Из сравнения величин этих весовых коэффициентов на рисунках 29 и
30 мы видим, что состояние риска мошенничества обусловлено значения-
ми факторов значительно более жестко, чем его отсутствие.
Данный режим позволяет исследовать также влияние любого факто-
ра на переход моделируемой системы в состояние, соответствующее клас-
су. Например посмотрим как влияет «цель использования застрахован-
ного ТС» (поле: «VEH_aim_use», см. табл. 1) на риск мошенничества и-
сунок 31). Для этого в режиме 421, в котором отображаются информаци-
онные портреты классов, в правом окне надо поставить курсор на нужный
фактор и кликнуть по кнопке: «Включить фильтр по фактору». В результа-
те получим экранную форму, отражающую влияние значений именно дан-
ного фактора на возникновение ситуации, соответствующей классу, на ко-
тором стоит курсор в левом коне (рисунок 32).
Из формы, представленной на рисунке 32 мы видим, что страхование
личного автотранспорта является фактором риска мошенничества, а для
такси наоборот это нехарактерно.
Аналогично можно исследовать влияние других факторов на риск
мошенничества и его отсутствие.
43
Рисунок 31. Фактор: «Цель использования застрахованного ТС»
(поле: «VEH_aim_use», см. табл. 1)
Рисунок 32. Влияние фактора: «Цель использования застрахованного ТС»
(поле: «VEH_aim_use», см. табл. 1) на риск мошенничества
44
Первый акт внедрения далекого прототипа системы «Эйдос», разра-
ботанного в на компьютерах WANG-2200C в среде персональной техноло-
гической системы «Вега-М» разработки автора, в котором упоминаются
информационные портреты, получен еще в 1987 году, т.е. 30 лет назад
[20, 41]:
45
7. Решение задачи исследования моделируемой предмет-
ной области путем исследования ее модели
7.1. Автоматизированный SWOT-анализ классов и значений и
значений факторов
SWOT-анализ – это традиционная форма анализа, в котором опреде-
ляется, какие факторы способствуют, а какие препятствуют, переходу ис-
следуемого объекта в то или иное состояние. При этом определяется не
только знак влияния факторов, но и сила и обычно это делается эксперта-
ми неформализуемым путем на основе опыта, интуиции и профессиональ-
ной компетенции. В системе «Эйдос» это делается на основе системно-
когнитивных моделей, созданных непосредственно на основе эмпириче-
ских данных [33] (рисунки 33 и 34):
Рисунок 33. SWOT-анализ класса: «Есть риск мошенничества»
46
Рисунок 34. SWOT-анализ класса: «Риск мошенничества отсутствует»
В этих режимах можно исследовать влияние какого-либо одного
фактора на переход исследуемой системы в состояние, соответствующее
классу. Для этого в правом или левом нижнем окне надо поставить курсор
на нужный фактор и включить фильтр по фактору. На SWOT-диаграммах,
47
приведенных на рисунках 35 и 36 показано влияние модели технического
средства и региона на риск мошенничества:
Рисунок 35. SWOT-диаграмма влияния модели технического средства
на риск мошенничества
Рисунок 36. SWOT-диаграмма влияния региона
на риск мошенничества
7.2. Нелокальные нейроны
В 2003 году Е.В.Луценко были предложены нелокальные нейронные
сети прямого счета [26]. Идея, лежащая в основе этих сетей близка попу-
лярному в настоящее время подходу байесовских нейросетей.
48
На рисунке 37 приведены нелокальные нейроны классов: «Есть риск
мошенничества» и «Нет риска мошенничества» без фильтра по фактору:
Рисунок 37. Нелокальные нейроны классов: «Есть риск мошенничества»
и «Нет риска мошенничества» без фильтра по фактору
49
7.3. Нелокальная нейронная сеть
На рисунке 38 приведен фрагмент однослойной нелокальной
нейронной сети, включающей два нейрона, показанных на рисунках 37:
Рисунок 38. Фрагмент однослойной нелокальной нейронной сети,
включающей два нейрона
В этой сети значимость рецепторов убывает справа на лево, т.е. на
рисунке 38 показаны наиболее сильные нейронные связи.
7.4. 2D-семантические сети значений факторов
На рисунке 39 приведена 2D-семнатическая сеть значений факторов,
отражающая сходство-различие влияния этих значений факторов на при-
надлежность страхового случая к классам: «Есть риск мошенничества» и
«Нет риска мошенничества». Подобные ориентированные графы часто
называют когнитивными диаграммами. Обычно они разрабатываются экс-
пертами неформлизуемым путем на основе опыта, интуиции и профессио-
нальной компетенции. В системе «Эйдос» это делается на основе систем-
но-когнитивных моделей, созданных непосредственно на основе эмпири-
ческих данных.
В 2D-семантической сети значений факторов красными линиями со-
единены значения, имеющие сходное влияние на моделируемую систему, а
синими линиями – различное. Толщина линий означает степень сходства и
различия.
Значения факторов оказывающие сходное влияние показаны на 2D-
семантической сети рядом. В результате на диаграмме мы видим явно вы-
50
раженные две группы значений факторов, образующих противоположные
по влиянию кластеры. Эти кластеры образуют полюса конструкта.
Конструкт представляет собой понятие, имеющее противоположные
по смыслу полюса и спектр промежуточных смысловых значений.
Пример конструкта: «температура»: имеет противоположные по
смыслу полюса: «горячее» и «холодное» и спектр промежуточных значе-
ний температуры (например шкала Цельсия).
Рисунок 39. 2D-семантическая сеть значений факторов
Человек мыслит в системе конструктов, которая образует парадигму
реальности [5]. Система «Эйдос» обеспечивает:
формирование обобщенных образов классов (обобщенных онтоло-
гий) на основе примеров объектов обучающей выборки, описанных с од-
ной стороны признаками, а с другой принадлежностью к обобщенным ка-
тегориям (классам), т.е. на основе конкретных онтологий;
сравнение образов конкретных объектов с обобщенными образами
классов;
сравнение обобщенных образов классов друг с другом и формиро-
вание кластеров и конструктов.
Таким образом, система «Эйдос» является инструментом познания
[31].
51
7.5. Когнитивные диаграммы классов
В системе «Эйдос» реализовано автоматизированное сравнение ин-
формационных портретов классов друг с другом по значениям описатель-
ных шкал (рисунок 40):
Рисунок 40. Содержательное сравнение информационных портретов
двух классов: «Есть мошенничество» и «Нет мошенничества»
7.6. Когнитивные диаграммы факторов
В системе «Эйдос» реализовано автоматизированное сравнение ин-
формационных портретов значений факторов друг с другом по значениям
классификационных шкал (рисунок 41):
Рисунок 41. Содержательное сравнение информационных портретов
двух значений факторов
52
7.7. Интегральные когнитивные карты
Интегральная когнитивная карта представляет собой один слой не-
локальной нейронной сети, дополненный 2d-семантическими сетями
нейронов (классов) и рецепторов (признаков) (рисунок 42):
Рисунок 42. Интегральная когнитивная карта модели INF3
7.8. Когнитивные функции
Вместо того, чтобы описывать что такое когнитивные функции, при-
ведем окно режима с соответствующим пояснением:
Кроме того этот вопрос подробно раскрыт в главах 11-13 моногра-
фии: [19] и в тематической подборке [34].
53
На рисунке 43 приведены примеры некоторых когнитивных функ-
ций, построенных на основе созданных моделей:
54
Рисунок 43. Когнитивные функции, отражающие причинно-следственные зависимости
между описательными и классификационными шкалами в модели INF3
55
В когнитивных функциях цвет отражает количество информации в
градации описательной шкалы о переходе объекта моделирования в состо-
яние, соответствующее классу, т.е. градации классификационной шкалы.
8. Использование разработанной методики в адаптивном
режиме и ее локализация для региона
Поскольку интеллектуальная система «Эйдос», представляющая со-
бой программный инструментарий для создания системно-когнитивных
моделей и решения в них задач оценки рисков, принятия решений и иссле-
дования моделируемой предметной области находится в полном открытом
бесплатном доступе на сайте автора по адресу:
http://lc.kubagro.ru/aidos/_Aidos-X.htm, то созданные в ней модели можно
пересоздать в любое время на обновленных или локализованных исходных
данных. Это обеспечивает адаптацию созданных моделей с целью учета
динамики предметной области или локализовать их для заданного региона
России или другой страны. Адаптированные и локализованные модели
обеспечивают более высокую достоверность, чем не адаптированные и не-
локализованные.
9. Исследование ценности факторов и их значений для
решения задачи оценки рисков мошенничества в ОСАГО и оп-
тимизация системы факторов
Чем выше вариабельность по классам значений частных критериев
некоторой градации описательной шкалы (значения фактора, признака) в
статистических и системно-когнитивных моделях, тем выше ценность это-
го признака для решения задачи разделения объектов по классам.
В качестве количественной меры вариабельности может быть вы-
брано среднее отклонение модулей частных критериев от среднего, дис-
персия или среднеквадратичное отклонение. В системе «Эйдос» принят 3-
й вариант (см. рисунки ).
Если рассортировать все признаки в порядке убывания их ценности и
просуммировать их ценность нарастающим итогом, то получится логисти-
ческая Паретто-кривая (таблица 4 и рисунок 44)
56
Таблица 4 – Ценность значений факторов для разделения страховых
случаев по степени риска мошенничества в модели INF3 (фргамент)
NUM
NUM_PRC
KOD_ATR
NAME_ATR
KOD_OPSC
ZNACH_ATR
ZN_ATRNIT
ZNACH_PRC
ZN_PRCNIT
1
0,10
977
FLAG_TRIAL-1/2-да
30
201,07
201,07
4,78
4,78
2
0,20
978
FLAG_TRIAL-2/2-нет
30
201,07
402,14
4,78
9,56
3
0,31
1
EVENT_TYPE-1/2-Классика
1
123,50
525,64
2,94
12,50
4
0,41
2
EVENT_TYPE-2/2-ПВУ СП
1
123,50
649,14
2,94
15,44
5
0,51
869
FLAG_BAD_REGION-1/2-да
22
119,30
768,43
2,84
18,27
6
0,61
870
FLAG_BAD_REGION-2/2-нет
22
119,30
887,73
2,84
21,11
7
0,72
23
POLICY_KBM-2/3-{0.9000000, 1.0000000}
9
108,63
996,36
2,58
23,69
8
0,82
22
POLICY_KBM-1/3-{0.5000000, 0.9000000}
9
97,95
1094,31
2,33
26,02
9
0,92
873
FLAG_PROLONG-1/2-да
24
87,01
1181,32
2,07
28,09
10
1,02
874
FLAG_PROLONG-2/2-нет
24
87,01
1268,32
2,07
30,16
11
1,12
28
POLICY_KT-1/3-{0.5000000, 1.0000000}
11
73,95
1342,27
1,76
31,92
12
1,23
974
CLAIM_TYPE-1/3-{0.0000000, 0.0000000}
29
70,89
1413,16
1,69
33,60
13
1,33
976
CLAIM_TYPE-3/3-{0.0000000, 2.0000000}
29
70,89
1484,05
1,69
35,29
14
1,43
899
OWNER_REGION-25/86-Краснодарский край
25
70,87
1554,91
1,69
36,97
15
1,53
925
OWNER_REGION-51/86-Республика Дагестан
25
70,50
1625,42
1,68
38,65
16
1,64
8
PERIOD_STEV-3/3-{199.0000000, 366.0000000}
3
69,51
1694,93
1,65
40,30
17
1,74
965
SALES_CHANNEL-5/7-Прочие
26
65,63
1760,56
1,56
41,86
18
1,84
968
POLICY_LOSS_COUNT-1/3-{0.0000000, 0.0000000}
27
63,24
1823,79
1,50
43,37
19
1,94
970
POLICY_LOSS_COUNT-3/3-{0.0000000, 11.0000000}
27
63,24
1887,03
1,50
44,87
20
2,04
6
PERIOD_STEV-1/3-{0.0000000, 61.0000000}
3
62,83
1949,86
1,49
46,37
21
2,15
935
OWNER_REGION-61/86-Республика Татарстан (Татарстан)
25
55,14
2005,01
1,31
47,68
22
2,25
42
VEH_AGE-1/3-{0.0000000, 5.0000000}
17
49,17
2054,18
1,17
48,85
23
2,35
29
POLICY_KT-2/3-{1.0000000, 1.7000000}
11
47,42
2101,60
1,13
49,97
24
2,45
971
DAMAGE_COUNT-1/3-{1.0000000, 1.0000000}
28
45,61
2147,22
1,08
51,06
25
2,56
973
DAMAGE_COUNT-3/3-{1.0000000, 5.0000000}
28
45,61
2192,83
1,08
52,14
26
2,66
3
PERIOD_EVCL-1/3-{0.0000000, 6.0000000}
2
45,11
2237,94
1,07
53,22
27
2,76
888
OWNER_REGION-14/86-Забайкальский край
25
44,74
2282,68
1,06
54,28
28
2,86
955
OWNER_REGION-81/86-Челябинская область
25
38,91
2321,59
0,93
55,21
- - - - - - - - - -
485
49,59
366
VEH_MODEL-310/802-MAZDA BONGO
20
0,50
4101,81
0,01
97,54
486
49,69
376
VEH_MODEL-320/802-MAZDA PREMACY
20
0,50
4102,31
0,01
97,55
487
49,80
398
VEH_MODEL-342/802-MERCEDES-BENZ C 300
20
0,50
4102,80
0,01
97,56
488
49,90
429
VEH_MODEL-373/802-MERCEDES-BENZ GLS-KLASSE
20
0,50
4103,30
0,01
97,57
489
50,00
460
VEH_MODEL-404/802-MITSUBISHI FUSO
20
0,50
4103,79
0,01
97,59
490
50,10
493
VEH_MODEL-437/802-NISSAN MAXIMA
20
0,50
4104,29
0,01
97,60
491
50,20
507
VEH_MODEL-451/802-NISSAN QASHQAI +2
20
0,50
4104,79
0,01
97,61
492
50,31
520
VEH_MODEL-464/802-OPEL ANTARA
20
0,50
4105,28
0,01
97,62
493
50,41
537
VEH_MODEL-481/802-PEUGEOT 3008
20
0,50
4105,78
0,01
97,63
494
50,51
538
VEH_MODEL-482/802-PEUGEOT 301
20
0,50
4106,27
0,01
97,64
495
50,61
544
VEH_MODEL-488/802-PEUGEOT 407
20
0,50
4106,77
0,01
97,66
496
50,72
576
VEH_MODEL-520/802-RENAULT SYMBOL
20
0,50
4107,27
0,01
97,67
497
50,82
602
VEH_MODEL-546/802-SUZUKI SW IFT
20
0,50
4107,76
0,01
97,68
498
50,92
608
VEH_MODEL-552/802-TOYOTA ALLEX
20
0,50
4108,26
0,01
97,69
499
51,02
621
VEH_MODEL-565/802-TOYOTA CARINA E
20
0,50
4108,75
0,01
97,70
500
51,12
622
VEH_MODEL-566/802-TOYOTA CELICA
20
0,50
4109,25
0,01
97,71
501
51,23
662
VEH_MODEL-606/802-TOYOTA SUCCEED
20
0,50
4109,75
0,01
97,73
502
51,33
671
VEH_MODEL-615/802-TOYOTA WILL
20
0,50
4110,24
0,01
97,74
503
51,43
673
VEH_MODEL-617/802-TOYOTA YARIS
20
0,50
4110,74
0,01
97,75
504
51,53
688
VEH_MODEL-632/802-VOLKSWAGEN POLO SEDAN
20
0,50
4111,23
0,01
97,76
505
51,64
759
VEH_MODEL-703/802-ВАЗ 2131 НИВА
20
0,50
4111,73
0,01
97,77
506
51,74
815
VEH_MODEL-759/802-КАМАЗ 5321
20
0,50
4112,23
0,01
97,79
507
51,84
330
VEH_MODEL-274/802-LADA PRIORA
20
0,45
4112,68
0,01
97,80
508
51,94
512
VEH_MODEL-456/802-NISSAN SKYLINE
20
0,45
4113,12
0,01
97,81
509
52,04
573
VEH_MODEL-517/802-RENAULT SANDERO
20
0,45
4113,57
0,01
97,82
510
52,15
779
VEH_MODEL-723/802-ГАЗ 3102
20
0,45
4114,02
0,01
97,83
511
52,25
163
VEH_MODEL-107/802-DAEWOO GENTRA
20
0,42
4114,44
0,01
97,84
512
52,35
503
VEH_MODEL-447/802-NISSAN PRESAGE
20
0,42
4114,86
0,01
97,85
513
52,45
541
VEH_MODEL-485/802-PEUGEOT 4007
20
0,42
4115,28
0,01
97,86
514
52,56
80
VEH_MODEL-24/802-BENTLEY CONTINENTAL GT
20
0,37
4115,65
0,01
97,87
515
52,66
103
VEH_MODEL-47/802-BMW 645
20
0,37
4116,03
0,01
97,88
516
52,76
108
VEH_MODEL-52/802-BMW 740
20
0,37
4116,40
0,01
97,88
517
52,86
127
VEH_MODEL-71/802-CHERY AMULET
20
0,37
4116,77
0,01
97,89
518
52,97
167
VEH_MODEL-111/802-DAF FT95
20
0,37
4117,14
0,01
97,90
519
53,07
171
VEH_MODEL-115/802-DAIHATSU TERIOS
20
0,37
4117,51
0,01
97,91
520
53,17
172
VEH_MODEL-116/802-DAIHATSU TERIOS KID
20
0,37
4117,89
0,01
97,92
521
53,27
173
VEH_MODEL-117/802-DATSUN MI-DO
20
0,37
4118,26
0,01
97,93
522
53,37
187
VEH_MODEL-131/802-FORD ECOSPORT
20
0,37
4118,63
0,01
97,94
523
53,48
199
VEH_MODEL-143/802-FORD KUGA
20
0,37
4119,00
0,01
97,95
524
53,58
208
VEH_MODEL-152/802-FORD TOURNEO CONNECT
20
0,37
4119,37
0,01
97,96
525
53,68
211
VEH_MODEL-155/802-FORD TRANSIT автобус
20
0,37
4119,75
0,01
97,96
57
Рисунок 44. Логистическая Паретто-кривая ценности значений
факторов для разделения страховых случаев по степени риска
мошенничества в модели INF3
Из таблицы 4 и рисунка 44 видно, что:
2.4% наиболее ценных значений факторов обеспечивают 50% сум-
марной ценности всей системы значений всех факторов;
50% наиболее ценных значений факторов обеспечивают 97,6%
суммарной ценности всей системы значений всех факторов.
Рассмотрим теперь ценность описательных шкал (факторов) для ре-
шения задачи разделения страховых случаев ОСАГО по степени риска
мошенничества (таблица 5 и рисунок 45).
Для этого запустим режим 3,7,4 системы «Эйдос». После выполне-
ния расчетов система выводит окно, приведенное ниже.
Выполнив рекомендации, приведенные на этом окне получим табли-
цу 5 и рисунок 45.
58
Таблица 4 – Ценность описательных шкал (факторов)
для решения задачи разделения страховых случаев ОСАГО
по степени риска мошенничества
NUM
NUM_PRC
KOD_OPSC
NAME_OPSC
N_GROPSC
KODGR_MIN
KODGR_MAX
ZNACH_OS
ZN_OSNIT
ZNACH_PRC
ZN_PRCNIT
1
3,33
30
FLAG_TRIAL
2
977
978
201,07
201,07
18,55
18,55
2
6,67
1
EVENT_TYPE
2
1
2
123,50
324,57
11,39
29,94
3
10,00
22