PreprintPDF Available

Application of automated system-cognitive analysis and intelligent system "Eidos" for forecasting the duration of customer service of the bank and making decisions on their attraction and retention

Authors:
Preprints and early-stage research may not have been peer reviewed yet.

Abstract

Currently, banks accumulate information about customer activity and regularly conduct activities to attract new and retain existing users of banking services. It is now relevant to develop mathematical models that will predict the probability of customer churn and effective, from a business point of view, methods of retaining their own customers. To solve these problems, you will have to direct your forces. This task will be solved by the participants of the nomination. The solution of this problem is proposed with the use of automated system-cognitive analysis (ASK-analysis) and its software tools – the Universal cognitive analytical system "Eidos". A detailed numerical example is given that demonstrates all the stages of solving the problem in ASK analysis, from setting the problem, preparing initial data and entering them into the Eidos system, synthesizing and verifying the model, solving the problem of predicting the duration of customer service, making decisions on attracting and retaining them, and researching the subject area by studying its system-cognitive model. This task was set at the RAIF-Challenge 2017 Championship: https://raif.jet.su/improject-4
1
УДК 004. 8
UDC 004. 8
05.00.00 Технические науки
Engineering
Применением автоматизированного системно-
когнитивного анализа и интеллектуальной
системы «Эйдос» для прогнозирования
длительности обслуживания клиентов банка и
принятие решений по их привлечению и
удержанию
Application of automated system-cognitive analysis
and intelligent system "Eidos" for forecasting the
duration of customer service of the bank and
making decisions on their attraction and retention
Луценко Евгений Вениаминович
д.э.н., к.т.н., профессор
Scopus Author ID: 57191193316
РИНЦ SPIN-код: 9523-7101
prof.lutsenko@gmail.com
Lutsenko Eugeny Veniaminovich
Dr.Sci.Econ., Cand.Tech.Sci., professor
Scopus Author ID: 57191193316
RSCI SPIN-code: 9523-7101
prof.lutsenko@gmail.com
Кубанский государственный аграрный
университет имени И.Т.Трубилина, Краснодар,
Россия
Kuban State Agrarian University, Krasnodar, Russia
В настоящее время банки накапливают
информацию об активности клиентов и регулярно
проводят мероприятия по привлечению новых и
удержанию существующих пользователей
банковских услуг. Именно сейчас актуальна
разработка математических моделей, которые
будут предсказывать вероятность оттока клиентов
и эффективных, с точки зрения бизнеса, методов
удержания собственных клиентов. На решение
этих задач вам и предстоит направить свои силы.
Данную задачу и предстоит решить участникам
номинации. Предлагается решение данной
проблемы с применением автоматизированного
системно-когнитивного анализа (АСК-анализ) и
его программного инструментария –
Универсальной когнитивной аналитической
системы «Эйдос». Приводится развернутый
численный пример, демонстрирующий все этапы
решения задачи в АСК-анализе, от постановки
задачи, подготовки исходных данных и ввода их в
систему «Эйдос», синтеза и верификации модели,
решения задачи прогнозирования длительности
обслуживания клиентов банка, принятия решений
по их привлечению и удержанию и исследования
предметной области путем исследования ее
системно-когнитивной модели. Данная задача
была поставлена на Чемпионате RAIF-Challenge
2017: https://raif.jet.su/improject-4
Currently, banks accumulate information about
customer activity and regularly conduct activities to
attract new and retain existing users of banking
services. It is now relevant to develop mathematical
models that will predict the probability of customer
churn and effective, from a business point of view,
methods of retaining their own customers. To solve
these problems, you will have to direct your forces.
This task will be solved by the participants of the
nomination. The solution of this problem is proposed
with the use of automated system-cognitive analysis
(ASK-analysis) and its software tools the Universal
cognitive analytical system "Eidos". A detailed
numerical example is given that demonstrates all the
stages of solving the problem in ASK analysis, from
setting the problem, preparing initial data and entering
them into the Eidos system, synthesizing and verifying
the model, solving the problem of predicting the
duration of customer service, making decisions on
attracting and retaining them, and researching the
subject area by studying its system-cognitive model.
This task was set at the RAIF-Challenge 2017
Championship: https://raif.jet.su/improject-4
Ключевые слова: АВТОМАТИЗИРОВАННЫЙ
СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ АСК-
АНАЛИЗ СИСТЕМА «ЭЙДОС» ПРИВЛЕЧЕНИЕ
И УДЕРЖАНИЕ КЛИЕНТОВ БАНКА
Doi: 10.13140/RG.2.2.29072.43522
Keywords: AUTOMATED SYSTEM-COGNITIVE
ANALYSIS, ASC-ANALYSIS, "EIDOS" SYSTEM
2
СОДЕРЖАНИЕ
1. ВВЕДЕНИЕ ....................................................................................................................................................... 3
1.1. ФОРМУЛИРОВКА ЗАДАЧИ С САЙТА ЧЕМПИОНАТА RAIF-CHALLENGE 2017:
HTTPS://RAIF.JET.SU/IMPROJECT-4 ............................................................................................................................ 3
1.2. ОБОСНОВАНИЕ ВЫБОРА МЕТОДА ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И ПРОГРАММНОГО ИНСТРУМЕНТАРИЯ
ДЛЯ РЕШЕНИЯ ПОСТАВЛЕННОЙ ЗАДАЧИ .................................................................................................................. 3
1.3. КРАТКО ОБ АВТОМАТИЗИРОВАННОМ СИСТЕМНО-КОГНИТИВНОМ АНАЛИЗЕ И СИСТЕМЕ «ЭЙДОС» ............ 3
2. КОГНИТИВНО-ЦЕЛЕВАЯ СТРУКТУРИЗАЦИЯ ПРЕДМЕТНОЙ ОБЛАСТИ ........................................ 16
3. ФОРМАЛИЗАЦИЯ ПРЕДМЕТНОЙ ОБЛАСТИ ......................................................................................... 21
3.1. ИСХОДНЫЕ ДАННЫЕ И ИХ ХАРАКТРИСТИКА .................................................................................................. 21
3.2. ПРЕДВАРИТЕЛЬНОЕ РУЧНОЕ ИСПРАВЛЕНИЕ ИСХОДНЫХ ДАННЫХ ............................................................... 25
3.3. ПРЕДВАРИТЕЛЬНАЯ АВТОМАТИЗИРОВАННАЯ ПОДГОТОВКА ДЛЯ ВВОДА ИСХОДНЫХ ДАННЫХ В СИСТЕМУ
«ЭЙДОС» (ДЕНОРМАЛИЗАЦИЯ) ............................................................................................................................... 27
3.4. АЛГОРИТМ И ИСХОДНЫЙ КОД ПРОГРАММНОГО ИНТЕРФЕЙСА МЕЖДУ ДАННЫМИ ПО ЗАДАЧЕ «AI В
БАНКАХ» ЧЕМПИОНАТА RAIF-CHALLENGE 2017 (РЕЖИМ 2.3.2.10) ................................................................... 27
3.5. УНИВЕРСАЛЬНЫЙ ПРОГРАММНЫЙ ИНТЕРФЕЙС (API) СИСТЕМЫ «ЭЙДОС» ДЛЯ ВВОДА ДАННЫХ ИЗ
ВНЕШНИХ ИСТОЧНИКОВ ДАННЫХ ТИПА ТАБЛИЦ MS EXCEL............................................................................... 34
3.6. КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ .............................................................................................. 37
3.7. ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ ........................................................................................................... 38
3.8. ОБУЧАЮЩАЯ ВЫБОРКА ................................................................................................................................... 43
4. СИНТЕЗ И ВЕРИФИКАЦИЯ СИСТЕМНО-КОГНИТИВНЫХ МОДЕЛЕЙ ............................................... 43
4.1. СИНТЕЗ И ВЕРИФИКАЦИЯ МОДЕЛЕЙ ............................................................................................................... 43
4.2. ЧАСТНЫЕ КРИТЕРИИ ЗНАНИЙ, ИСПОЛЬЗУЕМЫЕ В НАСТОЯЩЕЕ ВРЕМЯ В АСК-АНАЛИЗЕ И СИСТЕМЕ
«ЭЙДОС» .................................................................................................................................................................. 46
4.3. ОЦЕНКА ДОСТОВЕРНОСТИ МОДЕЛЕЙ ПО F-КРИТЕРИЮ ВАН РИЗБЕРГЕНА И ПО L-КРИТЕРИЯМ ................. 48
4.4. ВЫБОР НАИБОЛЕЕ ДОСТОВЕРНОЙ МОДЕЛИ И ПРИДАНИЕ ЕЙ СТАТУСА ТЕКУЩЕЙ ....................................... 51
5. РЕШЕНИЕ ЗАДАЧИ ОЦЕНКИ ДЛИТЕЛЬНОСТИ ОБСЛУЖИВАНИЯ КЛИЕНТА БАНКА В
НАИБОЛЕЕ ДОСТОВЕРНОЙ МОДЕЛИ ........................................................................................................ 52
6. РЕШЕНИЕ ЗАДАЧИ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ (ИССЛЕДОВАНИЕ ВЛИЯНИЯ
ЗНАЧЕНИЙ ФАКТОРОВ НА ОЦЕНКУ ДЛИТЕЛЬНОСТИ ОБСЛУЖИВАНИЯ КЛИЕНТА БАНКОМ) ... 57
7. РЕШЕНИЕ ЗАДАЧИ ИССЛЕДОВАНИЯ МОДЕЛИРУЕМОЙ ПРЕДМЕТНОЙ ОБЛАСТИ ПУТЕМ
ИССЛЕДОВАНИЯ ЕЕ МОДЕЛИ ...................................................................................................................... 61
7.1. АВТОМАТИЗИРОВАННЫЙ SWOT-АНАЛИЗ КЛАССОВ И ЗНАЧЕНИЙ И ЗНАЧЕНИЙ ФАКТОРОВ ...................... 61
7.2. НЕЛОКАЛЬНЫЕ НЕЙРОНЫ ............................................................................................................................... 64
7.3. НЕЛОКАЛЬНАЯ НЕЙРОННАЯ СЕТЬ ................................................................................................................... 65
7.4. 2D-СЕМАНТИЧЕСКИЕ СЕТИ ЗНАЧЕНИЙ ФАКТОРОВ ........................................................................................ 65
7.5. КОГНИТИВНЫЕ ДИАГРАММЫ КЛАССОВ .......................................................................................................... 67
7.6. КОГНИТИВНЫЕ ДИАГРАММЫ ФАКТОРОВ ....................................................................................................... 68
7.7. ИНТЕГРАЛЬНЫЕ КОГНИТИВНЫЕ КАРТЫ ......................................................................................................... 69
7.8. КОГНИТИВНЫЕ ФУНКЦИИ ............................................................................................................................... 69
8. ИСПОЛЬЗОВАНИЕ РАЗРАБОТАННОЙ МЕТОДИКИ В АДАПТИВНОМ РЕЖИМЕ И ЕЕ
ЛОКАЛИЗАЦИЯ ДЛЯ РЕГИОНА ..................................................................................................................... 71
9. ИССЛЕДОВАНИЕ ЦЕННОСТИ ФАКТОРОВ И ИХ ЗНАЧЕНИЙ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ОЦЕНКИ
РИСКОВ МОШЕННИЧЕСТВА В ОСАГО И ОПТИМИЗАЦИЯ СИСТЕМЫ ФАКТОРОВ ......................... 71
10. ВЫВОДЫ ...................................................................................................................................................... 74
ЛИТЕРАТУРА: .................................................................................................................................................... 76
3
1. Введение
1.1. Формулировка задачи с сайта Чемпионата России по
искусственному интеллекту RAIF-Challenge 2017:
https://raif.jet.su/improject-4
В настоящее время банки накапливают информацию об активности
клиентов и регулярно проводят мероприятия по привлечению новых и
удержанию существующих пользователей банковских услуг. Именно
сейчас актуальна разработка математических моделей, которые будут
предсказывать вероятность оттока клиентов и эффективных, с точки
зрения бизнеса, методов удержания собственных клиентов. На решение
этих задач вам и предстоит направить свои силы.
1.2. Обоснование выбора метода искусственного интеллекта и
программного инструментария для решения поставленной задачи
Для решения поставленной задачи применен новый метод
искусственного интеллекта: Автоматизированный системно-когнитивный
анализ (АСК-анализ, Е.В.Луценко, 2002). Этот метод обеспечивает
корректную сопоставимую обработку большого количества
фрагментированных (неполных) и зашумленных исходных данных
различной природы, измеряемых в различных единицах измерения и
разных типах шал (номинальных-текстовых, порядковых и числовых).
Данный метод имеет свой программный инструментарий – универсальную
когнитивную аналитическую систему «Эйдос», которая создана около 30
лет назад [20, 41] и с тех пор постоянно совершенствуется. Данная система
находится в полном открытом бесплатном доступе, причем с актуальными
исходными текстами, на сайте автора [35] по адресу:
http://lc.kubagro.ru/aidos/_Aidos-X.htm. С применением АСК-анализа и
системы «Эйдос» решено большое количество задач в различных
предметных областях и направлениях науки, в т.ч. для банков [36-40]. Все
это и обусловило выбор данной интеллектуальной технологии для
решения поставленной задачи.
1.3. Кратко об автоматизированном системно-когнитивном
анализе и системе «Эйдос»
1.3.1. Что же такое АСК-анализ?
Автоматизированный системно-когнитивный анализ (АСК-анализ)
это новый универсальный метод искусственного интеллекта,
представляющий собой единственный в настоящее время вариант
4
автоматизированного системного анализа, а именно, системный анализ,
структурированный по базовым когнитивным операциям.
Известно, что системный анализ является одним из общепризнанных
в науке методов решения проблем и многими учеными рассматривается
вообще как методология научного познания. Однако как впервые заметил
еще в 1984 году проф. И. П. Стабин
1
практическое применение системного
анализа наталкивается на проблему, суть которой состоит в том, что
методология системного анализа успешно применяется в сравнительно
простых случаях, в которых в принципе можно обойтись и без нее, тогда
как в реальных сложных ситуациях, она чрезвычайно востребован и у нее
нет альтернатив, сделать это удается очень редко. Проф. И. П. Стабин
первым предложил и путь решения этой проблемы, состоящий в
автоматизации системного анализа, он же ввел и термин:
«Автоматизированный системный анализ» (АСА).
1.3.2. Работы каких ученых сыграли большую роль в создании
АСК-анализа?
Автора идеи АСА мы упомянули выше.
Теперь необходимо отметить отечественных классиков методологии
системного анализа проф. Ф. И. Перегудова и проф. Ф. П. Тарасенко,
которые в своих фундаментальных работах
2
подробно рассмотрели
математические методы, которые могли бы быть успешно применены для
автоматизации отдельных этапов системного анализа. Однако даже самые
лучшие математические методы не могут быть использованы на практике
без эффективно реализующих их программных средств, а путь от научного
метода, реализуемого с помощью математики к его эффективной
программной системе долог и сложен. Обусловлено это тем
обстоятельством, что ЦЭВМ – это дискретный автомат, работающий только
в рамках дискретной математики. Для использования ЦЭВМ необходимо
разработать численные методы или методики их реализации на
компьютере. А затем реализовать и отладить компьютерную программу,
основанную на этом численном методе.
В числе первых попыток реального использования
автоматизированного системного анализа следует отметить монографию
[4]
3
и докторскую диссертацию проф. В. С. Симанкова (2002). В этих
работах идея автоматизации системного анализа была основана на высокой
детализации этапов системного анализа и подборе уже существующих
1
Стабин И.П., Моисеева B.C. Автоматизированный системный анализ.- М.: Машиностроение,
1984. 309 с.
2
Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ. М.: Высшая школа, 1989. - 320
с., Перегудов Ф. И., Тарасенко Ф. П.. Основы системного анализа. Томск Изд-во науч.-техн. лит.
1997. 389с.
3
Симанков В.С., Луценко Е.В., Лаптев В.Н. Системный анализ в адаптивном управлении:
Монография (научное издание). /Под науч. ред. В.С.Симанкова. Краснодар: ИСТЭК КубГТУ, 2001.
258с.
5
программных систем, автоматизирующих эти этапы. Эта попытка была
реализована проф. В. С. Симанковым, однако лишь для специального
случая исследования в области возобновляемой энергетики, где
использовались системы разных разработчиков, созданные с помощью
различного инструментария и не имеющие программных интерфейсов
друг с другом, т. е. не образующие единой автоматизированной системы.
Эта попытка, безусловно, была большим шагом по пути, предложенному
проф. И. П. Стабиным, но ее нельзя признать обеспечившей достижение
поставленной им цели: создание работающего автоматизированного
системного анализа. Эта работа не привела к созданию единой
универсальной программной системы, автоматизирующий системный
анализ, которую можно было бы успешно применять в различных
предметных областях.
1.3.3. Кем и когда создан АСК-анализ?
Автоматизированный системно-когнитивный анализ, как реально
работающий АСА, предложен и разработан проф. Е. В. Луценко в 2002
году [5] и получил детальное и всестороннее развитие в десятках
монографий и сотнях научных статей [1-40]
4
.
Основная идея Е. В. Луценко, позволившая сделать это, состоит в
рассмотрении автоматизированного системного анализа как метода
познания (отсюда и использование термина: «когнитивный» от «cognitio»
знание, познание, лат. ).
Эта идея позволила структурировать автоматизированный
системный анализ не по этапам, как это пытались сделать другие ученые, а
по конкретным базовым когнитивным операциям (БКОСА), т. е. таким
операциям, из комбинаций которых конструируются всевозможные
операции системного анализа. Таких базовых операций оказалось 10 и они
образуют когнитивный конфигуратор:
1) присвоение имен;
2) восприятие;
3) обобщение (синтез, индукция);
4) абстрагирование;
5) оценка адекватности модели;
6) сравнение, идентификация и прогнозирование;
7) дедукция, силлогизм и абдукция;
8) классификация и генерация конструктов;
9) содержательное сравнение;
10) планирование и принятие решений об управлении.
4
Ссылки на некоторые из них приведены здесь:
http://lc.kubagro.ru/aidos/_Aidos-X.htm
http://lc.kubagro.ru/aidos/Sprab0802.pdf
6
Каждая из этих операций достаточно элементарна для формализации
и программной реализации.
Рассмотрим чуть подробнее п. 7. Пример силлогизма (или
дедуктивного рассуждения «от общего к частному»):
Всякий человек смертен (большая посылка)
Сократ – человек (меньшая посылка)
------------
Сократ смертен (заключение)
Абдукция представляет вид вывода с той особенностью, что из
посылки, которая является условным высказыванием, и заключения
вытекает вторая посылка. Например, если рассмотреть тот же пример
Сократом:
Всякий человек смертен (большая посылка)
Сократ смертен (заключение)
------------
Мы можем предположить, что меньшая посылка: «Сократ – человек
(меньшая посылка)».
Однако, кроме указания одного признака Сократа: что он смертен,
мы можем привести и другие его признаки, которые могут помочь
идентифицировать его как человека или препятствовать этому.
По сути, при абдукции мы по признакам объекта, его
экстенсиональному описанию, относим его к обобщающим категориям:
референтным классам, т. е. восстанавливаем его интенсиональное
описание, и делаем это путем решения задачи определения степени
релевантности объекта классу или решения задачи классификации
(идентификации, распознавания, прогнозирования, классификации,
диагностики). При этом мы никогда не можем точно установить
принадлежит ли объект классу, но можем лишь высказать гипотезу [31] об
этом и оценить степень достоверности этой гипотезы (ее релевантности).
Поэтому абдукция имеет широкое применение в системах искусственного
интеллекта, в т. ч. в системе «Эйдос».
1.3.4. Что включает в себя АСК-анализ?
АСК-анализ Е. В. Луценко представляет собой единственный
существующий в настоящее время реально работающий вариант
автоматизированного системного анализа. Но, конечно, это совершенно не
исключает того, что в будущем, возможно, будут разработаны и другие его
варианты.
Автоматизированный системно-когнитивный анализ включает:
формализуемую когнитивную концепцию, математическую модель,
методику численных расчетов и реализующий их программный
инструментарий, в качестве которого в настоящее время выступает
постоянно совершенствуемая автором универсальная когнитивная
аналитическая система "Эйдос".
7
Компоненты АСК-анализа:
формализуемая когнитивная концепция и следующий из нее
когнитивный конфигуратор;
теоретические основы, методология, технология и методика АСК-
анализа;
обобщенная и частные математические модели АСК-анализа,
основанная на системном обобщении теории информации;
методика численных расчетов, в универсальной форме
реализующая математическую модель АСК-анализа на компьютерах,
включающая иерархическую структуру данных и 24 детальных алгоритма
10 БКОСА;
специальное инструментальное программное обеспечение,
реализующее математическую модель и численный метод АСК-анализа
Универсальная когнитивная аналитическая система "Эйдос".
Этапы АСК-анализа:
1) когнитивно-целевая структуризация предметной области;
2) формализация предметной области (конструирование
классификационных и описательных шкал и градаций и подготовка
обучающей выборки);
3) синтез системы обобщенных и частных моделей предметной
области настоящее время система «Эйдос» поддерживает 3
статистические модели и 7 системно-когнитивных моделей);
4) оценка достоверности (верификация) системы моделей
предметной области;
5) повышение достоверности системы моделей, в т. ч. адаптация и
пересинтез этих моделей;
6) решение задач идентификации, прогнозирования и поддержки
принятия решений;
7) исследование объекта моделирования (процесса, явления) путем
исследования его моделей: кластерно-конструктивный анализ классов и
факторов; содержательное сравнение классов факторов; изучение системы
детерминации состояний моделируемого объекта, нелокальные нейроны и
интерпретируемые нейронные сети прямого счета; построение
классических когнитивных моделей (когнитивных карт); построение
интегральных когнитивных моделей (интегральных когнитивных карт).
1.3.5. Какие ученые принимали и сейчас принимают участие в
развитии АСК-анализа?
Необходимо отметить, что в развитии различных теоретических
основ и практических аспектов АСК-анализа приняли участие многие
ученые: д. э. н. , к. т. н. , проф. Луценко Е. В. , Засл. деятель науки РФ, д. т.
н. , проф. Лойко В. И. , к. ф. -м. н. , Ph. D. , проф. , Трунев А. П. (Канада), д.
э. н. , д. т. н. , к. ф. -м. н. , проф. Орлов А. И. , к. т. н. , доц. Коржаков В. Е. ,
д. э. н. , проф. Барановская Т. П. , д. э. н. , к. т. н. , проф. Ермоленко В. В. ,
8
к. пс. н. Наприев И. Л. , к. пс. н. , доц. Некрасов С. Д. , к. т. н. , доц. Лаптев
В. Н. , к. пс. н, доц. Третьяк В. Г. , к. пс. н. , Щукин Т. Н. , д. т. н. , проф.
Симанков В. С. , д. э. н. , проф. Ткачев А. Н. , д. т. н. , проф. Сафронова Т.
И. , д. э. н. , доц. Горпинченко К. Н. , к. э. н. , доц. Макаревич О. А. , к. э. н.
, доц. Макаревич Л. О. , к. м. н. Сергеева Е. В. (Лаптева Е. В. ), Бандык Д.
К. (Белоруссия), Чередниченко Н. А. , к. ф. -м. н. Артемов А. А. , д. э. н. ,
проф. Крохмаль В. В. , д. т. н. , проф. Рябцев В. Г. , к. т. н. , доц. Марченко
А. Ю. , д. т. н. , проф. Фролов В. Ю. , д. ю. н, проф. Швец С. В. , Засл.
деятель науки Кубани, д. б. н. , проф. Трошин Л. П. , Засл. изобр. РФ, д. т.
н. , проф. Серга Г. В. , Сергеев А. С. , д. б. н. , проф. Стрельников В. В. и
другие.
1.3.6. Каков индекс цитирования ученых, принимающих
участие в развитии АСК-анализа?
Работы по АСК-анализу вызывают большой интерес у научной
общественности. Это подтверждается высокими индексами цитирования
этих ученых (например, проф. Е. В. Луценко занимает 1-ю позицию в
России по индексу Хирша (36-35) среди ученых в области кибернетики, к
которой относится искусственный интеллект,).
1.3.7. Докторские и кандидатские диссертации защищенные с
применением АСК-анализа в различных областях науки
Метод системно-когнитивного анализа и его программный
инструментарий интеллектуальная система "Эйдос" были успешно
применены при проведении ряда кандидатских и докторских
диссертационных работ в ряде различных предметных областей по
экономическим, техническим, психологическим и медицинским наукам. С
применением АСК-анализа проведены исследования и защищены
диссертации:
- доктора экономических наук – 4:
Е. В. Луценко: http://ej.kubagro.ru/a/viewaut.asp?id=11
А. Н. Ткачев: http://ej.kubagro.ru/a/viewaut.asp?id=20
В. В. Крохмаль: http://ej.kubagro.ru/a/viewaut.asp?id=22
К. Н. Горпинченко: http://ej.kubagro.ru/a/viewaut.asp?id=646
доктора технических наук – 2:
В. С. Симанков:http://www.yandex.ru/yandsearch?text=профессор Симанков
Владимир Сергеевич
Т. И. Сафронова: http://ej.kubagro.ru/a/viewaut.asp?id=111
кандидата психологических наук – 4:
С. Д. Некрасов: http://manag.kubsu.ru/index.php/ofup/kafedry/174-nekrasov
В. Г. Третьяк: http://law.edu.ru/person/person.asp?persID=1345265
Т. Н. Щукин: http://ej.kubagro.ru/a/viewaut.asp?id=94 http://2045. ru/expert/27.html
И. Л. Наприев: http://ej.kubagro.ru/a/viewaut.asp?id=573
- кандидат технических наук – 1:
Е. В. Луценко: http://ej.kubagro.ru/a/viewaut.asp?id=11
- кандидат экономических наук – 1:
9
Л. О. Макаревич: http://www.
mesi.ru/upload/iblock/b5a/Автореферат%20Макаревич%20ЛО.pdf
http://ej.kubagro.ru/a/viewaut.asp?id=1377
- кандидат медицинских наук – 1:
Сергеева Е. В. (Лаптева Е. В. ): http://ej.kubagro.ru/a/viewaut.asp?id=1034
На текущий момент времени в процессе выполнения, выхода на
защиту и утверждения в ВАК находится еще несколько диссертаций на
соискание ученых степеней кандидатов и докторов наук.
1.3.8. Сколько грантов РФФИ и РГНФ выполнено и
выполняется с применением АСК-анализа?
С применением АСК-анализа с использованием системы "Эйдос"
были выполнены (или находятся в процессе выполнения) следующие
гранты РФФИ и РГНФ (пронумерованы только одобренные проекты):
РФФИ:
Номер проекта
Название проекта
Начало -
окончание
02-01-00035-а
Разработка компьютерных методов изучения эмерджентных
свойств плодовых культур с дальнейшим использованием их для
оптимизации выращивания
2002 -2004
1
02-05-64234-а
Разработка теории многокритериальной оценки ландшафтных и
метеорологических характеристик юга России для увеличения
продуктивности плодовых культур на основе создания системы
банков данных и компьютерного моделирования.
2002 - 2003
2
03-04-96771-
р2003юг_а
Разработка новой методологии районирования сортов
сельскохозяйственных культур на основе системного подхода
при анализе и математическом прогнозе их жизнеобеспечения и
продуктивности
2003 - 2005
3
03-07-96801-
р2003юг_в
Создание системы мониторинга, прогнозирования, анализа и
поддержки управленческих решений по продуктивности
плодовых культур на основе электронных баз данных
2003- 2005
06-06-96644-
р_юг_а
Семантические информационные модели управления
агропромышленным комплексом
2006 - 2008
07-07-13510-
офи_ц
Инвестиционное управление АПК на основе методологии
системно-когнитивного анализа
2007 - 2008
08-06-99005-
р_офи
Управление в АПК исходя из критерия качества жизни
2008 - 2009
09-06-13509-
офи_ц
Системно-когнитивные основы инвестиционного управления
региональным агропромышленным комплексом
2009 - 2010
4
11-06-96508-
р_юг_ц
Системно-когнитивные основы инвестиционного управления
региональным агропромышленным комплексом
2011 - 2012
13-07-96507
Принципы создания облачного сервиса по курсу математики с
визуализацией понятийного аппарата, процесса доказательств
теорем и выполнения практических заданий
2013 - 2014
5
15-06-02569
Когнитивные модели прогнозирования развития
многоотраслевой корпорации
2015 - 2017
6
16-06-00114
Разработка интеллектуальной технологии исследования влияния
экологических факторов на различные аспекты качества жизни
2016 2018
10
населения региона
15-29-02530
Управление генресурсами семейства Rosaceae и Juglandacea для
сохранения и использования биораpнообразия культурных
растений на основе информационной системы, включая
оцифровку коллекций
2015 - 2017
15-29-02545
Ампелографическое и молекулярно-генетическое изучение
происхождения, структуры, динамики генетических ресурсов
рода Vitis (Tournef) L. , их систематизация и оцифровка для
эффективного управления биоресурсами
2015 - 2017
РГНФ:
Номер
проекта
Название проекта
Начало -
окончание
1
13-02-00440а
Методологические основы управления экономической
устойчивостью перерабатывающего комплекса региона с
применением технологий искусственного интеллекта
2013 - 2015
16-02-00185а
Управление качеством жизни населения региона через объемы и
направленность инвестиций в АПК на примере Краснодарского
края
2018 2018
2
17-02-00064а
Системно-когнитивный анализ в управлении номенклатурой и
объемами закупки-реализации продукции в торговой агрофирме
2017 2019
1.3.9. Сколько монографий, патентов, публикаций, входящих в
Перечень ВАК есть по АСК-анализу?
По проблематике АСК-анализа издано 25 монографий [1-40] (еще
несколько в стадии подготовки к печати), получено 30 патентов на
системы искусственного интеллекта, их подсистемы, режимы и
приложения, издано 240 статей в изданиях, входящих в Перечень ВАК РФ:
http://lc.kubagro.ru/aidos/index.htm.
В одном только Научном журнале КубГАУ (входит в Перечень ВАК
РФ с 26-го марта 2010 года) автором АСК-анализа и разработчиком
системы «Эйдос» проф. Е. В. Луценко опубликовано: 212 статей, общим
объёмом 380,997 у.п.л., в среднем 1,797 у.п.л. на одну статью
5
.
1.3.10. В каких областях и где уже применялись АСК-анализ и
система «Эйдос»?
Анализ приведенных выше грантов, диссертаций и публикаций
позволяет констатировать, что АСК-анализ успешно применяется в
следующих предметных областях и научных исследованиях:
- региональная экономика;
- отраслевая экономика;
- экономика предприятий;
- технические науки интеллектуальные системы управления в
возобновляемой энергетике;
- технические науки – мелиорация и управление мелиоративными
системами;
5
http://ej.kubagro.ru/a/viewaut.asp?id=11
11
- психология личности;
- психология экстремальных ситуаций;
- психология профессиональных и учебных достижений;
- медицинская диагностика;
- прогнозирование результатов применения агротехнологий;
- принятие решений по выбору рациональных агротехнологий;
- геофизика: прогнозирование землетрясений;
- геофизика: прогнозирование параметров магнитного поля Земли;
- геофизика: прогнозирование движения полюсов Земли.
На рисунке ниже представлены использование системы «Эйдос» в
различных странах мира, причем в основном, к сожалению, не в России
(рисунок 1):
12
Рисунок 1. Карта и база данных системы «Эйдос» с информацией о
запусках системы «Эйдос » в мире с 09.12.2016 по 06.10.2017
Вместо пояснения по рисунку приведем ниже экранную форму
помощи по режиму, обеспечивающему отображение на карте мира и в базе
данных информации о запусках системы «Эйдос» (рисунок 2):
Рисунок 2. Экранная форма Help по режиму 6. 9 системы «Эйдос»:
Исследования по некоторым из перечисленных направлений мы
постараемся отразить в данной работе.
Две монографии проф. Е. В. Луценко размещены в библиотеке
конгресса США [3, 16]:
Симанков В. С. , Луценко Е. В. Адаптивное управление сложными
системами на основе теории распознавания образов. Монография (научное
издание). Краснодар: ТУ КубГТУ, 1999. - 318с.
http://elibrary.ru/item.asp?id=18828433.
Трунев А. П. , Луценко Е. В. Автоматизированный системно-
когнитивный анализ влияния факторов космической среды на ноосферу,
магнитосферу и литосферу Земли: Под науч. ред. д. т. н. , проф. В. И.
Лойко. Монография (научное издание). Краснодар, КубГАУ. 2012. 480
с. ISBN 978-5-94672-519-4. http://elibrary.ru/item.asp?id=21683737.
1.3.11. В каких областях может применяться АСК-анализ?
По мнению авторов АСК-анализ, как метод искусственного
интеллекта, может успешно применяться во всех областях, в которых для
решения своих профессиональных задач специалист использует свой
естественный интеллект, при этом АСК-анализ выступает в качестве
инструмента, многократно увеличивающего возможности естественного
интеллекта.
АСК-анализ может применяться во всех предметных областях, где
ученый или практики решает свои профессиональные задачи и проблемы,
13
постоянно развивает свои знания, используя новейшие достижения в сфере
искусственного интеллекта.
Главный вывод: автоматизированный системно-когнитивный
анализу присущи все основные признаки нового перспективного
междисциплинарного научного направления в рамках
автоматизированного системного анализа.
1.3.12. Internet-ссылки по АСК-анализу
Интернет-ссылки по АСК-анализу лучше всего представлены на
сайте проф. Е. В. Луценко: http://lc.kubagro.ru/. Данный сайт посетило уже
более 500000 посетителей с уникальными IP-адресами.
Страничка проф. Е. В. Луценко имеется на сайте Научного журнала
КубГАУ: http://ej.kubagro.ru/a/viewaut.asp?id=11. В расчете на фамилию автора
приходится более 295000 прочтений статей.
1.3.13. О плагиаторах, использующих работы по АСК-анализу,
находящиеся в Internet в открытом доступе
Все авторы научных работ по АСК-анализу всегда размещали и
размещают их в свободном открытом бесплатном доступе, чем не
преминули воспользоваться плагиаторы. Лучше всего их деятельность
описана в статье «Групповой плагиат: от студента до министра»
6
. Чтобы
найти многочисленные «труды» плагиаторов, включая диссертации,
достаточно в любой поисковой системе Internet сделать запрос, например:
«Коэффициенты эмерджентности Хартли, Харкевича, Шеннона», которые
автор системной теории информации (СТИ) проф. Е. В. Луценко назвал
так в честь этих выдающихся ученых в области теории информации. При
этом автор следовал сложившейся научной традиции называть единицы
измерения и математические выражения в честь выдающихся ученых (Ом,
Джоуль, Ватт, Ньютон, Тесла и т.д). Причем часто плагиаторы даже не
понимают, что сами основоположники и классики теории информации не
предлагали этих коэффициентов, а предложены они были в работах проф.
Е. В. Луценко [5]
7
. Наверное, поэтому они и не считают нужным делать
ссылки и пишут, например:
1. «По Харкевичу коэффициент эмерджентности определяет степень
детерменированности ситемы…» (подчеркнуто нами, авт. , в цитате
сохранены орфографические ошибки плагиатора).
2. «Отсюда строится системная численная мера количества
информации в ИС на основе оценки эмерджентности системы (по Хартли
и Харкевичу)» (выделено плагиатором).
6
Вяткин В.Б. Групповой плагиат: от студента до министра. - Троицкий вариант Наука -
http://trv-science.ru - [Электронный ресурс]. Адрес доступа: http://trv-science.ru/2011/11/08/gruppovojj-
plagiat-ot-studenta-do-ministra/ или: http://trv-science.ru/2011/11/08/gruppovojj-plagiat-ot-studenta-do-
ministra/print/
7
См., также: Луценко Е.В. Подборка публикаций по вопросам системного обобщения
математики, теории множеств и теории информации: http://www.twirpx.com/file/780491/
14
Эти фразы легко найти в Internet. Здесь автор не считает нужным
уделять вопросу о плагиате большего внимания. Отметим лишь, что эта
плагиаторская деятельность не просто продолжается, а даже набирает
обороты.
Перейдем теперь к описанию применения АСК-анализа и его
программного инструментария интеллектуальной системы «Эйдос», для
решения поставленной задачи.
При этом мы будем следовать этапам АСК-анализа и порядку
преобразования данных в информацию, а ее в знания, принятым в АСК-
анализе, приведенным ниже:
Процесс преобразования данных в информацию, а ее в знания
называется анализ. Основные его этапы приведены на рисунке 3:
ДАННЫЕ
(ИНФОРМАЦИЯ, ЗАПИСАННАЯ
НА КАКОМ-ЛИБО ЯЗЫКЕ ИЛИ В СИСТЕМЕ КОДИРОВАНИЯ
НА НОСИТЕЛЕ ИЛИ НАХОДЯЩАЯСЯ В КАНАЛЕ СВЯЗИ
И РАССМАТРИВАЕМАЯ БЕЗОТНОСИТЕЛЬНО
К ЕЕ СМЫСЛОВОМУ СОДЕРЖАНИЮ)
ИНФОРМАЦИЯ
(ОСМЫСЛЕННЫЕ ДАННЫЕ, Т.Е. СОГЛАСНО КОНЦЕПЦИИ
СМЫСЛА ШЕНКА-АБЕЛЬСОНА ДАННЫЕ, В КОТОРЫХ
ВЫЯВЛЕНЫ ПРИЧИННО-СЛЕДСТВЕННЫЕ ЗАВИСИМОСТИ)
ЗНАНИЯ
(ИНФОРМАЦИЯ, ПОЛЕЗНАЯ
ДЛЯ ДОСТИЖЕНИЯ ЦЕЛЕЙ,
Т.Е. УПРАВЛЕНИЯ)
Постановка целей,
оценка знака и степени
влияния информации
на их достижение
Анализ данных -
выявление в них
событий и причинно-
следственных связей
между событиями
О соотношении содержания понятий: «Данные», «Информация» и «Знания»
Рисунок 3. Преобразование данных в информацию, а ее знания
В системе «Эйдос» этот процесс осуществляется в следующей
последовательности (рисунок 4).
Основные публикации автора по вопросам выявления,
представления и использования знаний [1-41].
Из вышеизложенного можно сделать обоснованный вывод о том, что
АСК-анализ и система «Эйдос» обеспечивают движение познания от
эмпирических данных к информации, а от нее к знаниям. По сути, это
движение от феноменологических моделей, описывающих явления внешне,
к содержательным теоретическим моделям [31].
15
Появляется все больше сайтов, посвященных искусственному
интеллекту, в открытом доступе появляются базы данных для машинного
обучения (UCI
8
, Kaggle
9
и другие) и даже on-line интеллектуальные
Однако учащиеся и ученые до сих пор практически не замечают, что
уже давно существует и действует открытая масштабируемая
интерактивная интеллектуальная on-line среда для обучения и научных
исследований в области искусственного интеллекта, основанная на
автоматизированном системно-когнитивном анализе (АСК-анализ) и его
программном инструментарии интеллектуальной системе «Эйдос», а
также сайте автора.
Последовательность обработки данных, информации и знаний в системе «Эйдос-Х++»
Когнитивно-целевая структуризация предметной области
(неавтоматизированный в системе «Эйдос-Х++» этап АСК-анализа)
Формализация предметной области
Class_Sc, Gr_ClSc
Классификационные
шкалы и градации Opis_Sc, Gr_OpSc
Описательные
шкалы и градации
Inp_data, Inp_data.xls
Исходные данные
Обучающая выборка,
эвентологическая
база данных Obi_zag
Заголовки объектов
обучающей выборки
Obi_Kcl
Коды классов объектов
обучающей выборки Obi_Krg
Коды признаков объектов
обучающей выборки
Средства кодирования
исходных данных
Синтез и верификация моделей
Статистические
модели
Системно-когнитивные
модели (модели знаний)
(многопараметрическая
типизация)
Abs
Матрица абсолютных частот
(матрица сопряженности,
корреляционная матрица)
Prc2
Матрица условных
и безусловных процентных
распределений, расчитанная
по числу объектов классов
Prc1
Матрица условных
и безусловных процентных
распределений, расчитанная
по числу признаков классов
INF3
разности между
фактическими и
теоретически
ожидаемыми
частотами
INF2
Количество
знаний по
А.Харкевичу
INF5
ROI-return on
investment
INF6
Разность
условной и
безусловной
вероятностей
INF1
Количество
знаний по
А.Харкевичу
INF4
ROI-return on
investment
INF6
Разность
условной и
безусловной
вероятностей
Выбор
наиболее достоверной
модели
Решение задач распознавания
системной идентификации
и прогнозирования
Решение
задач Решение задач управления
(поддержки принятия решений)
Решение задач исследования
предметной области путем
исследования ее модели
Рисунок 4. Преобразование данных в информацию, а ее знания
в системе «Эйдос»
8
http://archive.ics.uci.edu/ml/datasets.html
9
https://www.kaggle.com/datasets
16
2. Когнитивно-целевая структуризация предметной
области
На этом этапе АСК-анализа разработчик интеллектуального
приложения решает, что оно должно прогнозировать и на основе чего, т.е.
что является классами, а что факторами, под влиянием которых объект
моделирования оказывается в состояниях, соответствующих классам.
Это единственный не автоматизированный этап АСК-анализа. Все
остальные его этапы автоматизированы в его программном
инструментарии – интеллектуальной системе «Эйдос».
В нашем случае в качестве классификационных шкал нами выбраны:
срок экспирации карты;
фактическая длительность использования карты;
плановая длительность действия договора;
фактическая длительность действия договора.
Могут быть использованы и другие классификационные шкалы с
подобным смыслом, отражающие длительность обслуживания клиента.
Классы, т.е. группы клиентов с различной длительностью
обслуживания, представляют собой градации классификационных шкал.
Необходимо отметить, что непосредственно в исходных данных указанных
классификационных шкал нет, но их интервальные значения могут быть
посчитаны на основе тех данных, которые есть.
В качестве описательных шкал в создаваемых системно-
когнитивных моделях использованы:
Метка активности по текущему определению банка
Число транзакций
Число POS транзакций
Число ATM транзакций
Число транзакций в категории Авиабилеты
Число транзакций в категории Автоуслуги
Число транзакций в категории Аптеки
Число транзакций в категории Аренда авто
Число транзакций в категории Государственные услуги
Число транзакций в категории Дом и ремонт
Число транзакций в категории Другое
Число транзакций в категории Ж/д билеты
Число транзакций в категории Зоомагазины
Число транзакций в категории Игры
Число транзакций в категории Искусство
Число транзакций в категории Квазикэш
Число транзакций в категории Кино
Число транзакций в категории Книги
Число транзакций в категории Коммунальные услуги
Число транзакций в категории Красота
Число транзакций в категории Медицина
Число транзакций в категории Музыка
17
Число транзакций в категории Образование
Число транзакций в категории Одежда и обувь
Число транзакций в категории Отели
Число транзакций в категории Развлечения
Число транзакций в категории Рестораны и фаст-фуд
Число транзакций в категории Спорттовары
Число транзакций в категории Супермаркеты
Число транзакций в категории Телеком
Число транзакций в категории Топливо
Число транзакций в категории Транспорт
Число транзакций в категории Цветы
Число транзакций в категории Ювелирная продукция
Число транзакций в категории Duty Free
Сумма транзакций
Сумма POS транзакций
Сумма ATM транзакций
Сумма транзакций в категории Авиабилеты
Сумма транзакций в категории Автоуслуги
Сумма транзакций в категории Аптеки
Сумма транзакций в категории Аренда авто
Сумма транзакций в категории Государственные услуги
Сумма транзакций в категории Дом и ремонт
Сумма транзакций в категории Другое
Сумма транзакций в категории Ж/д билеты
Сумма транзакций в категории Зоомагазины
Сумма транзакций в категории Игры
Сумма транзакций в категории Искусство
Сумма транзакций в категории Квазикэш
Сумма транзакций в категории Кино
Сумма транзакций в категории Книги
Сумма транзакций в категории Коммунальные услуги
Сумма транзакций в категории Красота
Сумма транзакций в категории Медицина
Сумма транзакций в категории Музыка
Сумма транзакций в категории Образование
Сумма транзакций в категории Одежда и обувь
Сумма транзакций в категории Отели
Сумма транзакций в категории Развлечения
Сумма транзакций в категории Рестораны и фаст-фуд
Сумма транзакций в категории Спорттовары
Сумма транзакций в категории Супермаркеты
Сумма транзакций в категории Телеком
Сумма транзакций в категории Топливо
Сумма транзакций в категории Транспорт
Сумма транзакций в категории Цветы
Сумма транзакций в категории Ювелирная продукция
Сумма транзакций в категории Duty Free
18
Обороты по счёту
Сумма зачислений заработной платы
Число авторизаций в ДБО через сайт
Число авторизаций в ДБО через мобильный банк
Число операций в ДБО
Число переводов в ДБО
Число платежей в ДБО
Число платежей в ДБО в категории Сотовая связь
Число платежей в ДБО в категории ЖКХ
Число платежей в ДБО в категориях Интернет/телевидение/связь
Число платежей в ДБО в категории Образование
Число платежей в ДБО в категории Электронные кошельки
Число платежей в ДБО в категории Кредитные организации
Число платежей в ДБО в категории Налоги/пошлины
Число платежей в ДБО в категории Страхование
Число платежей в ДБО в категории MLM (сетевые продажи)
Число платежей в ДБО в категории Другое
Сумма операций в ДБО
Сумма переводов в ДБО
Сумма платежей в ДБО
Сумма платежей в ДБО в категории Сотовая связь
Сумма платежей в ДБО в категории ЖКХ
Сумма платежей в ДБО в категориях Интернет/телевидение/связь
Сумма платежей в ДБО в категории Образование
Сумма платежей в ДБО в категории Электронные кошельки
Сумма платежей в ДБО в категории Кредитные организации
Сумма платежей в ДБО в категории Налоги/пошлины
Сумма платежей в ДБО в категории Страхование
Сумма платежей в ДБО в категории MLM (сетевые продажи)
Сумма платежей в ДБО в категории Другое
T1N102
T1N103
Тип пластика
Метка кредитной карты
Метка карты с начислением процентов на остаток
Метка карты co-brand
Метка карты с cash-back
Последний статус карты
Текущая сумма собственных средств
Продукт
Тип договора
Пол
Возраст
Эта информация приведена в файле: «description.xlsx» (таблицы 1, 2,
3 и 4), которые скачивается с сайта чемпионата: https://raif.jet.su/improject-4
по ссылке: https://jdisk.jet.su/index.php/s/XJh0h8U51VAXJ2W/authenticate.
19
Таблица 1 Имена, типы данных и смысловые значения полей
файла исходных данных: t1.csv (активность клиента)
Таблица 1: Активность
Поле
Описание
1
REPORT_MONTH
Отчётный месяц
2
CLIENT_HASH_ID
ID клиента
3
ACTIVE_FLAG
Метка активности по текущему определению банка
4
TRN_CNT
Число транзакций
5
TRN_CNT_POS
Число POS транзакций
6
TRN_CNT_ATM
Число ATM транзакций
7
TRN_CNT_AVIA
Число транзакций в категории Авиабилеты
8
TRN_CNT_ASRV
Число транзакций в категории Автоуслуги
9
TRN_CNT_APTK
Число транзакций в категории Аптеки
10
TRN_CNT_AURT
Число транзакций в категории Аренда авто
11
TRN_CNT_GSRV
Число транзакций в категории Государственные услуги
12
TRN_CNT_DOMS
Число транзакций в категории Дом и ремонт
13
TRN_CNT_OTHR
Число транзакций в категории Другое
14
TRN_CNT_ZHDT
Число транзакций в категории Ж/д билеты
15
TRN_CNT_ZOOS
Число транзакций в категории Зоомагазины
16
TRN_CNT_GAME
Число транзакций в категории Игры
17
TRN_CNT_ARTS
Число транзакций в категории Искусство
18
TRN_CNT_KCSH
Число транзакций в категории Квазикэш
19
TRN_CNT_KINO
Число транзакций в категории Кино
20
TRN_CNT_BOOK
Число транзакций в категории Книги
21
TRN_CNT_CMSV
Число транзакций в категории Коммунальные услуги
22
TRN_CNT_BEAU
Число транзакций в категории Красота
23
TRN_CNT_MEDC
Число транзакций в категории Медицина
24
TRN_CNT_MUSC
Число транзакций в категории Музыка
25
TRN_CNT_EDUC
Число транзакций в категории Образование
26
TRN_CNT_CLTH
Число транзакций в категории Одежда и обувь
27
TRN_CNT_HOTL
Число транзакций в категории Отели
28
TRN_CNT_ENTR
Число транзакций в категории Развлечения
29
TRN_CNT_RSTR
Число транзакций в категории Рестораны и фаст-фуд
30
TRN_CNT_SPRT
Число транзакций в категории Спорттовары
31
TRN_CNT_SUPM
Число транзакций в категории Супермаркеты
32
TRN_CNT_TELE
Число транзакций в категории Телеком
33
TRN_CNT_FUEL
Число транзакций в категории Топливо
34
TRN_CNT_TRAN
Число транзакций в категории Транспорт
35
TRN_CNT_FLOW
Число транзакций в категории Цветы
36
TRN_CNT_JEWL
Число транзакций в категории Ювелирная продукция
37
TRN_CNT_DUTF
Число транзакций в категории Duty Free
38
TRN_AMNT
Сумма транзакций
39
TRN_AMNT_POS
Сумма POS транзакций
40
TRN_AMNT_ATM
Сумма ATM транзакций
41
TRN_AMNT_AVIA
Сумма транзакций в категории Авиабилеты
42
TRN_AMNT_ASRV
Сумма транзакций в категории Автоуслуги
43
TRN_AMNT_APTK
Сумма транзакций в категории Аптеки
44
TRN_AMNT_AURT
Сумма транзакций в категории Аренда авто
45
TRN_AMNT_GSRV
Сумма транзакций в категории Государственные услуги
46
TRN_AMNT_DOMS
Сумма транзакций в категории Дом и ремонт
47
TRN_AMNT_OTHR
Сумма транзакций в категории Другое
48
TRN_AMNT_ZHDT
Сумма транзакций в категории Ж/д билеты
49
TRN_AMNT_ZOOS
Сумма транзакций в категории Зоомагазины
50
TRN_AMNT_GAME
Сумма транзакций в категории Игры
51
TRN_AMNT_ARTS
Сумма транзакций в категории Искусство
52
TRN_AMNT_KCSH
Сумма транзакций в категории Квазикэш
53
TRN_AMNT_KINO
Сумма транзакций в категории Кино
54
TRN_AMNT_BOOK
Сумма транзакций в категории Книги
55
TRN_AMNT_CMSV
Сумма транзакций в категории Коммунальные услуги
56
TRN_AMNT_BEAU
Сумма транзакций в категории Красота
57
TRN_AMNT_MEDC
Сумма транзакций в категории Медицина
58
TRN_AMNT_MUSC
Сумма транзакций в категории Музыка
59
TRN_AMNT_EDUC
Сумма транзакций в категории Образование
60
TRN_AMNT_CLTH
Сумма транзакций в категории Одежда и обувь
61
TRN_AMNT_HOTL
Сумма транзакций в категории Отели
20
62
TRN_AMNT_ENTR
Сумма транзакций в категории Развлечения
63
TRN_AMNT_RSTR
Сумма транзакций в категории Рестораны и фаст-фуд
64
TRN_AMNT_SPRT
Сумма транзакций в категории Спорттовары
65
TRN_AMNT_SUPM
Сумма транзакций в категории Супермаркеты
66
TRN_AMNT_TELE
Сумма транзакций в категории Телеком
67
TRN_AMNT_FUEL
Сумма транзакций в категории Топливо
68
TRN_AMNT_TRAN
Сумма транзакций в категории Транспорт
69
TRN_AMNT_FLOW
Сумма транзакций в категории Цветы
70
TRN_AMNT_JEWL
Сумма транзакций в категории Ювелирная продукция
71
TRN_AMNT_DUTF
Сумма транзакций в категории Duty Free
72
CONTRACT_TURN_AMOUNT
Обороты по счёту
73
SALARY_INCOME
Сумма зачислений заработной платы
74
DBO_AUTH_WWW
Число авторизаций в ДБО через сайт
75
DBO_AUTH_MB
Число авторизаций в ДБО через мобильный банк
76
DBO_OPER_CNT
Число операций в ДБО
77
DBO_REM_CNT
Число переводов в ДБО
78
DBO_PAY_CNT
Число платежей в ДБО
79
DBO_PAY_CNT_MOBL
Число платежей в ДБО в категории Сотовая связь
80
DBO_PAY_CNT_ZHKH
Число платежей в ДБО в категории ЖКХ
81
DBO_PAY_CNT_COMS
Число платежей в ДБО в категориях Интернет/телевидение/связь
82
DBO_PAY_CNT_EDUC
Число платежей в ДБО в категории Образование
83
DBO_PAY_CNT_WALT
Число платежей в ДБО в категории Электронные кошельки
84
DBO_PAY_CNT_CREDS
Число платежей в ДБО в категории Кредитные организации
85
DBO_PAY_CNT_GOSP
Число платежей в ДБО в категории Налоги/пошлины
86
DBO_PAY_CNT_INSH
Число платежей в ДБО в категории Страхование
87
DBO_PAY_CNT_MLM
Число платежей в ДБО в категории MLM (сетевые продажи)
88
DBO_PAY_CNT_OTHR
Число платежей в ДБО в категории Другое
89
DBO_OPER_AMNT
Сумма операций в ДБО
90
DBO_REM_AMNT
Сумма переводов в ДБО
91
DBO_PAY_AMNT
Сумма платежей в ДБО
92
DBO_PAY_AMNT_MOBL
Сумма платежей в ДБО в категории Сотовая связь
93
DBO_PAY_AMNT_ZHKH
Сумма платежей в ДБО в категории ЖКХ
94
DBO_PAY_AMNT_COMS
Сумма платежей в ДБО в категориях Интернет/телевидение/связь
95
DBO_PAY_AMNT_EDUC
Сумма платежей в ДБО в категории Образование
96
DBO_PAY_AMNT_WALT
Сумма платежей в ДБО в категории Электронные кошельки
97
DBO_PAY_AMNT_CREDS
Сумма платежей в ДБО в категории Кредитные организации
98
DBO_PAY_AMNT_GOSP
Сумма платежей в ДБО в категории Налоги/пошлины
99
DBO_PAY_AMNT_INSH
Сумма платежей в ДБО в категории Страхование
100
DBO_PAY_AMNT_MLM
Сумма платежей в ДБО в категории MLM (сетевые продажи)
101
DBO_PAY_AMNT_OTHR
Сумма платежей в ДБО в категории Другое
Таблица 2 Имена, типы данных и смысловые значения полей
файла исходных данных: t2.csv (Карты)
Таблица 2: Карты
Поле
Описание
1
CLIENT_HASH_ID
ID клиента
2
CARD_HASH_ID
ID карты
3
CARD_TYPE_NAME
Тип пластика
4
CREDIT_CARD
Метка кредитной карты
5
CARD_WITH_PERC
Метка карты с начислением процентов на остаток
6
CARD_CO_BRAND
Метка карты co-brand
7
CARD_WITH_CASHBACK
Метка карты с cash-back
8
STATUS_NAME
Последний статус карты
9
DATE_TO_WORK
Дата перевода карты в рабочее состояние
10
START_DATE
Дата открытия карты
11
EXPIRE_DATE
Дата экспирации карты
12
FACT_CLOSE_DATE
Фактическая дата закрытия
13
SMS_START_DATE
Дата подключения смс-сервиса
14
SMS_END_DATE
Дата отключения смс-сервиса
21
Таблица 3 – Имена, типы данных и смысловые значения полей
файла исходных данных: t3.csv (Договоры)
Таблица 3: Договоры
Поле
Описание
1
CLIENT_HASH_ID
ID клиента
2
CONTRACT_HASH_ID
ID договора
3
TERM
Срок договора
4
CONTRACT_SUM
Сумма договора
5
CURRENT_SUM
Текущая сумма собственных средств
6
CURRENT_INTEREST_RATE
Текущая процентная ставка
7
OPEN_DATE
Дата открытия
8
PLAN_CLOSE_DATE
Планируемая дата закрытия
9
FACT_CLOSE_DATE
Фактическая дата закрытия
10
PRODUCT
Продукт
11
CONTRACT_TYPE
Тип договора
12
CURRENT_PRINCIPAL_SUM
Текущая сумма непросроченного основного долга
Желтым фоном мы выделили поля, на основе которых можно
рассчитать значения прогнозируемых целевых и нежелательных
показателей.
Таблица 4 – Имена, типы данных и смысловые значения полей
файла исходных данных: t4.csv (Клиенты)
Таблица 4: Клиенты
Поле
Описание
1
CLIENT_HASH_ID
ID клиента
2
F1
Маркетинговый сегмент клиента
3
GENDER
Пол
4
AGE
Возраст
5
GOOD_PHONE
Наличие корректного телефона
6
GOOD_EMAIL
Наличие корректного e-mail
3. Формализация предметной области
На этапе формализации предметной области разрабатываются
классификационные и описательные шкалы и градации, которые затем
используются для кодирования исходных данных, в результате чего
формируется обучающая выборка, т.е. по сути производится нормализация
исходных данных. Необходимо отметить, что нормализация исходных
данных осуществляется в форме, удобной для дальнейшей обработки
данных в системе «Эйдос».
3.1. Исходные данные и их характеристика
Исходные данные для решения поставленной задачи скачивается с
сайта чемпионата: https://raif.jet.su/improject-4 по ссылке:
https://jdisk.jet.su/index.php/s/XJh0h8U51VAXJ2W/authenticate.
Фрагмент исходных данных приведен на рисунках 5-8:
22
Рисунок 5. Фрагмент исходных данных из файла: «t1.csv» (активность)
Рисунок 6. Фрагмент исходных данных из файла: « t2.csv» (карты)
Рисунок 7. Фрагмент исходных данных из файла: «t3.csv» (договора)
23
Рисунок 8. Фрагмент исходных данных из файла: «t4.csv» (клиенты)
Первой важной особенностью исходных данных является их
довольно большой объем:
файл: «t1.csv» имеет размер 230 944 905 байтов и содержит записи
по 825987 клиентам;
файл: «t2.csv» имеет размер 39 638 078 байтов и содержит записи
по 198547 картам;
файл: «t3.csv» 36 926 730 байтов и содержит записи по232257
договорам;
файл: «t4.csv» 3 129 861 байтов и содержит записи по 43470
собственным клиентам.
Это еще конечно не Big data (большие данные), но уже приближается
к этому.
Второй важной особенностью исходных данных является то, что в
они довольно «сырые», т.е. представлены в виде «как есть». В частности в
этих данных:
есть колонки без вариабельности значений в них, которые можно
исключить;
есть довольно много записей, в которых по некоторым показателям
данные отсутствуют (фрагментированы);
есть колонки, в которых нет повторов значений и которые поэтому
не могут быть использованы для обобщения: ID карты, ID договора;
в исходных колонках отсутствуют данные о продолжительности
обслуживания клиента, но есть данные, на основе которых им можно
расчитать;
число полей, описанных в файле: «description.xlsx» не всегда
совпадает с числом полей в таблицах: «t1.csv», «t2.csv», «t3.csv», «t4.scv»:
1) в таблице «t1.csv» фактически 103 колонки, а в файле: «description.xlsx»
указаны наименования только 101 из них; 2) в таблице «t4.scv» есть только
24
4 поля, а в файле: «description.xlsx» указано 6. Поэтому поля, русские
наименования которых неизвестны, имеют условные наименования, а
поля, наименования которых указаны, но данным по ним в таблицах нет,
естественно, не используются.
Третьей важной особенностью исходных данных является то, что в
они представлены в виде четырех нормализованных таблиц, связанных
отношением «один ко многим» по ключевому полю: CLIENT_HASH_ID
(ID клиента). У системы «Эйдос» есть стандартный программные
интерфейсы ввода данных из внешних источников данных различных
типов: текстовых, табличных и графических (рисунок 9). При
использовании табличных внешних источников данных система «Эйдос»
осуществляет их анализ и нормализацию, но эта нормализация
осуществляется по другим ключевым полям, чем это сделано в
оригинальных таблицах исходных данных: «t1.csv», «t2.csv», «t3.csv»,
«t4.scv».
В связи с тем, что исходные данные имеют указанные особенности
перед вводом в систему они требуют определенной предварительной
обработки: исправления и денормализации. Ясно, что при таких объемах
исходных данных это можно сделать только с помощью специально
разработанного программного интерфейса. И такой программный
интерфейс был разработан автором и даже включен в состав программных
интерфейсов системы «Эйдос», т.е. по сути стандартизирован (рисунок 9):
Рисунок 9. Экранная форма с главным меню системы «Эйдос», на котором
показаны программные интерфейсы с внешними источниками данных,
включая программный интерфейс подготовки исходных данных из таблиц:
«t1.csv», «t2.csv», «t3.csv», «t4.scv» (режим 2.3.2.10)
Это сделано для того, чтобы в перспективе систему «Эйдос» проще
было адаптировать для решения этой задачи с исходными данными
аналогичной структуры.
25
3.2. Предварительное ручное исправление исходных данных
На этом этапе из исходных таблиц 2 и 3 были удалены колонки ID
карты, ID договора, как не несущие информацию о принадлежности
клиента к той или иной категории по длительности обслуживания в банке.
Кроме того длинные наименования колонок в файле: «Inp_name.txt»
(DOS TEXT) замены на сокращенные. Это сделано с целью лучшей
читабельности выходных форм. И длинные и сокращенные наименования
колонок приведены ниже в таблице 5.
Таблица 5 – длинные и сокращенные наименования классификационных
(выделены желтым фоном) и описательных шкал
Исходное длинное наименование из «description.xlsx»
Сокращенное наименование
Срок экспирации карты
Срок экспирации карты
Фактическая длительность использования карты
Факт.длит.исп.карты
Плановая длительность действия договора
План.длит.дейст.договора
Фактическая длительность действия договора
Факт.длит.дейст.договора
Метка активности по текущему определению банка
Метка акт. по тек.опр.банка
Число транзакций
Число транзакций
Число POS транзакций
Число POS тр-й
Число ATM транзакций
Число ATM тр-й
Число транзакций в категории Авиабилеты
Чис.тр.в кат.Авиабилеты
Число транзакций в категории Автоуслуги
Чис.тр.в кат.Автоуслуги
Число транзакций в категории Аптеки
Чис.тр.в кат.Аптеки
Число транзакций в категории Аренда авто
Чис.тр.в кат.Аренда авто
Число транзакций в категории Государственные услуги
Чис.тр.в кат.Гос.услуги
Число транзакций в категории Дом и ремонт
Чис.тр.в кат.Дом и ремонт
Число транзакций в категории Другое
Чис.тр.в кат.Другое
Число транзакций в категории Ж/д билеты
Чис.тр.в кат.Ж/д билеты
Число транзакций в категории Зоомагазины
Чис.тр.в кат.Зоомагазины
Число транзакций в категории Игры
Чис.тр.в кат.Игры
Число транзакций в категории Искусство
Чис.тр.в кат.Искусство
Число транзакций в категории Квазикэш
Чис.тр.в кат.Квазикэш
Число транзакций в категории Кино
Чис.тр.в кат.Кино
Число транзакций в категории Книги
Чис.тр.в кат.Книги
Число транзакций в категории Коммунальные услуги
Чис.тр.в кат.Комм.услуги
Число транзакций в категории Красота
Чис.тр.в кат.Красота
Число транзакций в категории Медицина
Чис.тр.в кат.Медицина
Число транзакций в категории Музыка
Чис.тр.в кат.Музыка
Число транзакций в категории Образование
Чис.тр.в кат.Образование
Число транзакций в категории Одежда и обувь
Чис.тр.в кат.Одежда и обувь
Число транзакций в категории Отели
Чис.тр.в кат.Отели
Число транзакций в категории Развлечения
Чис.тр.в кат.Развлечения
Число транзакций в категории Рестораны и фаст-фуд
Чис.тр.в кат.Рестораны и фаст-фуд
Число транзакций в категории Спорттовары
Чис.тр.в кат.Спорттовары
Число транзакций в категории Супермаркеты
Чис.тр.в кат.Супермаркеты
Число транзакций в категории Телеком
Чис.тр.в кат.Телеком
Число транзакций в категории Топливо
Чис.тр.в кат.Топливо
Число транзакций в категории Транспорт
Чис.тр.в кат.Транспорт
Число транзакций в категории Цветы
Чис.тр.в кат.Цветы
Число транзакций в категории Ювелирная продукция
Чис.тр.в кат.Ювелирная продукция
Число транзакций в категории Duty Free
Чис.тр.в кат.Duty Free
Сумма транзакций
Сумма транзакций
Сумма POS транзакций
Сумма POS тр-й
Сумма ATM транзакций
Сумма ATM тр-й
Сумма транзакций в категории Авиабилеты
Сум.тр.в кат.Авиабилеты
Сумма транзакций в категории Автоуслуги
Сум.тр.в кат.Автоуслуги
Сумма транзакций в категории Аптеки
Сум.тр.в кат.Аптеки
Сумма транзакций в категории Аренда авто
Сум.тр.в кат.Аренда авто
Сумма транзакций в категории Государственные услуги
Сум.тр.в кат.Гос.услуги
Сумма транзакций в категории Дом и ремонт
Сум.тр.в кат.Дом и ремонт
26
Сумма транзакций в категории Другое
Сум.тр.в кат.Другое
Сумма транзакций в категории Ж/д билеты
Сум.тр.в кат.Ж/д билеты
Сумма транзакций в категории Зоомагазины
Сум.тр.в кат.Зоомагазины
Сумма транзакций в категории Игры
Сум.тр.в кат.Игры
Сумма транзакций в категории Искусство
Сум.тр.в кат.Искусство
Сумма транзакций в категории Квазикэш
Сум.тр.в кат.Квазикэш
Сумма транзакций в категории Кино
Сум.тр.в кат.Кино
Сумма транзакций в категории Книги
Сум.тр.в кат.Книги
Сумма транзакций в категории Коммунальные услуги
Сум.тр.в кат.Комм.услуги
Сумма транзакций в категории Красота
Сум.тр.в кат.Красота
Сумма транзакций в категории Медицина
Сум.тр.в кат.Медицина
Сумма транзакций в категории Музыка
Сум.тр.в кат.Музыка
Сумма транзакций в категории Образование
Сум.тр.в кат.Образование
Сумма транзакций в категории Одежда и обувь
Сум.тр.в кат.Одежда и обувь
Сумма транзакций в категории Отели
Сум.тр.в кат.Отели
Сумма транзакций в категории Развлечения
Сум.тр.в кат.Развлечения
Сумма транзакций в категории Рестораны и фаст-фуд
Сум.тр.в кат.Рестораны и фаст-фуд
Сумма транзакций в категории Спорттовары
Сум.тр.в кат.Спорттовары
Сумма транзакций в категории Супермаркеты
Сум.тр.в кат.Супермаркеты
Сумма транзакций в категории Телеком
Сум.тр.в кат.Телеком
Сумма транзакций в категории Топливо
Сум.тр.в кат.Топливо
Сумма транзакций в категории Транспорт
Сум.тр.в кат.Транспорт
Сумма транзакций в категории Цветы
Сум.тр.в кат.Цветы
Сумма транзакций в категории Ювелирная продукция
Сум.тр.в кат.Ювелирная продукция
Сумма транзакций в категории Duty Free
Сум.тр.в кат.Duty Free
Обороты по счёту
Обороты по счёту
Сумма зачислений заработной платы
Сумма зач.зар.платы
Число авторизаций в ДБО через сайт
Число авт-й в ДБО через сайт
Число авторизаций в ДБО через мобильный банк
Число авт-й в ДБО через моб.банк
Число операций в ДБО
Чис.опер.в ДБО
Число переводов в ДБО
Число пер.в ДБО
Число платежей в ДБО
Число плат.в ДБО
Число платежей в ДБО в категории Сотовая связь
Чис.плат.в ДБО в кат.Сотовая связь
Число платежей в ДБО в категории ЖКХ
Чис.плат.в ДБО в кат.ЖКХ
Число платежей в ДБО в категориях Интернет/телевидение/связь
Чис.плат.в ДБО в кат.Инт./тел./связь
Число платежей в ДБО в категории Образование
Чис.плат.в ДБО в кат.Образование
Число платежей в ДБО в категории Электронные кошельки
Чис.плат.в ДБО в кат.Электр.кошельки
Число платежей в ДБО в категории Кредитные организации
Чис.плат.в ДБО в кат.Кредит.организации
Число платежей в ДБО в категории Налоги/пошлины
Чис.плат.в ДБО в кат.Налоги/пошлины
Число платежей в ДБО в категории Страхование
Чис.плат.в ДБО в кат.Страхование
Число платежей в ДБО в категории MLM (сетевые продажи)
Чис.плат.в ДБО в кат.MLM (сет.продажи)
Число платежей в ДБО в категории Другое
Чис.плат.в ДБО в кат.Другое
Сумма операций в ДБО
Сум.опер.в ДБО
Сумма переводов в ДБО
Сум.пер. в ДБО
Сумма платежей в ДБО
Сум.плат.в ДБО
Сумма платежей в ДБО в категории Сотовая связь
Сум.плат.в ДБО в кат.Сотовая связь
Сумма платежей в ДБО в категории ЖКХ
Сум.плат.в ДБО в кат.ЖКХ
Сумма платежей в ДБО в категориях Интернет/телевидение/связь
Сум.плат.в ДБО в кат.Инт./тел./св.
Сумма платежей в ДБО в категории Образование
Сум.плат.в ДБО в кат.Образование
Сумма платежей в ДБО в категории Электронные кошельки
Сум.плат.в ДБО в кат.Элект.кошельки
Сумма платежей в ДБО в категории Кредитные организации
Сум.плат.в ДБО в кат.Кредит.организации
Сумма платежей в ДБО в категории Налоги/пошлины
Сум.плат.в ДБО в кат.Налоги/пошлины
Сумма платежей в ДБО в категории Страхование
Сум.плат.в ДБО в кат.Страхование
Сумма платежей в ДБО в категории MLM (сетевые продажи)
Сум.плат.в ДБО в кат.MLM (сет.продажи)
Сумма платежей в ДБО в категории Другое
Сум.плат.в ДБО в кат.Другое
T1N102
T1N102
T1N103
T1N103
Тип пластика
Тип пластика
Метка кредитной карты
Метка кредитной карты
Метка карты с начислением процентов на остаток
Метка карты с нач.проц.на ост.
Метка карты co-brand
Метка карты co-brand
Метка карты с cash-back
Метка карты с cash-back
Последний статус карты
Последний статус карты
Текущая сумма собственных средств
Текущая сумма собст.средств
27
Продукт
Продукт
Тип договора
Тип договора
Пол
Пол
Возраст
Возраст
3.3. Предварительная автоматизированная подготовка для ввода
исходных данных в систему «Эйдос» (денормализация)
У системы «Эйдос» есть развитый программный интерфейс с
внешними данными табличного типа (режим 2.3.2.2). Но эти внешние
данные должны быть представлены в виде одной таблицы MS Excel или
dbf-файла. Данные же чемпионата представлены в виде csv-файлов с
именами: «t1.csv», «t2.csv», «t3.csv», «t4.scv». Поэтому перед запуском
интерфейса 2.3.2.10 необходимо предварительно с помощью MS Excel (или
on line) преобразовать их xlsx-файлы с именами: «t1.xlsx», «t2.xlsx»,
«t3.xlsx», «t4.xlsx». После этого интерфейс 2.3.2.10 сам преобразует их в dbf
(это внутренний стандарт баз данных системы «Эйдос» для сравнительно
небольших файлов), а затем объединит эти файлы по ключевому полю
CLIENT_HASH_ID (ID клиента) в один файл с именем: «Inp_data.dbf».
Ниже приведены алгоритм и исходный текст программного
интерфейса 2.3.2.10.
3.4. Алгоритм и исходный код программного интерфейса между
данными по задаче «AI в банках» Чемпионата RAIF-Challenge 2017
(режим 2.3.2.10)
Обобщенный алгоритм программного интерфейса между данными
по задаче «AI в банках» Чемпионата RAIF-Challenge 2017 и программным
интерфейсом системы «Эйдос» с внешними данными табличного типа
приведен ниже (язык программирования xBase++):
28
Вход
Алгоритм программного интерфейса системы «Эйдос»:
5.3.2.10.Чемпионат RAIF-Challenge 2017-API-bank.
Создание БД Inp_data.dbf из файлов: t1.xlsx, t2.xlsx, t3.xlsx, t4.xlsx
* 1. t1.xlsx, t2.xlsx, t3.xlsx, t4.xlsx
t1.dbf, t2.dbf, t3.dbf, t4.dbf:
2. Inp_data.dbf
Получить структуру файла: t1.dbf в массив
Получить структуру файла: t2.dbf в массив
Получить структуру файла: t3.dbf в массив
Получить структуру файла: t4.dbf в массив
- если файла: t1.xlsx нет, то выдать сообщение и выйти, а если есть - преобразовать его в dbf;
- если файла: t2.xlsx нет, то выдать сообщение и выйти, а если есть - преобразовать его в dbf;
- если файла: t3.xlsx нет, то выдать сообщение и выйти, а если есть - преобразовать его в dbf;
- если файла: t4.xlsx нет, то выдать сообщение и выйти, а если есть - преобразовать его в dbf
Исследовать фактические данные в таблицах
и уменьшить размер полей (на сколько это возможно)
Создать структуру базы данных: Inp_data.dbf и саму базу
3. Inp_data.dbf
: t1.dbf, t2.dbf, t3.dbf, t4.dbf
Начало цикла по записям базы t1.dbf,
соответствующим разным клиентам
Поиск в базе t2.dbf записи по тому же клиенту
Клиент найден?
Запомнить данные по клиенту в массиве
да
нет
Все записи?
Аналогично по базам: t2.dbf, t3.dbf, t4.dbf
Если во всех базах: t2.dbf, t3.dbf, t4.dbf найдены записи, соответствующие текущей записи из
базы t1.dbf, то добавить всю информацию из t1.dbf, t2.dbf, t3.dbf, t4.dbf в базу Inp_data.dbf
Если данные по дате экспирации карты и фактической дате окончания ее
использования, а также данные по плановым и фактическим датам начла и окончания
действия договора является датами, то вычислить и занести в базу Inp_data.dbf:
- срок экспирации карты;
- фактическая длительность использования карты;
- плановая длительность действия договора;
- фактическая длительность действия договора
Занести в базу Inp_data.dbf данные по факторам из баз: t1.dbf, t2.dbf, t3.dbf, t4.dbf
Выход
да
нет
Исходный текст программного интерфейса между данными по
задаче «AI в банках» Чемпионата RAIF-Challenge 2017 и программным
интерфейсом системы «Эйдос» с внешними данными табличного типа
приведен ниже (язык программирования xBase++):
*******************************************************************************
******** Создание БД Inp_data.dbf из файлов: t1.xlsx, t2.xlsx, t3.xlsx, t4.xlsx
*******************************************************************************
FUNCTION F2_3_2_10()
* 1. Преобразовать t1.xlsx, t2.xlsx, t3.xlsx, t4.xlsx в t1.dbf, t2.dbf, t3.dbf, t4.dbf
mNameInpData = Disk_dir+"\AID_DATA\Inp_data\"
29
DIRCHANGE(mNameInpData) // Перейти в папку Inp_data
cFile='t1.xlsx';IF .NOT. FILE(cFile);LB_Warning('В папке: '+mNameInpData+' нет файла:
'+cFile );RETURN NIL;ENDIF
IF .NOT. FILE('t1.dbf');LC_Excel2WorkArea( cFile, mNameInpData );ENDIF
COPY FILE ("Inp_name.txt") TO ("Inp_name_t1.txt")
COPY FILE ("Inp_nameAll.txt") TO ("Inp_nameAll_t1.txt")
cFile='t2.xlsx';IF .NOT. FILE(cFile);LB_Warning('В папке: '+mNameInpData+' нет файла:
'+cFile );RETURN NIL;ENDIF
IF .NOT. FILE('t2.dbf');LC_Excel2WorkArea( cFile, mNameInpData );ENDIF
COPY FILE ("Inp_name.txt") TO ("Inp_name_t2.txt")
COPY FILE ("Inp_nameAll.txt") TO ("Inp_nameAll_t2.txt")
cFile='t3.xlsx';IF .NOT. FILE(cFile);LB_Warning('В папке: '+mNameInpData+' нет файла:
'+cFile );RETURN NIL;ENDIF
IF .NOT. FILE('t3.dbf');LC_Excel2WorkArea( cFile, mNameInpData );ENDIF
COPY FILE ("Inp_name.txt") TO ("Inp_name_t3.txt")
COPY FILE ("Inp_nameAll.txt") TO ("Inp_nameAll_t3.txt")
cFile='t4.xlsx';IF .NOT. FILE(cFile);LB_Warning('В папке: '+mNameInpData+' нет файла:
'+cFile );RETURN NIL;ENDIF
IF .NOT. FILE('t4.dbf');LC_Excel2WorkArea( cFile, mNameInpData );ENDIF
COPY FILE ("Inp_name.txt") TO ("Inp_name_t4.txt")
COPY FILE ("Inp_nameAll.txt") TO ("Inp_nameAll_t4.txt")
* 2. Создать БД Inp_data.dbf
oScrn := DC_WaitOn( 'Создание БД Inp_data.dbf' )
CLOSE ALL;USE t1 EXCLUSIVE NEW;at1 := DbStruct()
CLOSE ALL;USE t2 EXCLUSIVE NEW;at2 := DbStruct()
CLOSE ALL;USE t3 EXCLUSIVE NEW;at3 := DbStruct()
CLOSE ALL;USE t4 EXCLUSIVE NEW;at4 := DbStruct()
*** Уменьшить размер полей (на сколько это возможно)
*** Наверное надо сделать что-то подобное в конвертере xls => dbf
CLOSE ALL
USE t1 EXCLUSIVE NEW
FOR j=1 TO FCOUNT()
mVal = FIELDGET(j)
DO CASE
CASE VALTYPE(mVal) = 'N'
INDEX ON LEN(ALLTRIM(STR(FIELDGET(j)))) TO tmp
DBGOBOTTOM();at1[j,3] = LEN(ALLTRIM(STR(FIELDGET(j))))
CASE VALTYPE(mVal) = 'C'
INDEX ON LEN(ALLTRIM(FIELDGET(j))) TO tmp
DBGOBOTTOM();at1[j,3] = LEN(ALLTRIM(FIELDGET(j)))
CASE VALTYPE(mVal) = 'D'
DBGOBOTTOM();at1[j,3] = 8
ENDCASE
NEXT
CLOSE ALL
USE t2 EXCLUSIVE NEW
FOR j=1 TO FCOUNT()
mVal = FIELDGET(j)
DO CASE
CASE VALTYPE(mVal) = 'N'
INDEX ON LEN(ALLTRIM(STR(FIELDGET(j)))) TO tmp
DBGOBOTTOM();at2[j,3] = LEN(ALLTRIM(STR(FIELDGET(j))))
CASE VALTYPE(mVal) = 'C'
INDEX ON LEN(ALLTRIM(FIELDGET(j))) TO tmp
DBGOBOTTOM();at2[j,3] = LEN(ALLTRIM(FIELDGET(j)))
CASE VALTYPE(mVal) = 'D'
DBGOBOTTOM();at2[j,3] = 8
ENDCASE
NEXT
CLOSE ALL
USE t3 EXCLUSIVE NEW
FOR j=1 TO FCOUNT()
mVal = FIELDGET(j)
DO CASE
CASE VALTYPE(mVal) = 'N'
INDEX ON LEN(ALLTRIM(STR(FIELDGET(j)))) TO tmp
DBGOBOTTOM();at3[j,3] = LEN(ALLTRIM(STR(FIELDGET(j))))
CASE VALTYPE(mVal) = 'C'
30
INDEX ON LEN(ALLTRIM(FIELDGET(j))) TO tmp
DBGOBOTTOM();at3[j,3] = LEN(ALLTRIM(FIELDGET(j)))
CASE VALTYPE(mVal) = 'D'
DBGOBOTTOM();at3[j,3] = 8
ENDCASE
NEXT
CLOSE ALL
USE t4 EXCLUSIVE NEW
FOR j=1 TO FCOUNT()
mVal = FIELDGET(j)
DO CASE
CASE VALTYPE(mVal) = 'N'
INDEX ON LEN(ALLTRIM(STR(FIELDGET(j)))) TO tmp
DBGOBOTTOM();at4[j,3] = LEN(ALLTRIM(STR(FIELDGET(j))))
CASE VALTYPE(mVal) = 'C'
INDEX ON LEN(ALLTRIM(FIELDGET(j))) TO tmp
DBGOBOTTOM();at4[j,3] = LEN(ALLTRIM(FIELDGET(j)))
CASE VALTYPE(mVal) = 'D'
DBGOBOTTOM();at4[j,3] = 8
ENDCASE
NEXT
CLOSE ALL
aStructure := {}
* | N | Имя поля | Тип | Ширина | Дес. |
AADD(aStructure, { 'Object', 'C', 60, 0 }) // Объект
**** Классы ****
AADD(aStructure, { 'Exp_tim_card', 'N', 8, 0 }) // Срок экспирации карты
AADD(aStructure, { 'Act_dur_card', 'N', 8, 0 }) // Фактическая длительность действия
карты
AADD(aStructure, { 'Pla_dur_cont', 'N', 8, 0 }) // Планируемая длительность действия
договора
AADD(aStructure, { 'Act_dur_cont', 'N', 8, 0 }) // Фактическая длительность действия
договора
**** Массив имен полей из t1, t2, t3, t4, не включаемых в Inp_data.dbf
* aDF := {'tn2', 'tn9', 'tn10', 'tn11', 'tn12', 'tn13', 'tn14', 't3n3', t3n7', t3n8', 't3n9',
't3n11', 't3n12', 't4n2' } // ##############
FOR j=3 TO LEN(at1);AADD(aStructure, { 't1'+at1[j,1], at1[j,2], at1[j,3], 0 });NEXT
FOR j=2 TO LEN(at2);AADD(aStructure, { 't2'+at2[j,1], at2[j,2], at2[j,3], 0 });NEXT
FOR j=2 TO LEN(at3);AADD(aStructure, { 't3'+at3[j,1], at3[j,2], at3[j,3], 0 });NEXT
FOR j=2 TO LEN(at4);AADD(aStructure, { 't4'+at4[j,1], at4[j,2], at4[j,3], 0 });NEXT
DbCreate( 'Inp_data.dbf', aStructure )
DC_Impl(oScrn)
* 3. Заполнить БД Inp_data.dbf данными из БД: t1.dbf, t2.dbf, t3.dbf, t4.dbf
oScrn := DC_WaitOn( 'Заполнение БД Inp_data.dbf данными из БД: t1.dbf, t2.dbf, t3.dbf,
t4.dbf' )
***** Индексация БД t1.dbf, t2.dbf, t3.dbf, t4.dbf
CLOSE ALL;USE t1 EXCLUSIVE NEW;INDEX ON N2 TO t1
CLOSE ALL;USE t2 EXCLUSIVE NEW;INDEX ON N1 TO t2
CLOSE ALL;USE t3 EXCLUSIVE NEW;INDEX ON N1 TO t3
CLOSE ALL;USE t4 EXCLUSIVE NEW;INDEX ON N1 TO t4
CLOSE ALL
USE Inp_data EXCLUSIVE NEW
USE t1 INDEX t1 EXCLUSIVE NEW
USE t2 INDEX t2 EXCLUSIVE NEW
USE t3 INDEX t3 EXCLUSIVE NEW
USE t4 INDEX t4 EXCLUSIVE NEW
SELECT t1
SET ORDER TO 1
DBGOTOP()
DO WHILE .NOT. EOF()
31
SELECT t1
aRt1 := {}
FOR j=1 TO FCOUNT()
AADD(aRt1, FIELDGET(j))
NEXT
SELECT t2;SET ORDER TO 1;fT2=DBSEEK(aRt1[2])
IF fT2
aRt2 := {}
FOR j=1 TO FCOUNT()
AADD(aRt2, FIELDGET(j))
NEXT
ENDIF
SELECT t3;SET ORDER TO 1;fT3=DBSEEK(aRt1[2])
IF fT3
aRt3 := {}
FOR j=1 TO FCOUNT()
AADD(aRt3, FIELDGET(j))
NEXT
ENDIF
SELECT t4;SET ORDER TO 1;fT4=DBSEEK(aRt1[2])
IF fT4
aRt4 := {}
FOR j=1 TO FCOUNT()
AADD(aRt4, FIELDGET(j))
NEXT
ENDIF
mFlagErr = .F.
mN_Error = 0
IF fT2 .AND. fT3 .AND. fT4
mPos = 1
SELECT Inp_data
APPEND BLANK
FIELDPUT(mPos++, aRt1[1]+', ID='+aRt1[2]) // Отчётный месяц и ID
клиента (ОБЪЕКТ)
*********************************************
******* КЛАССЫ ******************************
*********************************************
******* Таблица 2: Карты ********************
IF VALTYPE(CTOD(aRt2[11])) = 'D' .AND. VALTYPE(CTOD(aRt2[10])) = 'D'
mLong = CTOD(aRt2[11]) - CTOD(aRt2[10]);FIELDPUT(mPos++, IF(mLong>0,mLong,0))
// Срок экспирации карты = Дата экспирации карты - Дата открытия карты
mLong = CTOD(aRt2[12]) - CTOD(aRt2[10]);FIELDPUT(mPos++, IF(mLong>0,mLong,0))
// Фактическая длительность действия карты = Фактическая дата закрытия - Дата открытия карты
ELSE
FIELDPUT(mPos++, 0)
// Срок экспирации карты = Дата экспирации карты - Дата открытия карты
FIELDPUT(mPos++, 0)
// Фактическая длительность действия карты = Фактическая дата закрытия - Дата открытия карты
ENDIF
******* Таблица 3: Договоры *****************
IF VALTYPE(CTOD(aRt3[8])) = 'D' .AND. VALTYPE(CTOD(aRt3[9])) = 'D'
mLong = CTOD(aRt3[8]) - CTOD(aRt3[7]);FIELDPUT(mPos++, IF(mLong>0,mLong,0))
// Планируемая длительность действия договора = Планируемая дата закрытия договора - Дата
открытия договора
mLong = CTOD(aRt3[9]) - CTOD(aRt3[7]);FIELDPUT(mPos++, IF(mLong>0,mLong,0))
// Фактическая длительность действия договора = Фактическая дата закрытия договора - Дата
открытия договора
ELSE
FIELDPUT(mPos++, 0)
// Срок экспирации карты = Дата экспирации карты - Дата открытия карты
FIELDPUT(mPos++, 0)
// Фактическая длительность действия карты = Фактическая дата закрытия - Дата открытия карты
ENDIF
*********************************************
32
******* ФАКТОРЫ *****************************
*********************************************
FOR j=3 TO LEN(aRt1)
FIELDPUT(mPos++, aRt1[j])
NEXT
FOR j=2 TO LEN(aRt2)
FIELDPUT(mPos++, aRt2[j])
NEXT
FOR j=2 TO LEN(aRt3)
FIELDPUT(mPos++, aRt3[j])
NEXT
FOR j=2 TO LEN(aRt4)
FIELDPUT(mPos++, aRt4[j])
NEXT
ELSE
mFlagErr = .T.
mN_Error++
ENDIF
SELECT t1
SET ORDER TO 1
DBSKIP(1)
ENDDO
CLOSE ALL
DC_Impl(oScrn)
IF mFlagErr
LB_Warning('Создание БД Inp_data.dbf из файлов: t1.xlsx, t2.xlsx, t3.xlsx, t4.xlsx
завершено. Обнаружено '+ALLTRIM(STR(mN_Error))+' ошибок')
ELSE
LB_Warning('Создание БД Inp_data.dbf из файлов: t1.xlsx, t2.xlsx, t3.xlsx, t4.xlsx
завершено успешно!')
ENDIF
RETURN NIL
Данный исходный текст включен в исходный текст системы
«Эйдос»: http://lc.kubagro.ru/_AIDOS-X.txt как функция F2_3_2_10(),
запуск которой обеспечивается непосредственно из главного меню
системы (рисунок 9). Чтобы найти эту функцию в исходном тексте
системы «Эйдос», открываемом по приведенной сслыке, надо просто
нажать: Ctrl+F и в паявшемся окошке поиска ввести: «N F2_3_2_10
«(рисунок 10):
33
Рисунок 10. Экранная форма браузера с поиском функции 2.3.2.10
в исходном тексте системы «Эйдос»: http://lc.kubagro.ru/_AIDOS-X.txt
В результате работы программного интерфейса 2.3.2.10 формируется
файл исходных данных Inp_data.dbf, объединяющий по ID клиента всю
информацию о нем из таблиц t1, t2, t3, t4 (рисунок 11):
Рисунок 11. Исходные данные (Inp_data.dbf),
формируемые API_2.3.2.10 (фрагмент)
34
3.5. Универсальный программный интерфейс (API) системы
«Эйдос» для ввода данных из внешних источников данных типа
таблиц MS Excel
В системе «Эйдос» есть универсальный программный интерфейс
(API) для ввода данных из внешних источников данных типа таблиц MS
Excel.
На рисунке 12 приведена экранная форма этого интерфейса с
параметрами, с которыми он был запущен для ввода данных в систему
«Эйдос» из базы данных Inp_data.dbf, созданной программным
интерфейсом 2.3.2.10, описанным в предыдущем разделе. Файлы
«Inp_data.dbf» с данными и «Inp_name.txt» с сокращенными
наименованиями шкал (таблица 5) должны быть в папке: «..\Aidos-
X\AID_DATA\Inp_data\».
Рисунок 12. Экранная форма программного интерфейса (API)
системы «Эйдос» для ввода данных из внешних таблиц MS Excel
35
Отметим, что задана опция считать нули данными, а не их
отсутствием и отменено формирование базы данных Inp_davr.dbf, которое
занимает довольно много времени на огромном объеме исходных данных и
не является принципиальным для решения поставленной задачи. Вместо
описания данного API приведем ниже его HELP (рисунок 13):
Рисунок 13. Экранная форма HELP программного интерфейса (API)
системы «Эйдос» для ввода данных из внешних таблиц MS Excel
Данный программный интерфейс имеет развитие средства анализа
корректности исходных данных. В результате его применения
непосредственно на исходных данных, по причине отсутствия в них
36
вариабельности значений не были созданы описательные шкалы,
информация о которых приведена на рисунке 14.
Рисунок 14. Экранная форма HELP программного интерфейса (API)
системы «Эйдос» для ввода данных из внешних таблиц MS Excel
После этого программный интерфейс находит в базе исходных
данных Inp_data.dbf классификационные и описательные шкалы и
градации, и, если среди них есть числовые по типу данных, то запрашивает
число интервальных числовых значений, на которое разбивать диапазон
изменения значений числовой шкалы (рисунок 15):
Рисунок 15. Внутренний калькулятор API_2.3.2.2 системы «Эйдос»
После запуска API_2.3.2.2 с параметрами, приведенными на
рисунках 12 и 15 начинается процесс формализации предметной области,
включающий разработку классификационных и описательных шкал и
37
градаций и кодирование с их помощью исходных данных, в результате
чего формируется база событий (обучающая выборка). По сути этот
процесс представляет собой нормализацию базы исходных данных, но уже
не по ID клиента, а по значениям факторов и классам. Этапы и стадия
исполнения которого показана на рисунке 16:
Рисунок 16. Экранная форма отображения этапов и стадии
процесса формализации предметной области
Отметим, что в связи с огромным объемом исходных данных,
содержащих описание 825892 клиентов банка в 4 классификационных и
112 описательных шкалах, этот процесс занимает довольно длительное
время: 8 часов 54 минуты 3 секунды, даже на процессоре i7 и SSD диске.
При выходе на формирование моделей API_2.3.2.2 автоматически
дал результаты, приведенные на рисунке 16 и ниже в последующих
разделах.
3.6. Классификационные шкалы и градации
В для создания моделей используется четыре классификационных
шкалы по 3 интервальных числовых значения (класса) в каждой, всего 12
классов (таблица 6):
Таблица 6 – Классификационные шкалы и градации (классы)
KOD_CLS
NAME_CLS
1
СРОК ЭКСПИРАЦИИ КАРТЫ-1/3-{0.0, 1222.7}
2
СРОК ЭКСПИРАЦИИ КАРТЫ-2/3-{1222.7, 2445.3}
3
СРОК ЭКСПИРАЦИИ КАРТЫ-3/3-{2445.3, 3668.0}
4
ФАКТ.ДЛИТ.ИСП.КАРТЫ-1/3-{0.0, 2074.3}
5
ФАКТ.ДЛИТ.ИСП.КАРТЫ-2/3-{2074.3, 4148.7}
6
ФАКТ.ДЛИТ.ИСП.КАРТЫ-3/3-{4148.7, 6223.0}
7
ПЛАН.ДЛИТ.ДЕЙСТ.ДОГОВОРА-1/3-{0.0, 3656.0}
8
ПЛАН.ДЛИТ.ДЕЙСТ.ДОГОВОРА-2/3-{3656.0, 7312.0}
9
ПЛАН.ДЛИТ.ДЕЙСТ.ДОГОВОРА-3/3-{7312.0, 10968.0}
10
ФАКТ.ДЛИТ.ДЕЙСТ.ДОГОВОРА-1/3-{0.0, 1710.3}
11
ФАКТ.ДЛИТ.ДЕЙСТ.ДОГОВОРА-2/3-{1710.3, 3420.7}
12
ФАКТ.ДЛИТ.ДЕЙСТ.ДОГОВОРА-3/3-{3420.7, 5131.0}
38
3.7. Описательные шкалы и градации
В для создания моделей используется 112 описательных шкал с
суммарным числом градаций 349 (таблица 7):
Таблица 7 –Описательные шкалы и градации
KOD_ATR
NAME_ATR
1
МЕТКА АКТ. ПО ТЕК.ОПР.БАНКА-1/3-{0.0000000, 0.3333333}
2
МЕТКА АКТ. ПО ТЕК.ОПР.БАНКА-2/3-{0.3333333, 0.6666667}
3
МЕТКА АКТ. ПО ТЕК.ОПР.БАНКА-3/3-{0.6666667, 1.0000000}
4
ЧИСЛО ТРАНЗАКЦИЙ-1/3-{0.0000000, 88.6666667}
5
ЧИСЛО ТРАНЗАКЦИЙ-2/3-{88.6666667, 177.3333333}
6
ЧИСЛО ТРАНЗАКЦИЙ-3/3-{177.3333333, 266.0000000}
7
ЧИСЛО POS ТР-Й-1/3-{-7.0000000, 84.0000000}
8
ЧИСЛО POS ТР-Й-2/3-{84.0000000, 175.0000000}
9
ЧИСЛО POS ТР-Й-3/3-{175.0000000, 266.0000000}
10
ЧИСЛО ATM ТР-Й-1/3-{0.0000000, 31.6666667}
11
ЧИСЛО ATM ТР-Й-2/3-{31.6666667, 63.3333333}
12
ЧИСЛО ATM ТР-Й-3/3-{63.3333333, 95.0000000}
13
ЧИС.ТР.В КАТ.АВИАБИЛЕТЫ-1/3-{0.0000000, 4.6666667}
14
ЧИС.ТР.В КАТ.АВИАБИЛЕТЫ-2/3-{4.6666667, 9.3333333}
15
ЧИС.ТР.В КАТ.АВИАБИЛЕТЫ-3/3-{9.3333333, 14.0000000}
16
ЧИС.ТР.В КАТ.АВТОУСЛУГИ-1/3-{0.0000000, 15.0000000}
17
ЧИС.ТР.В КАТ.АВТОУСЛУГИ-2/3-{15.0000000, 30.0000000}
18
ЧИС.ТР.В КАТ.АВТОУСЛУГИ-3/3-{30.0000000, 45.0000000}
19
ЧИС.ТР.В КАТ.АПТЕКИ-1/3-{0.0000000, 16.0000000}
20
ЧИС.ТР.В КАТ.АПТЕКИ-2/3-{16.0000000, 32.0000000}
21
ЧИС.ТР.В КАТ.АПТЕКИ-3/3-{32.0000000, 48.0000000}
22
ЧИС.ТР.В КАТ.АРЕНДА АВТО-1/3-{0.0000000, 16.0000000}
23
ЧИС.ТР.В КАТ.АРЕНДА АВТО-2/3-{16.0000000, 32.0000000}
24
ЧИС.ТР.В КАТ.АРЕНДА АВТО-3/3-{32.0000000, 48.0000000}
25
ЧИС.ТР.В КАТ.ГОС.УСЛУГИ-1/3-{0.0000000, 7.6666667}
26
ЧИС.ТР.В КАТ.ГОС.УСЛУГИ-2/3-{7.6666667, 15.3333333}
27
ЧИС.ТР.В КАТ.ГОС.УСЛУГИ-3/3-{15.3333333, 23.0000000}
28
ЧИС.ТР.В КАТ.ДОМ И РЕМОНТ-1/3-{0.0000000, 18.6666667}
29
ЧИС.ТР.В КАТ.ДОМ И РЕМОНТ-2/3-{18.6666667, 37.3333333}
30
ЧИС.ТР.В КАТ.ДОМ И РЕМОНТ-3/3-{37.3333333, 56.0000000}
31
ЧИС.ТР.В КАТ.ДРУГОЕ-1/3-{0.0000000, 56.3333333}
32
ЧИС.ТР.В КАТ.ДРУГОЕ-2/3-{56.3333333, 112.6666667}
33
ЧИС.ТР.В КАТ.ДРУГОЕ-3/3-{112.6666667, 169.0000000}
34
ЧИС.ТР.В КАТ.Ж/Д БИЛЕТЫ-1/3-{0.0000000, 7.3333333}
35
ЧИС.ТР.В КАТ.Ж/Д БИЛЕТЫ-2/3-{7.3333333, 14.6666667}
36
ЧИС.ТР.В КАТ.Ж/Д БИЛЕТЫ-3/3-{14.6666667, 22.0000000}
37
ЧИС.ТР.В КАТ.ЗООМАГАЗИНЫ-1/3-{0.0000000, 3.3333333}
38
ЧИС.ТР.В КАТ.ЗООМАГАЗИНЫ-2/3-{3.3333333, 6.6666667}
39
ЧИС.ТР.В КАТ.ЗООМАГАЗИНЫ-3/3-{6.6666667, 10.0000000}
40
ЧИС.ТР.В КАТ.ИГРЫ-1/3-{0.0000000, 45.3333333}
41
ЧИС.ТР.В КАТ.ИГРЫ-2/3-{45.3333333, 90.6666667}
42
ЧИС.ТР.В КАТ.ИГРЫ-3/3-{90.6666667, 136.0000000}
43
ЧИС.ТР.В КАТ.ИСКУССТВО-1/3-{0.0000000, 3.0000000}
44
ЧИС.ТР.В КАТ.ИСКУССТВО-2/3-{3.0000000, 6.0000000}
45
ЧИС.ТР.В КАТ.ИСКУССТВО-3/3-{6.0000000, 9.0000000}
46
ЧИС.ТР.В КАТ.КВАЗИКЭШ-1/3-{0.0000000, 77.0000000}
47
ЧИС.ТР.В КАТ.КВАЗИКЭШ-2/3-{77.0000000, 154.0000000}
48
ЧИС.ТР.В КАТ.КВАЗИКЭШ-3/3-{154.0000000, 231.0000000}
49
ЧИС.ТР.В КАТ.КИНО-1/3-{0.0000000, 7.0000000}
50
ЧИС.ТР.В КАТ.КИНО-2/3-{7.0000000, 14.0000000}
51
ЧИС.ТР.В КАТ.КИНО-3/3-{14.0000000, 21.0000000}
52
ЧИС.ТР.В КАТ.КНИГИ-1/3-{0.0000000, 10.0000000}
53
ЧИС.ТР.В КАТ.КНИГИ-2/3-{10.0000000, 20.0000000}
54
ЧИС.ТР.В КАТ.КНИГИ-3/3-{20.0000000, 30.0000000}
55
ЧИС.ТР.В КАТ.КОММ.УСЛУГИ-1/3-{0.0000000, 18.3333333}
56
ЧИС.ТР.В КАТ.КОММ.УСЛУГИ-2/3-{18.3333333, 36.6666667}
57
ЧИС.ТР.В КАТ.КОММ.УСЛУГИ-3/3-{36.6666667, 55.0000000}
58
ЧИС.ТР.В КАТ.КРАСОТА-1/3-{0.0000000, 6.6666667}
59
ЧИС.ТР.В КАТ.КРАСОТА-2/3-{6.6666667, 13.3333333}
60
ЧИС.ТР.В КАТ.КРАСОТА-3/3-{13.3333333, 20.0000000}
61
ЧИС.ТР.В КАТ.МЕДИЦИНА-1/3-{0.0000000, 8.6666667}
62
ЧИС.ТР.В КАТ.МЕДИЦИНА-2/3-{8.6666667, 17.3333333}
63
ЧИС.ТР.В КАТ.МЕДИЦИНА-3/3-{17.3333333, 26.0000000}
39
64
ЧИС.ТР.В КАТ.МУЗЫКА-1/3-{0.0000000, 11.6666667}
65
ЧИС.ТР.В КАТ.МУЗЫКА-2/3-{11.6666667, 23.3333333}
66
ЧИС.ТР.В КАТ.МУЗЫКА-3/3-{23.3333333, 35.0000000}
67
ЧИС.ТР.В КАТ.ОБРАЗОВАНИЕ-1/3-{0.0000000, 6.3333333}
68
ЧИС.ТР.В КАТ.ОБРАЗОВАНИЕ-2/3-{6.3333333, 12.6666667}
69
ЧИС.ТР.В КАТ.ОБРАЗОВАНИЕ-3/3-{12.6666667, 19.0000000}
70
ЧИС.ТР.В КАТ.ОДЕЖДА И ОБУВЬ-1/3-{0.0000000, 9.6666667}
71
ЧИС.ТР.В КАТ.ОДЕЖДА И ОБУВЬ-2/3-{9.6666667, 19.3333333}
72
ЧИС.ТР.В КАТ.ОДЕЖДА И ОБУВЬ-3/3-{19.3333333, 29.0000000}
73
ЧИС.ТР.В КАТ.ОТЕЛИ-1/3-{0.0000000, 9.0000000}
74
ЧИС.ТР.В КАТ.ОТЕЛИ-2/3-{9.0000000, 18.0000000}
75
ЧИС.ТР.В КАТ.ОТЕЛИ-3/3-{18.0000000, 27.0000000}
76
ЧИС.ТР.В КАТ.РАЗВЛЕЧЕНИЯ-1/3-{0.0000000, 9.0000000}
77
ЧИС.ТР.В КАТ.РАЗВЛЕЧЕНИЯ-2/3-{9.0000000, 18.0000000}
78
ЧИС.ТР.В КАТ.РАЗВЛЕЧЕНИЯ-3/3-{18.0000000, 27.0000000}
79
ЧИС.ТР.В КАТ.РЕСТОРАНЫ И ФАСТ-ФУД-1/3-{0.0000000, 27.6666667}
80
ЧИС.ТР.В КАТ.РЕСТОРАНЫ И ФАСТ-ФУД-2/3-{27.6666667, 55.3333333}
81
ЧИС.ТР.В КАТ.РЕСТОРАНЫ И ФАСТ-ФУД-3/3-{55.3333333, 83.0000000}
82
ЧИС.ТР.В КАТ.СПОРТТОВАРЫ-1/3-{0.0000000, 6.0000000}
83
ЧИС.ТР.В КАТ.СПОРТТОВАРЫ-2/3-{6.0000000, 12.0000000}
84
ЧИС.ТР.В КАТ.СПОРТТОВАРЫ-3/3-{12.0000000, 18.0000000}
85
ЧИС.ТР.В КАТ.СУПЕРМАРКЕТЫ-1/3-{0.0000000, 42.3333333}
86
ЧИС.ТР.В КАТ.СУПЕРМАРКЕТЫ-2/3-{42.3333333, 84.6666667}
87
ЧИС.ТР.В КАТ.СУПЕРМАРКЕТЫ-3/3-{84.6666667, 127.0000000}
88
ЧИС.ТР.В КАТ.ТЕЛЕКОМ-1/3-{0.0000000, 13.3333333}
89
ЧИС.ТР.В КАТ.ТЕЛЕКОМ-2/3-{13.3333333, 26.6666667}
90
ЧИС.ТР.В КАТ.ТЕЛЕКОМ-3/3-{26.6666667, 40.0000000}
91
ЧИС.ТР.В КАТ.ТОПЛИВО-1/3-{0.0000000, 16.6666667}
92
ЧИС.ТР.В КАТ.ТОПЛИВО-2/3-{16.6666667, 33.3333333}
93
ЧИС.ТР.В КАТ.ТОПЛИВО-3/3-{33.3333333, 50.0000000}
94
ЧИС.ТР.В КАТ.ТРАНСПОРТ-1/3-{0.0000000, 25.3333333}
95
ЧИС.ТР.В КАТ.ТРАНСПОРТ-2/3-{25.3333333, 50.6666667}
96
ЧИС.ТР.В КАТ.ТРАНСПОРТ-3/3-{50.6666667, 76.0000000}
97
ЧИС.ТР.В КАТ.ЦВЕТЫ-1/3-{0.0000000, 4.6666667}
98
ЧИС.ТР.В КАТ.ЦВЕТЫ-2/3-{4.6666667, 9.3333333}
99
ЧИС.ТР.В КАТ.ЦВЕТЫ-3/3-{9.3333333, 14.0000000}
100
ЧИС.ТР.В КАТ.ЮВЕЛИРНАЯ ПРОДУКЦИЯ-1/3-{0.0000000, 4.6666667}
101
ЧИС.ТР.В КАТ.ЮВЕЛИРНАЯ ПРОДУКЦИЯ-2/3-{4.6666667, 9.3333333}
102
ЧИС.ТР.В КАТ.ЮВЕЛИРНАЯ ПРОДУКЦИЯ-3/3-{9.3333333, 14.0000000}
103
ЧИС.ТР.В КАТ.DUTY FREE-1/3-{0.0000000, 2.0000000}
104
ЧИС.ТР.В КАТ.DUTY FREE-2/3-{2.0000000, 4.0000000}
105
ЧИС.ТР.В КАТ.DUTY FREE-3/3-{4.0000000, 6.0000000}
106
СУММА ТРАНЗАКЦИЙ-1/3-{0.0000000, 1553866.6666667}
107
СУММА ТРАНЗАКЦИЙ-2/3-{1553866.6666667, 3107733.3333333}
108
СУММА ТРАНЗАКЦИЙ-3/3-{3107733.3333333, 4661600.0000000}
109
СУММА POS ТР-Й-1/3-{-100.0000000, 1364566.6666667}
110
СУММА POS ТР-Й-2/3-{1364566.6666667, 2729233.3333333}
111
СУММА POS ТР-Й-3/3-{2729233.3333333, 4093900.0000000}
112
СУММА ATM ТР-Й-1/3-{0.0000000, 1553866.6666667}
113
СУММА ATM ТР-Й-2/3-{1553866.6666667, 3107733.3333333}
114
СУММА ATM ТР-Й-3/3-{3107733.3333333, 4661600.0000000}
115
СУМ.ТР.В КАТ.АВИАБИЛЕТЫ-1/3-{0.0000000, 121666.6666667}
116
СУМ.ТР.В КАТ.АВИАБИЛЕТЫ-2/3-{121666.6666667, 243333.3333333}
117
СУМ.ТР.В КАТ.АВИАБИЛЕТЫ-3/3-{243333.3333333, 365000.0000000}
118
СУМ.ТР.В КАТ.АВТОУСЛУГИ-1/3-{0.0000000, 383266.6666667}
119
СУМ.ТР.В КАТ.АВТОУСЛУГИ-2/3-{383266.6666667, 766533.3333333}
120
СУМ.ТР.В КАТ.АВТОУСЛУГИ-3/3-{766533.3333333, 1149800.0000000}
121
СУМ.ТР.В КАТ.АПТЕКИ-1/3-{0.0000000, 73266.6666667}
122
СУМ.ТР.В КАТ.АПТЕКИ-2/3-{73266.6666667, 146533.3333333}
123
СУМ.ТР.В КАТ.АПТЕКИ-3/3-{146533.3333333, 219800.0000000}
124
СУМ.ТР.В КАТ.АРЕНДА АВТО-1/3-{0.0000000, 66666.6666667}
125
СУМ.ТР.В КАТ.АРЕНДА АВТО-2/3-{66666.6666667, 133333.3333333}
126
СУМ.ТР.В КАТ.АРЕНДА АВТО-3/3-{133333.3333333, 200000.0000000}
127
СУМ.ТР.В КАТ.ГОС.УСЛУГИ-1/3-{0.0000000, 104366.6666667}
128
СУМ.ТР.В КАТ.ГОС.УСЛУГИ-2/3-{104366.6666667, 208733.3333333}
129
СУМ.ТР.В КАТ.ГОС.УСЛУГИ-3/3-{208733.3333333, 313100.0000000}
130
СУМ.ТР.В КАТ.ДОМ И РЕМОНТ-1/3-{0.0000000, 992700.0000000}
131
СУМ.ТР.В КАТ.ДОМ И РЕМОНТ-2/3-{992700.0000000, 1985400.0000000}
132
СУМ.ТР.В КАТ.ДОМ И РЕМОНТ-3/3-{1985400.0000000, 2978100.0000000}
133
СУМ.ТР.В КАТ.ДРУГОЕ-1/3-{0.0000000, 1350266.6666667}
134
СУМ.ТР.В КАТ.ДРУГОЕ-2/3-{1350266.6666667, 2700533.3333333}
135
СУМ.ТР.В КАТ.ДРУГОЕ-3/3-{2700533.3333333, 4050800.0000000}
40
136
СУМ.ТР.В КАТ.Ж/Д БИЛЕТЫ-1/3-{0.0000000, 42166.6666667}
137
СУМ.ТР.В КАТ.Ж/Д БИЛЕТЫ-2/3-{42166.6666667, 84333.3333333}
138
СУМ.ТР.В КАТ.Ж/Д БИЛЕТЫ-3/3-{84333.3333333, 126500.0000000}
139
СУМ.ТР.В КАТ.ЗООМАГАЗИНЫ-1/3-{0.0000000, 8900.0000000}
140
СУМ.ТР.В КАТ.ЗООМАГАЗИНЫ-2/3-{8900.0000000, 17800.0000000}
141
СУМ.ТР.В КАТ.ЗООМАГАЗИНЫ-3/3-{17800.0000000, 26700.0000000}
142
СУМ.ТР.В КАТ.ИГРЫ-1/3-{0.0000000, 73266.6666667}
143
СУМ.ТР.В КАТ.ИГРЫ-2/3-{73266.6666667, 146533.3333333}
144
СУМ.ТР.В КАТ.ИГРЫ-3/3-{146533.3333333, 219800.0000000}
145
СУМ.ТР.В КАТ.ИСКУССТВО-1/3-{0.0000000, 197166.6666667}
146
СУМ.ТР.В КАТ.ИСКУССТВО-2/3-{197166.6666667, 394333.3333333}
147
СУМ.ТР.В КАТ.ИСКУССТВО-3/3-{394333.3333333, 591500.0000000}
148
СУМ.ТР.В КАТ.КВАЗИКЭШ-1/3-{0.0000000, 1553866.6666667}
149
СУМ.ТР.В КАТ.КВАЗИКЭШ-2/3-{1553866.6666667, 3107733.3333333}
150
СУМ.ТР.В КАТ.КВАЗИКЭШ-3/3-{3107733.3333333, 4661600.0000000}
151
СУМ.ТР.В КАТ.КИНО-1/3-{0.0000000, 36366.6666667}
152
СУМ.ТР.В КАТ.КИНО-2/3-{36366.6666667, 72733.3333333}
153
СУМ.ТР.В КАТ.КИНО-3/3-{72733.3333333, 109100.0000000}
154
СУМ.ТР.В КАТ.КНИГИ-1/3-{0.0000000, 105600.0000000}
155
СУМ.ТР.В КАТ.КНИГИ-2/3-{105600.0000000, 211200.0000000}
156
СУМ.ТР.В КАТ.КНИГИ-3/3-{211200.0000000, 316800.0000000}
157
СУМ.ТР.В КАТ.КОММ.УСЛУГИ-1/3-{0.0000000, 66900.0000000}
158
СУМ.ТР.В КАТ.КОММ.УСЛУГИ-2/3-{66900.0000000, 133800.0000000}
159
СУМ.ТР.В КАТ.КОММ.УСЛУГИ-3/3-{133800.0000000, 200700.0000000}
160
СУМ.ТР.В КАТ.КРАСОТА-1/3-{0.0000000, 63633.3333333}
161
СУМ.ТР.В КАТ.КРАСОТА-2/3-{63633.3333333, 127266.6666667}
162
СУМ.ТР.В КАТ.КРАСОТА-3/3-{127266.6666667, 190900.0000000}
163
СУМ.ТР.В КАТ.МЕДИЦИНА-1/3-{0.0000000, 192600.0000000}
164
СУМ.ТР.В КАТ.МЕДИЦИНА-2/3-{192600.0000000, 385200.0000000}
165
СУМ.ТР.В КАТ.МЕДИЦИНА-3/3-{385200.0000000, 577800.0000000}
166
СУМ.ТР.В КАТ.МУЗЫКА-1/3-{0.0000000, 40900.0000000}
167
СУМ.ТР.В КАТ.МУЗЫКА-2/3-{40900.0000000, 81800.0000000}
168
СУМ.ТР.В КАТ.МУЗЫКА-3/3-{81800.0000000, 122700.0000000}
169
СУМ.ТР.В КАТ.ОБРАЗОВАНИЕ-1/3-{0.0000000, 196733.3333333}
170
СУМ.ТР.В КАТ.ОБРАЗОВАНИЕ-2/3-{196733.3333333, 393466.6666667}
171
СУМ.ТР.В КАТ.ОБРАЗОВАНИЕ-3/3-{393466.6666667, 590200.0000000}
172
СУМ.ТР.В КАТ.ОДЕЖДА И ОБУВЬ-1/3-{0.0000000, 241166.6666667}
173
СУМ.ТР.В КАТ.ОДЕЖДА И ОБУВЬ-2/3-{241166.6666667, 482333.3333333}
174
СУМ.ТР.В КАТ.ОДЕЖДА И ОБУВЬ-3/3-{482333.3333333, 723500.0000000}
175
СУМ.ТР.В КАТ.ОТЕЛИ-1/3-{0.0000000, 241533.3333333}
176
СУМ.ТР.В КАТ.ОТЕЛИ-2/3-{241533.3333333, 483066.6666667}
177
СУМ.ТР.В КАТ.ОТЕЛИ-3/3-{483066.6666667, 724600.0000000}
178
СУМ.ТР.В КАТ.РАЗВЛЕЧЕНИЯ-1/3-{0.0000000, 58400.0000000}
179
СУМ.ТР.В КАТ.РАЗВЛЕЧЕНИЯ-2/3-{58400.0000000, 116800.0000000}
180
СУМ.ТР.В КАТ.РАЗВЛЕЧЕНИЯ-3/3-{116800.0000000, 175200.0000000}
181
СУМ.ТР.В КАТ.РЕСТОРАНЫ И ФАСТ-ФУД-1/3-{0.0000000, 102566.6666667}
182
СУМ.ТР.В КАТ.РЕСТОРАНЫ И ФАСТ-ФУД-2/3-{102566.6666667, 205133.3333333}
183
СУМ.ТР.В КАТ.РЕСТОРАНЫ И ФАСТ-ФУД-3/3-{205133.3333333, 307700.0000000}
184
СУМ.ТР.В КАТ.СПОРТТОВАРЫ-1/3-{0.0000000, 185866.6666667}
185
СУМ.ТР.В КАТ.СПОРТТОВАРЫ-2/3-{185866.6666667, 371733.3333333}
186
СУМ.ТР.В КАТ.СПОРТТОВАРЫ-3/3-{371733.3333333, 557600.0000000}
187
СУМ.ТР.В КАТ.СУПЕРМАРКЕТЫ-1/3-{0.0000000, 210800.0000000}
188
СУМ.ТР.В КАТ.СУПЕРМАРКЕТЫ-2/3-{210800.0000000, 421600.0000000}
189
СУМ.ТР.В КАТ.СУПЕРМАРКЕТЫ-3/3-{421600.0000000, 632400.0000000}
190
СУМ.ТР.В КАТ.ТЕЛЕКОМ-1/3-{0.0000000, 87433.3333333}
191
СУМ.ТР.В КАТ.ТЕЛЕКОМ-2/3-{87433.3333333, 174866.6666667}
192
СУМ.ТР.В КАТ.ТЕЛЕКОМ-3/3-{174866.6666667, 262300.0000000}
193
СУМ.ТР.В КАТ.ТОПЛИВО-1/3-{0.0000000, 63333.3333333}
194
СУМ.ТР.В КАТ.ТОПЛИВО-2/3-{63333.3333333, 126666.6666667}
195
СУМ.ТР.В КАТ.ТОПЛИВО-3/3-{126666.6666667, 190000.0000000}
196
СУМ.ТР.В КАТ.ТРАНСПОРТ-1/3-{0.0000000, 99966.6666667}
197
СУМ.ТР.В КАТ.ТРАНСПОРТ-2/3-{99966.6666667, 199933.3333333}
198
СУМ.ТР.В КАТ.ТРАНСПОРТ-3/3-{199933.3333333, 299900.0000000}
199
СУМ.ТР.В КАТ.ЦВЕТЫ-1/3-{0.0000000, 14300.0000000}
200
СУМ.ТР.В КАТ.ЦВЕТЫ-2/3-{14300.0000000, 28600.0000000}
201
СУМ.ТР.В КАТ.ЦВЕТЫ-3/3-{28600.0000000, 42900.0000000}
202
СУМ.ТР.В КАТ.ЮВЕЛИРНАЯ ПРОДУКЦИЯ-1/3-{0.0000000, 268833.3333333}
203
СУМ.ТР.В КАТ.ЮВЕЛИРНАЯ ПРОДУКЦИЯ-2/3-{268833.3333333, 537666.6666667}
204
СУМ.ТР.В КАТ.ЮВЕЛИРНАЯ ПРОДУКЦИЯ-3/3-{537666.6666667, 806500.0000000}
205
СУМ.ТР.В КАТ.DUTY FREE-1/3-{0.0000000, 93200.0000000}
206
СУМ.ТР.В КАТ.DUTY FREE-2/3-{93200.0000000, 186400.0000000}
207
СУМ.ТР.В КАТ.DUTY FREE-3/3-{186400.0000000, 279600.0000000}
41
208
ОБОРОТЫ ПО СЧЁТУ-1/3-{-21000.0000000, 90313333.3333334}
209
ОБОРОТЫ ПО СЧЁТУ-2/3-{90313333.3333334, 180647666.6666668}
210
ОБОРОТЫ ПО СЧЁТУ-3/3-{180647666.6666668, 270982000.0000002}
211
СУММА ЗАЧ.ЗАР.ПЛАТЫ-1/3-{0.0000000, 166666.6666667}
212
СУММА ЗАЧ.ЗАР.ПЛАТЫ-2/3-{166666.6666667, 333333.3333333}
213
СУММА ЗАЧ.ЗАР.ПЛАТЫ-3/3-{333333.3333333, 500000.0000000}
214
ЧИСЛО АВТ-Й В ДБО ЧЕРЕЗ САЙТ-1/3-{0.0000000, 0.3333333}
215
ЧИСЛО АВТ-Й В ДБО ЧЕРЕЗ САЙТ-2/3-{0.3333333, 0.6666667}
216
ЧИСЛО АВТ-Й В ДБО ЧЕРЕЗ САЙТ-3/3-{0.6666667, 1.0000000}
217
ЧИСЛО АВТ-Й В ДБО ЧЕРЕЗ МОБ.БАНК-1/3-{0.0000000, 0.3333333}
218
ЧИСЛО АВТ-Й В ДБО ЧЕРЕЗ МОБ.БАНК-2/3-{0.3333333, 0.6666667}
219
ЧИСЛО АВТ-Й В ДБО ЧЕРЕЗ МОБ.БАНК-3/3-{0.6666667, 1.0000000}
220
ЧИС.ОПЕР.В ДБО-1/3-{0.0000000, 232.3333333}
221
ЧИС.ОПЕР.В ДБО-2/3-{232.3333333, 464.6666667}
222
ЧИС.ОПЕР.В ДБО-3/3-{464.6666667, 697.0000000}
223
ЧИСЛО ПЕР.В ДБО-1/3-{0.0000000, 158.0000000}
224
ЧИСЛО ПЕР.В ДБО-2/3-{158.0000000, 316.0000000}
225
ЧИСЛО ПЕР.В ДБО-3/3-{316.0000000, 474.0000000}
226
ЧИСЛО ПЛАТ.В ДБО-1/3-{0.0000000, 75.3333333}
227
ЧИСЛО ПЛАТ.В ДБО-2/3-{75.3333333, 150.6666667}
228
ЧИСЛО ПЛАТ.В ДБО-3/3-{150.6666667, 226.0000000}
229
ЧИС.ПЛАТ.В ДБО В КАТ.СОТОВАЯ СВЯЗЬ-1/3-{0.0000000, 34.0000000}
230
ЧИС.ПЛАТ.В ДБО В КАТ.СОТОВАЯ СВЯЗЬ-2/3-{34.0000000, 68.0000000}
231
ЧИС.ПЛАТ.В ДБО В КАТ.СОТОВАЯ СВЯЗЬ-3/3-{68.0000000, 102.0000000}
232
ЧИС.ПЛАТ.В ДБО В КАТ.ЖКХ-1/3-{0.0000000, 56.3333333}
233
ЧИС.ПЛАТ.В ДБО В КАТ.ЖКХ-2/3-{56.3333333, 112.6666667}
234
ЧИС.ПЛАТ.В ДБО В КАТ.ЖКХ-3/3-{112.6666667, 169.0000000}
235
ЧИС.ПЛАТ.В ДБО В КАТ.ИНТ./ТЕЛ./СВЯЗЬ-1/3-{0.0000000, 22.0000000}
236
ЧИС.ПЛАТ.В ДБО В КАТ.ИНТ./ТЕЛ./СВЯЗЬ-2/3-{22.0000000, 44.0000000}
237
ЧИС.ПЛАТ.В ДБО В КАТ.ИНТ./ТЕЛ./СВЯЗЬ-3/3-{44.0000000, 66.0000000}
238
ЧИС.ПЛАТ.В ДБО В КАТ.ОБРАЗОВАНИЕ-1/3-{0.0000000, 16.3333333}
239
ЧИС.ПЛАТ.В ДБО В КАТ.ОБРАЗОВАНИЕ-2/3-{16.3333333, 32.6666667}
240
ЧИС.ПЛАТ.В ДБО В КАТ.ОБРАЗОВАНИЕ-3/3-{32.6666667, 49.0000000}
241
ЧИС.ПЛАТ.В ДБО В КАТ.ЭЛЕКТР.КОШЕЛЬКИ-1/3-{0.0000000, 4.0000000}
242
ЧИС.ПЛАТ.В ДБО В КАТ.ЭЛЕКТР.КОШЕЛЬКИ-2/3-{4.0000000, 8.0000000}
243
ЧИС.ПЛАТ.В ДБО В КАТ.ЭЛЕКТР.КОШЕЛЬКИ-3/3-{8.0000000, 12.0000000}
244
ЧИС.ПЛАТ.В ДБО В КАТ.КРЕДИТ.ОРГАНИЗАЦИИ-1/3-{0.0000000, 6.0000000}
245
ЧИС.ПЛАТ.В ДБО В КАТ.КРЕДИТ.ОРГАНИЗАЦИИ-2/3-{6.0000000, 12.0000000}
246
ЧИС.ПЛАТ.В ДБО В КАТ.КРЕДИТ.ОРГАНИЗАЦИИ-3/3-{12.0000000, 18.0000000}
247
ЧИС.ПЛАТ.В ДБО В КАТ.НАЛОГИ/ПОШЛИНЫ-1/3-{0.0000000, 13.3333333}
248
ЧИС.ПЛАТ.В ДБО В КАТ.НАЛОГИ/ПОШЛИНЫ-2/3-{13.3333333, 26.6666667}
249
ЧИС.ПЛАТ.В ДБО В КАТ.НАЛОГИ/ПОШЛИНЫ-3/3-{26.6666667, 40.0000000}
250
ЧИС.ПЛАТ.В ДБО В КАТ.СТРАХОВАНИЕ-1/3-{0.0000000, 9.6666667}
251
ЧИС.ПЛАТ.В ДБО В КАТ.СТРАХОВАНИЕ-2/3-{9.6666667, 19.3333333}
252
ЧИС.ПЛАТ.В ДБО В КАТ.СТРАХОВАНИЕ-3/3-{19.3333333, 29.0000000}
253
ЧИС.ПЛАТ.В ДБО В КАТ.MLM (СЕТ.ПРОДАЖИ)-1/3-{0.0000000, 12.6666667}
254
ЧИС.ПЛАТ.В ДБО В КАТ.MLM (СЕТ.ПРОДАЖИ)-2/3-{12.6666667, 25.3333333}
255
ЧИС.ПЛАТ.В ДБО В КАТ.MLM (СЕТ.ПРОДАЖИ)-3/3-{25.3333333, 38.0000000}
256
ЧИС.ПЛАТ.В ДБО В КАТ.ДРУГОЕ-1/3-{0.0000000, 55.6666667}
257
ЧИС.ПЛАТ.В ДБО В КАТ.ДРУГОЕ-2/3-{55.6666667, 111.3333333}
258
ЧИС.ПЛАТ.В ДБО В КАТ.ДРУГОЕ-3/3-{111.3333333, 167.0000000}
259
СУМ.ОПЕР.В ДБО-1/3-{0.0000000, 10.0000000}
260
СУМ.ОПЕР.В ДБО-2/3-{10.0000000, 20.0000000}
261
СУМ.ОПЕР.В ДБО-3/3-{20.0000000, 30.0000000}
262
СУМ.ПЕР. В ДБО-1/3-{0.0000000, 7.0000000}
263
СУМ.ПЕР. В ДБО-2/3-{7.0000000, 14.0000000}
264
СУМ.ПЕР. В ДБО-3/3-{14.0000000, 21.0000000}
265
СУМ.ПЛАТ.В ДБО-1/3-{0.0000000, 9907600.0000000}
266
СУМ.ПЛАТ.В ДБО-2/3-{9907600.0000000, 19815200.0000000}
267
СУМ.ПЛАТ.В ДБО-3/3-{19815200.0000000, 29722800.0000000}
268
СУМ.ПЛАТ.В ДБО В КАТ.СОТОВАЯ СВЯЗЬ-1/3-{0.0000000, 9907500.0000000}
269
СУМ.ПЛАТ.В ДБО В КАТ.СОТОВАЯ СВЯЗЬ-2/3-{9907500.0000000, 19815000.0000000}
270
СУМ.ПЛАТ.В ДБО В КАТ.СОТОВАЯ СВЯЗЬ-3/3-{19815000.0000000, 29722500.0000000}
271
СУМ.ПЛАТ.В ДБО В КАТ.ЖКХ-1/3-{0.0000000, 180000.0000000}
272
СУМ.ПЛАТ.В ДБО В КАТ.ЖКХ-2/3-{180000.0000000, 360000.0000000}
273
СУМ.ПЛАТ.В ДБО В КАТ.ЖКХ-3/3-{360000.0000000, 540000.0000000}
274
СУМ.ПЛАТ.В ДБО В КАТ.ИНТ./ТЕЛ./СВ.-1/3-{0.0000000, 34400.0000000}
275
СУМ.ПЛАТ.В ДБО В КАТ.ИНТ./ТЕЛ./СВ.-2/3-{34400.0000000, 68800.0000000}
276
СУМ.ПЛАТ.В ДБО В КАТ.ИНТ./ТЕЛ./СВ.-3/3-{68800.0000000, 103200.0000000}
277
СУМ.ПЛАТ.В ДБО В КАТ.ОБРАЗОВАНИЕ-1/3-{0.0000000, 71666.6666667}
278
СУМ.ПЛАТ.В ДБО В КАТ.ОБРАЗОВАНИЕ-2/3-{71666.6666667, 143333.3333333}
279
СУМ.ПЛАТ.В ДБО В КАТ.ОБРАЗОВАНИЕ-3/3-{143333.3333333, 215000.0000000}
42
280
СУМ.ПЛАТ.В ДБО В КАТ.ЭЛЕКТ.КОШЕЛЬКИ-1/3-{0.0000000, 66666.6666667}
281
СУМ.ПЛАТ.В ДБО В КАТ.ЭЛЕКТ.КОШЕЛЬКИ-2/3-{66666.6666667, 133333.3333333}
282
СУМ.ПЛАТ.В ДБО В КАТ.ЭЛЕКТ.КОШЕЛЬКИ-3/3-{133333.3333333, 200000.0000000}
283
СУМ.ПЛАТ.В ДБО В КАТ.КРЕДИТ.ОРГАНИЗАЦИИ-1/3-{0.0000000, 111300.0000000}
284
СУМ.ПЛАТ.В ДБО В КАТ.КРЕДИТ.ОРГАНИЗАЦИИ-2/3-{111300.0000000, 222600.0000000}
285
СУМ.ПЛАТ.В ДБО В КАТ.КРЕДИТ.ОРГАНИЗАЦИИ-3/3-{222600.0000000, 333900.0000000}
286
СУМ.ПЛАТ.В ДБО В КАТ.НАЛОГИ/ПОШЛИНЫ-1/3-{0.0000000, 180000.0000000}
287
СУМ.ПЛАТ.В ДБО В КАТ.НАЛОГИ/ПОШЛИНЫ-2/3-{180000.0000000, 360000.0000000}
288
СУМ.ПЛАТ.В ДБО В КАТ.НАЛОГИ/ПОШЛИНЫ-3/3-{360000.0000000, 540000.0000000}
289
СУМ.ПЛАТ.В ДБО В КАТ.СТРАХОВАНИЕ-1/3-{0.0000000, 172500.0000000}
290
СУМ.ПЛАТ.В ДБО В КАТ.СТРАХОВАНИЕ-2/3-{172500.0000000, 345000.0000000}
291
СУМ.ПЛАТ.В ДБО В КАТ.СТРАХОВАНИЕ-3/3-{345000.0000000, 517500.0000000}
292
СУМ.ПЛАТ.В ДБО В КАТ.MLM (СЕТ.ПРОДАЖИ)-1/3-{0.0000000, 100800.0000000}
293
СУМ.ПЛАТ.В ДБО В КАТ.MLM (СЕТ.ПРОДАЖИ)-2/3-{100800.0000000, 201600.0000000}
294
СУМ.ПЛАТ.В ДБО В КАТ.MLM (СЕТ.ПРОДАЖИ)-3/3-{201600.0000000, 302400.0000000}
295
СУМ.ПЛАТ.В ДБО В КАТ.ДРУГОЕ-1/3-{0.0000000, 159200.0000000}
296
СУМ.ПЛАТ.В ДБО В КАТ.ДРУГОЕ-2/3-{159200.0000000, 318400.0000000}
297
СУМ.ПЛАТ.В ДБО В КАТ.ДРУГОЕ-3/3-{318400.0000000, 477600.0000000}
298
T1N102-1/3-{0.0000000, 23933.3333333}
299
T1N102-2/3-{23933.3333333, 47866.6666667}
300
T1N102-3/3-{47866.6666667, 71800.0000000}
301
T1N103-1/3-{0.0000000, 72566.6666667}
302
T1N103-2/3-{72566.6666667, 145133.3333333}
303
T1N103-3/3-{145133.3333333, 217700.0000000}
304
ТИП ПЛАСТИКА-American Express Optimum
305
ТИП ПЛАСТИКА-American Express Premier
306
ТИП ПЛАСТИКА-CirrusMaestro
307
ТИП ПЛАСТИКА-MasterCard
308
ТИП ПЛАСТИКА-MasterCard Black Edition
309
ТИП ПЛАСТИКА-MasterCard Business
310
ТИП ПЛАСТИКА-MasterCard Electronic
311
ТИП ПЛАСТИКА-MasterCard Gold
312
ТИП ПЛАСТИКА-MasterCard Virtual
313
ТИП ПЛАСТИКА-MasterCard World
314
ТИП ПЛАСТИКА-VISA Classic
315
ТИП ПЛАСТИКА-VISA Electron
316
ТИП ПЛАСТИКА-VISA Gold
317
ТИП ПЛАСТИКА-VISA Platinum
318
ТИП ПЛАСТИКА-МИР
319
МЕТКА КРЕДИТНОЙ КАРТЫ-1/3-{0.0000000, 0.3333333}
320
МЕТКА КРЕДИТНОЙ КАРТЫ-2/3-{0.3333333, 0.6666667}
321
МЕТКА КРЕДИТНОЙ КАРТЫ-3/3-{0.6666667, 1.0000000}
322
МЕТКА КАРТЫ С НАЧ.ПРОЦ.НА ОСТ.-1/3-{0.0000000, 0.3333333}
323
МЕТКА КАРТЫ С НАЧ.ПРОЦ.НА ОСТ.-2/3-{0.3333333, 0.6666667}
324
МЕТКА КАРТЫ С НАЧ.ПРОЦ.НА ОСТ.-3/3-{0.6666667, 1.0000000}
325
МЕТКА КАРТЫ CO-BRAND-1/3-{0.0000000, 0.3333333}
326
МЕТКА КАРТЫ CO-BRAND-2/3-{0.3333333, 0.6666667}
327
МЕТКА КАРТЫ CO-BRAND-3/3-{0.6666667, 1.0000000}
328
МЕТКА КАРТЫ С CASH-BACK-1/3-{0.0000000, 0.3333333}
329
МЕТКА КАРТЫ С CASH-BACK-2/3-{0.3333333, 0.6666667}
330
МЕТКА КАРТЫ С CASH-BACK-3/3-{0.6666667, 1.0000000}
331
ПОСЛЕДНИЙ СТАТУС КАРТЫ-CLOSED
332
ПОСЛЕДНИЙ СТАТУС КАРТЫ-OK
333
ТЕКУЩАЯ СУММА СОБСТ.СРЕДСТВ-1/3-{0.0000000, 1522000.0000000}
334
ТЕКУЩАЯ СУММА СОБСТ.СРЕДСТВ-2/3-{1522000.0000000, 3044000.0000000}
335
ТЕКУЩАЯ СУММА СОБСТ.СРЕДСТВ-3/3-{3044000.0000000, 4566000.0000000}
336
ПРОДУКТ-Автокредит
337
ПРОДУКТ-Ипотека
338
ПРОДУКТ-Кредитная карта
339
ПРОДУКТ-Овердрафт
340
ПРОДУКТ-Потребительский кредит
341
ПРОДУКТ-Срочный депозит
342
ПРОДУКТ-Текущий счёт
343
ТИП ДОГОВОРА-C
344
ТИП ДОГОВОРА-D
345
ПОЛ-Ж
346
ПОЛ-М
347
ВОЗРАСТ-1/3-{4.0000000, 34.3333333}
348
ВОЗРАСТ-2/3-{34.3333333, 64.6666667}
349
ВОЗРАСТ-3/3-{64.6666667, 95.0000000}
43
3.8. Обучающая выборка
Обучающая выборка (рисунок 17) представляет собой исходные
данные (рисунок 11), закодированные с помощью классификационных и
описательных шкал и градаций (таблицы 6 - 7):
Рисунок 17. Обучающая выборка (фрагмент)
Всего в обучающей выборке представлено 825892 наблюдений. По
сути обучающая выборка (рисунок 17) представляет собой базу исходных
данных (рисунок 11), нормализованную с помощью классификационных и
описательных шкал и градаций (таблицы 6 - 7).
Формализация исходных данных создает все необходимые и
достаточные предпосылки для синтеза и верификации статистических и
системно-когнитивных моделей.
4. Синтез и верификация системно-когнитивных моделей
4.1. Синтез и верификация моделей
Синтез и верификация статистических и системно-когнитивных
моделей осуществляется в режиме 3.5 системы «Эйдос» (рисунок 18).
Для верификации (оценки достоверности моделей) был использован
бутстрепный метод (поддерживается системой «Эйдос»), т.е. для этого
были использованы не все 825892 объекта обучающей выборки, а лишь
103326 из них, отобранных равномерно по всей выборке. Если бы для этой
цели использовались все объекты, то этот процесс занял бы более недели
непрерывного счета, что не входило в наши планы.
44
Рисунок 18. Экранные формы режима синтеза и верификации
статистических и системно-когнитивных моделей системы «Эйдос»
Синтез всех 10 моделей и их верификация на выборке из 103236
клиентов заняли на i7 28 часов 43 минуты 15 секунд.
В результате выполнения данного режима создается три
статистических и 7 системно-когнитивных моделей, фрагменты некоторых
из которых приведены на рисунках 19-22. Полностью модели не
приводятся из-за их большой размерности: это таблица из 12 колонок и
349 строк.
45
Рисунок 19. Модель ABS (фрагмент)
Рисунок 20. Модель PRC2 (фрагмент)
Рисунок 21. Модель INF1 (фрагмент)
46
Рисунок 22. Модель INF3 (фрагмент)
Модель ABS представляет собой матрицу абсолютных частот фактов
наблюдения определенного значения описательной шкалы при
определенном значении классификационной шкалы.
4.2. Частные критерии знаний, используемые в настоящее время
в АСК-анализе и системе «Эйдос»
Приведенные выше и другие статистические и системно-
когнитивные модели рассчитываются на основе матрицы абсолютных
частот с применением различных частных критериев знаний, описанных
ниже в таблице 2:
Таблица 2 – Частные критерии знаний, используемые
в настоящее время в АСК-анализе и системе «Эйдос»
Наименование модели знаний
и частный критерий
Выражение для частного критерия
через
относительные частоты
через
абсолютные частоты
INF1, частный критерий: количество знаний по
А.Харкевичу, 1-й вариант расчета относительных
частот: Nj суммарное количество признаков по j-му
классу. Относительная частота того, что если у
объекта j-го класса обнаружен признак, то это i-й
признак
i
ij
ij P
P
LogI 2
ji
ij
ij NN
NN
LogI 2
INF2, частный критерий: количество знаний по
А.Харкевичу, 2-й вариант расчета относительных
частот: Nj суммарное количество объектов по j-му
классу. Относительная частота того, что если
предъявлен объект j-го класса, то у него будет
обнаружен i-й признак.
i
ij
ij P
P
LogI 2
ji
ij
ij NN
NN
LogI 2
INF3, частный критерий: Хи-квадрат: разности между
фактическими и теоретически ожидаемыми
абсолютными частотами
---
N
NN
NI ji
ijij
47
INF4, частный критерий: ROI - Return On Investment, 1-
й вариант расчета относительных частот: Nj
суммарное количество признаков по j-му классу10
i
iij
i
ij
ij P
PP
P
P
I
1
1
ji
ij
ij NN
NN
I
INF5, частный критерий: ROI - Return On Investment, 2-
й вариант расчета относительных частот: Nj
суммарное количество объектов по j-му классу
i
iij
i
ij
ij P
PP
P
P
I
1
1
ji
ij
ij NN
NN
I
INF6, частный критерий: разность условной и
безусловной относительных частот, 1-й вариант
расчета относительных частот: Nj суммарное
количество признаков по j-му классу
iijij PPI
N
N
N
N
Ii
j
ij
ij
INF7, частный критерий: разность условной и
безусловной относительных частот, 2-й вариант
расчета относительных частот: Nj суммарное
количество объектов по j-му классу
iijij PPI
N
N
N
N
Ii
j
ij
ij
Обозначения:
i значение прошлого параметра;
j - значение будущего параметра;
Nij количество встреч j-го значения будущего параметра при i-м значении
прошлого параметра;
M суммарное число значений всех прошлых параметров;
W - суммарное число значений всех будущих параметров.
Ni количество встреч i-м значения прошлого параметра по всей выборке;
Nj количество встреч j-го значения будущего параметра по всей выборке;
N количество встреч j-го значения будущего параметра при i-м значении
прошлого параметра по всей выборке.
Iij частный критерий знаний: количество знаний в факте наблюдения i-го
значения прошлого параметра о том, что объект перейдет в состояние,
соответствующее j-му значению будущего параметра;
Ψ нормировочный коэффициент (Е.В.Луценко, 2002), преобразующий
количество информации в формуле А.Харкевича в биты и обеспечивающий для нее
соблюдение принципа соответствия с формулой Р.Хартли;
Pi безусловная относительная частота встречи i-го значения прошлого
параметра в обучающей выборке;
Pij условная относительная частота встречи i-го значения прошлого
параметра при j-м значении будущего параметра .
Все эти способы метризации с применением 7 частных критериев
знаний реализованы в системно-когнитивном анализе и интеллектуальной
системе «Эйдос» и обеспечивают сопоставление градациям шкал числовых
значений, имеющих смысл количества информации в градации о
принадлежности объекта к классу. Это делается совершенно одинаково
для градаций всех шкал, независимо от их типа (номинальные, порядковые
и числовые) и независимо от единиц измерения, используемых в этих
шкалах.
10
Применение предложено Л.О. Макаревич
48
4.3. Оценка достоверности моделей по F-критерию Ван
Ризбергена и по L-критериям
Для оценки достоверности статистических и системно-когнитивных
моделей в системе «Эйдос» используются классическая F-мера (критерий)
Ван Ризбергена и его инвариантное относительно объема исследуемой
выборки нечеткое мультиклассовое обобщение L-мера, предложенная
проф. Е.В.Луценко [32].
Поскольку разработчиками задачи была предоставлена лишь одна
выборка, то она была использована и как обучающая для синтеза модели, и
как тестовая для ее верификации.
Оценка времени идентификации всей исходной выборки из 825892
примеров в одной модели дает примерно 16 часов, а во всех 10 моделях
примерно неделю. Мы себе этого позволить не можем в связи с
ограниченностью времени проведения чемпионата.
Поэтому было принято решение об оценке достоверности всех 10
моделей на тестовой выборке из 103236 примеров, равномерно
распределенных по всей обучающей выборке. Для этого в экранной форме,
приведенной на рисунке 18, мы задали использовать для оценки
достоверности создаваемых моделей