Content uploaded by Eugene Veniaminovich Lutsenko
Author content
All content in this area was uploaded by Eugene Veniaminovich Lutsenko on Dec 30, 2020
Content may be subject to copyright.
Content uploaded by Eugene Veniaminovich Lutsenko
Author content
All content in this area was uploaded by Eugene Veniaminovich Lutsenko on Dec 30, 2020
Content may be subject to copyright.
1
УДК 004. 8
UDC 004. 8
05.00.00 Технические науки
Engineering
Применение автоматизированного системно-
когнитивного анализа и интеллектуальной
системы «Эйдос» для повышения конверсии
сайта (прогнозирование статуса посетителей
сайта и принятие решений по увеличению
количества посетителей, перешедших в статус
покупателей)
Application of automated system-cognitive analysis
and intelligent system "Eidos" to increase the
conversion rate of the site (predicting the status of
site visitors and making decisions to increase the
number of visitors who have switched to the status
of buyers)
Луценко Евгений Вениаминович
д.э.н., к.т.н., профессор
Scopus Author ID: 57191193316
РИНЦ SPIN-код: 9523-7101
prof.lutsenko@gmail.com
Lutsenko Eugeny Veniaminovich
Dr.Sci.Econ., Cand.Tech.Sci., professor
Scopus Author ID: 57191193316
RSCI SPIN-code: 9523-7101
prof.lutsenko@gmail.com
Кубанский государственный аграрный
университет имени И.Т.Трубилина, Краснодар,
Россия
Kuban State Agrarian University, Krasnodar, Russia
Онлайн торговля развивается все более активно,
выступая драйвером рынка электроники и бытовой
техники. В этих условиях наша цель, как
крупнейшего ритейлера, сделать покупательский
путь в Интернете максимально удобным и
коротким для клиентов. Мы сохраняем каждое
взаимодействие между посетителем и сайтом, тем
самым накапливаем статистику. Анализ этих
данных помогает соответствовать запросам и
ожиданиям наших клиентов и предоставлять им
лучший сервис. Одним из показателей работы
сайта и операционной эффективности самой
компании является растущая конверсия, т.е
увеличение количества посетителей сайта,
перешедших в статус покупателей. Предлагается
решение данной проблемы с применением
автоматизированного системно-когнитивного
анализа (АСК-анализ) и его программного
инструментария – Универсальной когнитивной
аналитической системы «Эйдос». Приводится
развернутый численный пример,
демонстрирующий все этапы решения задачи в
АСК-анализе, от постановки задачи, подготовки
исходных данных и ввода их в систему «Эйдос»,
синтеза и верификации модели, решения задач
повышения конверсии сайта, принятия решений и
исследования предметной области путем
исследования ее системно-когнитивной модели.
Данная задача была поставлена на Чемпионате
RAIF-Challenge 2017: https://raif.jet.su/improject-11
Online trading is developing more and more actively,
acting as a driver of the electronics and home
appliances market. In these circumstances, our goal, as
the largest retailer, is to make the shopping path on the
Internet as convenient and short as possible for
customers. We save every interaction between the user
and the site, thereby accumulating statistics. The
analysis of this data helps to meet the needs and
expectations of our customers and provide them with
the best service. One of the indicators of the site and
the operational efficiency of the company itself is a
growing conversion rate, i.e. an increase in the number
of site visitors who have switched to the status of
buyers. The solution of this problem is proposed with
the use of automated system-cognitive analysis (ASK-
analysis) and its software tools – the Universal
cognitive analytical system "Eidos". A detailed
numerical example is given that demonstrates all the
stages of solving the problem in ASK analysis, from
setting the problem, preparing initial data and entering
them into the Eidos system, synthesizing and verifying
the model, solving problems of increasing site
conversion, making decisions and researching the
subject area by studying its system-cognitive model.
This task was set at the RAIF-Challenge 2017
Championship: https://raif.jet.su/improject-11
Ключевые слова: АВТОМАТИЗИРОВАННЫЙ
СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ АСК-
АНАЛИЗ СИСТЕМА «ЭЙДОС» ПРИВЛЕЧЕНИЕ
И УДЕРЖАНИЕ КЛИЕНТОВ БАНКА
Doi: 10.13140/RG.2.2.35783.32168
Keywords: AUTOMATED SYSTEM-COGNITIVE
ANALYSIS, ASC-ANALYSIS, "EIDOS" SYSTEM
2
СОДЕРЖАНИЕ
1. ВВЕДЕНИЕ ................................................................................................................................................................................................ 2
1.1. ФОРМУЛИРОВКА ЗАДАЧИ С САЙТА ЧЕМПИОНАТА RAIF-CHALLENGE 2017: HTTPS://RAIF.JET.SU/IMPROJECT-11
(ПОВЫШЕНИЕ КОНВЕРСИИ САЙТА)......................................................................................................................................................... 2
1.2. ОБОСНОВАНИЕ ВЫБОРА МЕТОДА ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И ПРОГРАММНОГО ИНСТРУМЕНТАРИЯ ДЛЯ РЕШЕНИЯ
ПОСТАВЛЕННОЙ ЗАДАЧИ .......................................................................................................................................................................... 3
1.3. КРАТКО ОБ АВТОМАТИЗИРОВАННОМ СИСТЕМНО-КОГНИТИВНОМ АНАЛИЗЕ И СИСТЕМЕ «ЭЙДОС» ......................................... 3
2. КОГНИТИВНО-ЦЕЛЕВАЯ СТРУКТУРИЗАЦИЯ ПРЕДМЕТНОЙ ОБЛАСТИ ............................................................................. 16
3. ФОРМАЛИЗАЦИЯ ПРЕДМЕТНОЙ ОБЛАСТИ ................................................................................................................................ 17
3.1. ИСХОДНЫЕ ДАННЫЕ И ИХ ХАРАКТЕРИСТИКА ............................................................................................................................... 17
3.2. ИСХОДНЫЙ КОД ПРОГРАММНОГО ИНТЕРФЕЙСА МЕЖДУ ДАННЫМИ ПО ЗАДАЧЕ «AI В РИТЕЙЛЕ» ЧЕМПИОНАТА RAIF-
CHALLENGE 2017 (РЕЖИМ 2.3.2.11) И СИСТЕМОЙ «ЭЙДОС» .............................................................................................................. 19
3.3. УНИВЕРСАЛЬНЫЙ ПРОГРАММНЫЙ ИНТЕРФЕЙС (API) СИСТЕМЫ «ЭЙДОС» ДЛЯ ВВОДА ДАННЫХ ИЗ ВНЕШНИХ
ИСТОЧНИКОВ ДАННЫХ ТИПА ТАБЛИЦ MS EXCEL ............................................................................................................................... 25
3.4. КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ ............................................................................................................................ 29
3.5. ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ ......................................................................................................................................... 29
3.6. ОБУЧАЮЩАЯ ВЫБОРКА .................................................................................................................................................................. 30
4. СИНТЕЗ И ВЕРИФИКАЦИЯ СИСТЕМНО-КОГНИТИВНЫХ МОДЕЛЕЙ .................................................................................... 31
4.1. СИНТЕЗ И ВЕРИФИКАЦИЯ МОДЕЛЕЙ .............................................................................................................................................. 31
4.2. ЧАСТНЫЕ КРИТЕРИИ ЗНАНИЙ, ИСПОЛЬЗУЕМЫЕ В НАСТОЯЩЕЕ ВРЕМЯ В АСК-АНАЛИЗЕ И СИСТЕМЕ «ЭЙДОС» .................. 35
4.3. ОЦЕНКА ДОСТОВЕРНОСТИ МОДЕЛЕЙ ПО F-КРИТЕРИЮ ВАН РИЗБЕРГЕНА И ПО L-КРИТЕРИЯМ .............................................. 37
4.4. ВЫБОР НАИБОЛЕЕ ДОСТОВЕРНОЙ МОДЕЛИ И ПРИДАНИЕ ЕЙ СТАТУСА ТЕКУЩЕЙ .................................................................... 45
5. РЕШЕНИЕ ЗАДАЧИ ПОСЕЩЕНИЯ САЙТА КЛИЕНТОМ В НАИБОЛЕЕ ДОСТОВЕРНОЙ МОДЕЛИ ................................ 46
6. РЕШЕНИЕ ЗАДАЧИ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ (ИССЛЕДОВАНИЕ ВЛИЯНИЯ ЗНАЧЕНИЙ ФАКТОРОВ
НА ОЦЕНКУ ПОСЕЩЕНИЯ САЙТА ПОТЕНЦИАЛЬНЫМ КЛИЕНТОМ) ........................................................................................ 50
7. РЕШЕНИЕ ЗАДАЧИ ИССЛЕДОВАНИЯ МОДЕЛИРУЕМОЙ ПРЕДМЕТНОЙ ОБЛАСТИ ПУТЕМ ИССЛЕДОВАНИЯ ЕЕ
МОДЕЛИ ....................................................................................................................................................................................................... 58
7.1. АВТОМАТИЗИРОВАННЫЙ SWOT-АНАЛИЗ КЛАССОВ И ЗНАЧЕНИЙ И ЗНАЧЕНИЙ ФАКТОРОВ ................................................... 58
7.2. НЕЛОКАЛЬНЫЕ НЕЙРОНЫ .............................................................................................................................................................. 69
7.3. НЕЛОКАЛЬНАЯ НЕЙРОННАЯ СЕТЬ .................................................................................................................................................. 70
7.4. 2D-СЕМАНТИЧЕСКИЕ СЕТИ ЗНАЧЕНИЙ ФАКТОРОВ ...................................................................................................................... 71
7.5. КОГНИТИВНЫЕ ФУНКЦИИ .............................................................................................................................................................. 73
8. ИСПОЛЬЗОВАНИЕ РАЗРАБОТАННОЙ МЕТОДИКИ В АДАПТИВНОМ РЕЖИМЕ И ЕЕ ЛОКАЛИЗАЦИЯ ДЛЯ
РЕГИОНА ...................................................................................................................................................................................................... 78
9. ИССЛЕДОВАНИЕ ЦЕННОСТИ ФАКТОРОВ И ИХ ЗНАЧЕНИЙ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ ЦЕЛЕЙ
ПОСЕЩЕНИЙ САЙТА КЛИЕНТАМИ И ОПТИМИЗАЦИЯ СИСТЕМЫ ФАКТОРОВ .................................................................... 79
10. ВЫВОДЫ ............................................................................................................................................................................................... 83
ЛИТЕРАТУРА: ............................................................................................................................................................................................. 85
1. Введение
1.1. Формулировка задачи с сайта Чемпионата России по
искусственному интеллекту RAIF-Challenge 2017:
https://raif.jet.su/improject-11 (повышение конверсии сайта)
Онлайн торговля развивается все более активно, выступая драйвером
рынка электроники и бытовой техники. В этих условиях наша цель, как
крупнейшего ритейлера, сделать покупательский путь в Интернете
максимально удобным и коротким для клиентов. Мы сохраняем каждое
взаимодействие между посетителем и сайтом, тем самым накапливаем
статистику. Анализ этих данных помогает соответствовать запросам и
ожиданиям наших клиентов и предоставлять им лучший сервис.
3
Одним из показателей работы сайта и операционной эффективности
самой компании является растущая конверсия, т.е увеличение количества
посетителей сайта, перешедших в статус покупателей.
1.2. Обоснование выбора метода искусственного интеллекта и
программного инструментария для решения поставленной задачи
Для решения поставленной задачи применен новый метод
искусственного интеллекта: Автоматизированный системно-когнитивный
анализ (АСК-анализ, Е.В.Луценко, 2002). Этот метод обеспечивает
корректную сопоставимую обработку большого количества
фрагментированных (неполных) и зашумленных исходных данных
различной природы, измеряемых в различных единицах измерения и
разных типах шал (номинальных-текстовых, порядковых и числовых).
Данный метод имеет свой программный инструментарий – универсальную
когнитивную аналитическую систему «Эйдос», которая создана около 30
лет назад [20, 41] и с тех пор постоянно совершенствуется. Данная система
находится в полном открытом бесплатном доступе, причем с актуальными
исходными текстами, на сайте автора [35] по адресу:
http://lc.kubagro.ru/aidos/_Aidos-X.htm. С применением АСК-анализа и
системы «Эйдос» решено большое количество задач в различных
предметных областях и направлениях науки, в т.ч. для банков [36-40]. Все
это и обусловило выбор данной интеллектуальной технологии для
решения поставленной задачи.
1.3. Кратко об автоматизированном системно-когнитивном
анализе и системе «Эйдос»
1.3.1. Что же такое АСК-анализ?
Автоматизированный системно-когнитивный анализ (АСК-анализ) –
это новый универсальный метод искусственного интеллекта,
представляющий собой единственный в настоящее время вариант
автоматизированного системного анализа, а именно, системный анализ,
структурированный по базовым когнитивным операциям.
Известно, что системный анализ является одним из общепризнанных
в науке методов решения проблем и многими учеными рассматривается
вообще как методология научного познания. Однако как впервые заметил
еще в 1984 году проф. И. П. Стабин
1
практическое применение системного
анализа наталкивается на проблему, суть которой состоит в том, что
1
Стабин И.П., Моисеева B.C. Автоматизированный системный анализ.- М.: Машиностроение,
1984. –309 с.
4
методология системного анализа успешно применяется в сравнительно
простых случаях, в которых в принципе можно обойтись и без нее, тогда
как в реальных сложных ситуациях, она чрезвычайно востребован и у нее
нет альтернатив, сделать это удается очень редко. Проф. И. П. Стабин
первым предложил и путь решения этой проблемы, состоящий в
автоматизации системного анализа, он же ввел и термин:
«Автоматизированный системный анализ» (АСА).
1.3.2. Работы каких ученых сыграли большую роль в создании
АСК-анализа?
Автора идеи АСА мы упомянули выше.
Теперь необходимо отметить отечественных классиков методологии
системного анализа проф. Ф. И. Перегудова и проф. Ф. П. Тарасенко,
которые в своих фундаментальных работах
2
подробно рассмотрели
математические методы, которые могли бы быть успешно применены для
автоматизации отдельных этапов системного анализа. Однако даже самые
лучшие математические методы не могут быть использованы на практике
без эффективно реализующих их программных средств, а путь от научного
метода, реализуемого с помощью математики к его эффективной
программной системе долог и сложен. Обусловлено это тем
обстоятельством, что ЦЭВМ – это дискретный автомат, работающий только
в рамках дискретной математики. Для использования ЦЭВМ необходимо
разработать численные методы или методики их реализации на
компьютере. А затем реализовать и отладить компьютерную программу,
основанную на этом численном методе.
В числе первых попыток реального использования
автоматизированного системного анализа следует отметить монографию
[4]
3
и докторскую диссертацию проф. В. С. Симанкова (2002). В этих
работах идея автоматизации системного анализа была основана на высокой
детализации этапов системного анализа и подборе уже существующих
программных систем, автоматизирующих эти этапы. Эта попытка была
реализована проф. В. С. Симанковым, однако лишь для специального
случая исследования в области возобновляемой энергетики, где
использовались системы разных разработчиков, созданные с помощью
различного инструментария и не имеющие программных интерфейсов
друг с другом, т. е. не образующие единой автоматизированной системы.
Эта попытка, безусловно, была большим шагом по пути, предложенному
проф. И. П. Стабиным, но ее нельзя признать обеспечившей достижение
2
Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ. М.: Высшая школа, 1989. - 320
с., Перегудов Ф. И., Тарасенко Ф. П.. Основы системного анализа. Томск Изд-во науч.-техн. лит.
1997. 389с.
3
Симанков В.С., Луценко Е.В., Лаптев В.Н. Системный анализ в адаптивном управлении:
Монография (научное издание). /Под науч. ред. В.С.Симанкова. – Краснодар: ИСТЭК КубГТУ, 2001. –
258с.
5
поставленной им цели: создание работающего автоматизированного
системного анализа. Эта работа не привела к созданию единой
универсальной программной системы, автоматизирующий системный
анализ, которую можно было бы успешно применять в различных
предметных областях.
1.3.3. Кем и когда создан АСК-анализ?
Автоматизированный системно-когнитивный анализ, как реально
работающий АСА, предложен и разработан проф. Е. В. Луценко в 2002
году [5] и получил детальное и всестороннее развитие в десятках
монографий и сотнях научных статей [1-40]
4
.
Основная идея Е. В. Луценко, позволившая сделать это, состоит в
рассмотрении автоматизированного системного анализа как метода
познания (отсюда и использование термина: «когнитивный» от «cognitio» –
знание, познание, лат. ).
Эта идея позволила структурировать автоматизированный
системный анализ не по этапам, как это пытались сделать другие ученые, а
по конкретным базовым когнитивным операциям (БКОСА), т. е. таким
операциям, из комбинаций которых конструируются всевозможные
операции системного анализа. Таких базовых операций оказалось 10 и они
образуют когнитивный конфигуратор:
1) присвоение имен;
2) восприятие;
3) обобщение (синтез, индукция);
4) абстрагирование;
5) оценка адекватности модели;
6) сравнение, идентификация и прогнозирование;
7) дедукция, силлогизм и абдукция;
8) классификация и генерация конструктов;
9) содержательное сравнение;
10) планирование и принятие решений об управлении.
Каждая из этих операций достаточно элементарна для формализации
и программной реализации.
Рассмотрим чуть подробнее п. 7. Пример силлогизма (или
дедуктивного рассуждения «от общего к частному»):
Всякий человек смертен (большая посылка)
Сократ – человек (меньшая посылка)
------------
Сократ смертен (заключение)
4
Ссылки на некоторые из них приведены здесь:
http://lc.kubagro.ru/aidos/_Aidos-X.htm
http://lc.kubagro.ru/aidos/Sprab0802.pdf
6
Абдукция представляет вид вывода с той особенностью, что из
посылки, которая является условным высказыванием, и заключения
вытекает вторая посылка. Например, если рассмотреть тот же пример
Сократом:
Всякий человек смертен (большая посылка)
Сократ смертен (заключение)
------------
Мы можем предположить, что меньшая посылка: «Сократ – человек
(меньшая посылка)».
Однако, кроме указания одного признака Сократа: что он смертен,
мы можем привести и другие его признаки, которые могут помочь
идентифицировать его как человека или препятствовать этому.
По сути, при абдукции мы по признакам объекта, его
экстенсиональному описанию, относим его к обобщающим категориям:
референтным классам, т. е. восстанавливаем его интенсиональное
описание, и делаем это путем решения задачи определения степени
релевантности объекта классу или решения задачи классификации
(идентификации, распознавания, прогнозирования, классификации,
диагностики). При этом мы никогда не можем точно установить
принадлежит ли объект классу, но можем лишь высказать гипотезу [31] об
этом и оценить степень достоверности этой гипотезы (ее релевантности).
Поэтому абдукция имеет широкое применение в системах искусственного
интеллекта, в т. ч. в системе «Эйдос».
1.3.4. Что включает в себя АСК-анализ?
АСК-анализ Е. В. Луценко представляет собой единственный
существующий в настоящее время реально работающий вариант
автоматизированного системного анализа. Но, конечно, это совершенно не
исключает того, что в будущем, возможно, будут разработаны и другие его
варианты.
Автоматизированный системно-когнитивный анализ включает:
формализуемую когнитивную концепцию, математическую модель,
методику численных расчетов и реализующий их программный
инструментарий, в качестве которого в настоящее время выступает
постоянно совершенствуемая автором универсальная когнитивная
аналитическая система "Эйдос".
Компоненты АСК-анализа:
– формализуемая когнитивная концепция и следующий из нее
когнитивный конфигуратор;
– теоретические основы, методология, технология и методика АСК-
анализа;
– обобщенная и частные математические модели АСК-анализа,
основанная на системном обобщении теории информации;
7
– методика численных расчетов, в универсальной форме
реализующая математическую модель АСК-анализа на компьютерах,
включающая иерархическую структуру данных и 24 детальных алгоритма
10 БКОСА;
– специальное инструментальное программное обеспечение,
реализующее математическую модель и численный метод АСК-анализа –
Универсальная когнитивная аналитическая система "Эйдос".
Этапы АСК-анализа:
1) когнитивно-целевая структуризация предметной области;
2) формализация предметной области (конструирование
классификационных и описательных шкал и градаций и подготовка
обучающей выборки);
3) синтез системы обобщенных и частных моделей предметной
области (в настоящее время система «Эйдос» поддерживает 3
статистические модели и 7 системно-когнитивных моделей);
4) оценка достоверности (верификация) системы моделей
предметной области;
5) повышение достоверности системы моделей, в т. ч. адаптация и
пересинтез этих моделей;
6) решение задач идентификации, прогнозирования и поддержки
принятия решений;
7) исследование объекта моделирования (процесса, явления) путем
исследования его моделей: кластерно-конструктивный анализ классов и
факторов; содержательное сравнение классов факторов; изучение системы
детерминации состояний моделируемого объекта, нелокальные нейроны и
интерпретируемые нейронные сети прямого счета; построение
классических когнитивных моделей (когнитивных карт); построение
интегральных когнитивных моделей (интегральных когнитивных карт).
1.3.5. Какие ученые принимали и сейчас принимают участие в
развитии АСК-анализа?
Необходимо отметить, что в развитии различных теоретических
основ и практических аспектов АСК-анализа приняли участие многие
ученые: д. э. н. , к. т. н. , проф. Луценко Е. В. , Засл. деятель науки РФ, д. т.
н. , проф. Лойко В. И. , к. ф. -м. н. , Ph. D. , проф. , Трунев А. П. (Канада), д.
э. н. , д. т. н. , к. ф. -м. н. , проф. Орлов А. И. , к. т. н. , доц. Коржаков В. Е. ,
д. э. н. , проф. Барановская Т. П. , д. э. н. , к. т. н. , проф. Ермоленко В. В. ,
к. пс. н. Наприев И. Л. , к. пс. н. , доц. Некрасов С. Д. , к. т. н. , доц. Лаптев
В. Н. , к. пс. н, доц. Третьяк В. Г. , к. пс. н. , Щукин Т. Н. , д. т. н. , проф.
Симанков В. С. , д. э. н. , проф. Ткачев А. Н. , д. т. н. , проф. Сафронова Т.
И. , д. э. н. , доц. Горпинченко К. Н. , к. э. н. , доц. Макаревич О. А. , к. э. н.
, доц. Макаревич Л. О. , к. м. н. Сергеева Е. В. (Лаптева Е. В. ), Бандык Д.
К. (Белоруссия), Чередниченко Н. А. , к. ф. -м. н. Артемов А. А. , д. э. н. ,
8
проф. Крохмаль В. В. , д. т. н. , проф. Рябцев В. Г. , к. т. н. , доц. Марченко
А. Ю. , д. т. н. , проф. Фролов В. Ю. , д. ю. н, проф. Швец С. В. , Засл.
деятель науки Кубани, д. б. н. , проф. Трошин Л. П. , Засл. изобр. РФ, д. т.
н. , проф. Серга Г. В. , Сергеев А. С. , д. б. н. , проф. Стрельников В. В. и
другие.
1.3.6. Каков индекс цитирования ученых, принимающих
участие в развитии АСК-анализа?
Работы по АСК-анализу вызывают большой интерес у научной
общественности. Это подтверждается высокими индексами цитирования
этих ученых (например, проф. Е. В. Луценко занимает 1-ю позицию в
России по индексу Хирша (36-35) среди ученых в области кибернетики, к
которой относится искусственный интеллект,).
1.3.7. Докторские и кандидатские диссертации защищенные с
применением АСК-анализа в различных областях науки
Метод системно-когнитивного анализа и его программный
инструментарий интеллектуальная система "Эйдос" были успешно
применены при проведении ряда кандидатских и докторских
диссертационных работ в ряде различных предметных областей по
экономическим, техническим, психологическим и медицинским наукам. С
применением АСК-анализа проведены исследования и защищены
диссертации:
- доктора экономических наук – 4:
Е. В. Луценко: http://ej.kubagro.ru/a/viewaut.asp?id=11
А. Н. Ткачев: http://ej.kubagro.ru/a/viewaut.asp?id=20
В. В. Крохмаль: http://ej.kubagro.ru/a/viewaut.asp?id=22
К. Н. Горпинченко: http://ej.kubagro.ru/a/viewaut.asp?id=646
доктора технических наук – 2:
В. С. Симанков:http://www.yandex.ru/yandsearch?text=профессор Симанков
Владимир Сергеевич
Т. И. Сафронова: http://ej.kubagro.ru/a/viewaut.asp?id=111
кандидата психологических наук – 4:
С. Д. Некрасов: http://manag.kubsu.ru/index.php/ofup/kafedry/174-nekrasov
В. Г. Третьяк: http://law.edu.ru/person/person.asp?persID=1345265
Т. Н. Щукин: http://ej.kubagro.ru/a/viewaut.asp?id=94 http://2045. ru/expert/27.html
И. Л. Наприев: http://ej.kubagro.ru/a/viewaut.asp?id=573
- кандидат технических наук – 1:
Е. В. Луценко: http://ej.kubagro.ru/a/viewaut.asp?id=11
- кандидат экономических наук – 1:
Л. О. Макаревич: http://www.
mesi.ru/upload/iblock/b5a/Автореферат%20Макаревич%20ЛО.pdf
http://ej.kubagro.ru/a/viewaut.asp?id=1377
- кандидат медицинских наук – 1:
Сергеева Е. В. (Лаптева Е. В. ): http://ej.kubagro.ru/a/viewaut.asp?id=1034
На текущий момент времени в процессе выполнения, выхода на
защиту и утверждения в ВАК находится еще несколько диссертаций на
соискание ученых степеней кандидатов и докторов наук.
9
1.3.8. Сколько грантов РФФИ и РГНФ выполнено и
выполняется с применением АСК-анализа?
С применением АСК-анализа с использованием системы "Эйдос"
были выполнены (или находятся в процессе выполнения) следующие
гранты РФФИ и РГНФ (пронумерованы только одобренные проекты):
РФФИ:
№
Номер проекта
Название проекта
Начало -
окончание
02-01-00035-а
Разработка компьютерных методов изучения эмерджентных
свойств плодовых культур с дальнейшим использованием их для
оптимизации выращивания
2002 -2004
1
02-05-64234-а
Разработка теории многокритериальной оценки ландшафтных и
метеорологических характеристик юга России для увеличения
продуктивности плодовых культур на основе создания системы
банков данных и компьютерного моделирования.
2002 - 2003
2
03-04-96771-
р2003юг_а
Разработка новой методологии районирования сортов
сельскохозяйственных культур на основе системного подхода
при анализе и математическом прогнозе их жизнеобеспечения и
продуктивности
2003 - 2005
3
03-07-96801-
р2003юг_в
Создание системы мониторинга, прогнозирования, анализа и
поддержки управленческих решений по продуктивности
плодовых культур на основе электронных баз данных
2003- 2005
06-06-96644-
р_юг_а
Семантические информационные модели управления
агропромышленным комплексом
2006 - 2008
07-07-13510-
офи_ц
Инвестиционное управление АПК на основе методологии
системно-когнитивного анализа
2007 - 2008
08-06-99005-
р_офи
Управление в АПК исходя из критерия качества жизни
2008 - 2009
09-06-13509-
офи_ц
Системно-когнитивные основы инвестиционного управления
региональным агропромышленным комплексом
2009 - 2010
4
11-06-96508-
р_юг_ц
Системно-когнитивные основы инвестиционного управления
региональным агропромышленным комплексом
2011 - 2012
13-07-96507
Принципы создания облачного сервиса по курсу математики с
визуализацией понятийного аппарата, процесса доказательств
теорем и выполнения практических заданий
2013 - 2014
5
15-06-02569
Когнитивные модели прогнозирования развития
многоотраслевой корпорации
2015 - 2017
6
16-06-00114
Разработка интеллектуальной технологии исследования влияния
экологических факторов на различные аспекты качества жизни
населения региона
2016 – 2018
15-29-02530
Управление генресурсами семейства Rosaceae и Juglandacea для
сохранения и использования биораpнообразия культурных
растений на основе информационной системы, включая
оцифровку коллекций
2015 - 2017
15-29-02545
Ампелографическое и молекулярно-генетическое изучение
происхождения, структуры, динамики генетических ресурсов
рода Vitis (Tournef) L. , их систематизация и оцифровка для
эффективного управления биоресурсами
2015 - 2017
10
РГНФ:
№
Номер
проекта
Название проекта
Начало -
окончание
1
13-02-00440а
Методологические основы управления экономической
устойчивостью перерабатывающего комплекса региона с
применением технологий искусственного интеллекта
2013 - 2015
16-02-00185а
Управление качеством жизни населения региона через объемы и
направленность инвестиций в АПК на примере Краснодарского
края
2018 – 2018
2
17-02-00064а
Системно-когнитивный анализ в управлении номенклатурой и
объемами закупки-реализации продукции в торговой агрофирме
2017 – 2019
1.3.9. Сколько монографий, патентов, публикаций, входящих в
Перечень ВАК есть по АСК-анализу?
По проблематике АСК-анализа издано 25 монографий [1-40] (еще
несколько в стадии подготовки к печати), получено 30 патентов на
системы искусственного интеллекта, их подсистемы, режимы и
приложения, издано 240 статей в изданиях, входящих в Перечень ВАК РФ:
http://lc.kubagro.ru/aidos/index.htm.
В одном только Научном журнале КубГАУ (входит в Перечень ВАК
РФ с 26-го марта 2010 года) автором АСК-анализа и разработчиком
системы «Эйдос» проф. Е. В. Луценко опубликовано: 212 статей, общим
объёмом 380,997 у.п.л., в среднем 1,797 у.п.л. на одну статью
5
.
1.3.10. В каких областях и где уже применялись АСК-анализ и
система «Эйдос»?
Анализ приведенных выше грантов, диссертаций и публикаций
позволяет констатировать, что АСК-анализ успешно применяется в
следующих предметных областях и научных исследованиях:
- региональная экономика;
- отраслевая экономика;
- экономика предприятий;
- технические науки – интеллектуальные системы управления в
возобновляемой энергетике;
- технические науки – мелиорация и управление мелиоративными
системами;
- психология личности;
- психология экстремальных ситуаций;
- психология профессиональных и учебных достижений;
- медицинская диагностика;
- прогнозирование результатов применения агротехнологий;
- принятие решений по выбору рациональных агротехнологий;
5
http://ej.kubagro.ru/a/viewaut.asp?id=11
11
- геофизика: прогнозирование землетрясений;
- геофизика: прогнозирование параметров магнитного поля Земли;
- геофизика: прогнозирование движения полюсов Земли.
На рисунке ниже представлены использование системы «Эйдос» в
различных странах мира, причем в основном, к сожалению, не в России
(рисунок 1):
Рисунок 1. Карта и база данных системы «Эйдос» с информацией о
запусках системы «Эйдос » в мире с 09.12.2016 по 24.10.2017
Вместо пояснения по рисунку приведем ниже экранную форму
помощи по режиму, обеспечивающему отображение на карте мира и в базе
данных информации о запусках системы «Эйдос» (рисунок 2):
12
Рисунок 2. Экранная форма Help по режиму 6. 9 системы «Эйдос»:
Исследования по некоторым из перечисленных направлений мы
постараемся отразить в данной работе.
Две монографии проф. Е. В. Луценко размещены в библиотеке
конгресса США [3, 16]:
– Симанков В. С. , Луценко Е. В. Адаптивное управление сложными
системами на основе теории распознавания образов. Монография (научное
издание). – Краснодар: ТУ КубГТУ, 1999. - 318с.
http://elibrary.ru/item.asp?id=18828433.
– Трунев А. П. , Луценко Е. В. Автоматизированный системно-
когнитивный анализ влияния факторов космической среды на ноосферу,
магнитосферу и литосферу Земли: Под науч. ред. д. т. н. , проф. В. И.
Лойко. Монография (научное издание). – Краснодар, КубГАУ. 2012. – 480
с. ISBN 978-5-94672-519-4. http://elibrary.ru/item.asp?id=21683737.
1.3.11. В каких областях может применяться АСК-анализ?
По мнению авторов АСК-анализ, как метод искусственного
интеллекта, может успешно применяться во всех областях, в которых для
решения своих профессиональных задач специалист использует свой
естественный интеллект, при этом АСК-анализ выступает в качестве
инструмента, многократно увеличивающего возможности естественного
интеллекта.
АСК-анализ может применяться во всех предметных областях, где
ученый или практики решает свои профессиональные задачи и проблемы,
постоянно развивает свои знания, используя новейшие достижения в сфере
искусственного интеллекта.
Главный вывод: автоматизированный системно-когнитивный
анализу присущи все основные признаки нового перспективного
13
междисциплинарного научного направления в рамках
автоматизированного системного анализа.
1.3.12. Internet-ссылки по АСК-анализу
Интернет-ссылки по АСК-анализу лучше всего представлены на
сайте проф. Е. В. Луценко: http://lc.kubagro.ru/. Данный сайт посетило уже
более 500000 посетителей с уникальными IP-адресами.
Страничка проф. Е. В. Луценко имеется на сайте Научного журнала
КубГАУ: http://ej.kubagro.ru/a/viewaut.asp?id=11. В расчете на фамилию автора
приходится более 295000 прочтений статей.
1.3.13. О плагиаторах, использующих работы по АСК-анализу,
находящиеся в Internet в открытом доступе
Все авторы научных работ по АСК-анализу всегда размещали и
размещают их в свободном открытом бесплатном доступе, чем не
преминули воспользоваться плагиаторы. Лучше всего их деятельность
описана в статье «Групповой плагиат: от студента до министра»
6
. Чтобы
найти многочисленные «труды» плагиаторов, включая диссертации,
достаточно в любой поисковой системе Internet сделать запрос, например:
«Коэффициенты эмерджентности Хартли, Харкевича, Шеннона», которые
автор системной теории информации (СТИ) проф. Е. В. Луценко назвал
так в честь этих выдающихся ученых в области теории информации. При
этом автор следовал сложившейся научной традиции называть единицы
измерения и математические выражения в честь выдающихся ученых (Ом,
Джоуль, Ватт, Ньютон, Тесла и т.д). Причем часто плагиаторы даже не
понимают, что сами основоположники и классики теории информации не
предлагали этих коэффициентов, а предложены они были в работах проф.
Е. В. Луценко [5]
7
. Наверное, поэтому они и не считают нужным делать
ссылки и пишут, например:
1. «По Харкевичу коэффициент эмерджентности определяет степень
детерменированности ситемы…» (подчеркнуто нами, авт. , в цитате
сохранены орфографические ошибки плагиатора).
2. «Отсюда строится системная численная мера количества
информации в ИС на основе оценки эмерджентности системы (по Хартли
и Харкевичу)» (выделено плагиатором).
Эти фразы легко найти в Internet. Здесь автор не считает нужным
уделять вопросу о плагиате большего внимания. Отметим лишь, что эта
плагиаторская деятельность не просто продолжается, а даже набирает
обороты.
6
Вяткин В.Б. Групповой плагиат: от студента до министра. - Троицкий вариант — Наука -
http://trv-science.ru - [Электронный ресурс]. Адрес доступа: http://trv-science.ru/2011/11/08/gruppovojj-
plagiat-ot-studenta-do-ministra/ или: http://trv-science.ru/2011/11/08/gruppovojj-plagiat-ot-studenta-do-
ministra/print/
7
См., также: Луценко Е.В. Подборка публикаций по вопросам системного обобщения
математики, теории множеств и теории информации: http://www.twirpx.com/file/780491/
14
Перейдем теперь к описанию применения АСК-анализа и его
программного инструментария – интеллектуальной системы «Эйдос», для
решения поставленной задачи.
При этом мы будем следовать этапам АСК-анализа и порядку
преобразования данных в информацию, а ее в знания, принятым в АСК-
анализе, приведенным ниже:
Процесс преобразования данных в информацию, а ее в знания
называется анализ. Основные его этапы приведены на рисунке 3:
ДАННЫЕ
(ИНФОРМАЦИЯ, ЗАПИСАННАЯ
НА КАКОМ-ЛИБО ЯЗЫКЕ ИЛИ В СИСТЕМЕ КОДИРОВАНИЯ
НА НОСИТЕЛЕ ИЛИ НАХОДЯЩАЯСЯ В КАНАЛЕ СВЯЗИ
И РАССМАТРИВАЕМАЯ БЕЗОТНОСИТЕЛЬНО
К ЕЕ СМЫСЛОВОМУ СОДЕРЖАНИЮ)
ИНФОРМАЦИЯ
(ОСМЫСЛЕННЫЕ ДАННЫЕ, Т.Е. СОГЛАСНО КОНЦЕПЦИИ
СМЫСЛА ШЕНКА-АБЕЛЬСОНА ДАННЫЕ, В КОТОРЫХ
ВЫЯВЛЕНЫ ПРИЧИННО-СЛЕДСТВЕННЫЕ ЗАВИСИМОСТИ)
ЗНАНИЯ
(ИНФОРМАЦИЯ, ПОЛЕЗНАЯ
ДЛЯ ДОСТИЖЕНИЯ ЦЕЛЕЙ,
Т.Е. УПРАВЛЕНИЯ)
Постановка целей,
оценка знака и степени
влияния информации
на их достижение
Анализ данных -
выявление в них
событий и причинно-
следственных связей
между событиями
О соотношении содержания понятий: «Данные», «Информация» и «Знания»
Рисунок 3. Преобразование данных в информацию, а ее знания
В системе «Эйдос» этот процесс осуществляется в следующей
последовательности (рисунок 4).
Основные публикации автора по вопросам выявления,
представления и использования знаний [1-41].
Из вышеизложенного можно сделать обоснованный вывод о том, что
АСК-анализ и система «Эйдос» обеспечивают движение познания от
эмпирических данных к информации, а от нее к знаниям. По сути, это
движение от феноменологических моделей, описывающих явления внешне,
к содержательным теоретическим моделям [31].
15
Появляется все больше сайтов, посвященных искусственному
интеллекту, в открытом доступе появляются базы данных для машинного
обучения (UCI
8
, Kaggle
9
и другие) и даже on-line интеллектуальные
Однако учащиеся и ученые до сих пор практически не замечают, что
уже давно существует и действует открытая масштабируемая
интерактивная интеллектуальная on-line среда для обучения и научных
исследований в области искусственного интеллекта, основанная на
автоматизированном системно-когнитивном анализе (АСК-анализ) и его
программном инструментарии – интеллектуальной системе «Эйдос», а
также сайте автора.
Последовательность обработки данных, информации и знаний в системе «Эйдос-Х++»
Когнитивно-целевая структуризация предметной области
(неавтоматизированный в системе «Эйдос-Х++» этап АСК-анализа)
Формализация предметной области
Class_Sc, Gr_ClSc
Классификационные
шкалы и градации Opis_Sc, Gr_OpSc
Описательные
шкалы и градации
Inp_data, Inp_data.xls
Исходные данные
Обучающая выборка,
эвентологическая
база данных Obi_zag
Заголовки объектов
обучающей выборки
Obi_Kcl
Коды классов объектов
обучающей выборки Obi_Krg
Коды признаков объектов
обучающей выборки
Средства кодирования
исходных данных
Синтез и верификация моделей
Статистические
модели
Системно-когнитивные
модели (модели знаний)
(многопараметрическая
типизация)
Abs
Матрица абсолютных частот
(матрица сопряженности,
корреляционная матрица)
Prc2
Матрица условных
и безусловных процентных
распределений, расчитанная
по числу объектов классов
Prc1
Матрица условных
и безусловных процентных
распределений, расчитанная
по числу признаков классов
INF3
разности между
фактическими и
теоретически
ожидаемыми
частотами
INF2
Количество
знаний по
А.Харкевичу
INF5
ROI-return on
investment
INF6
Разность
условной и
безусловной
вероятностей
INF1
Количество
знаний по
А.Харкевичу
INF4
ROI-return on
investment
INF6
Разность
условной и
безусловной
вероятностей
Выбор
наиболее достоверной
модели
Решение задач распознавания
системной идентификации
и прогнозирования
Решение
задач Решение задач управления
(поддержки принятия решений)
Решение задач исследования
предметной области путем
исследования ее модели
Рисунок 4. Преобразование данных в информацию, а ее знания
в системе «Эйдос»
8
http://archive.ics.uci.edu/ml/datasets.html
9
https://www.kaggle.com/datasets
16
2. Когнитивно-целевая структуризация предметной
области
На этом этапе АСК-анализа разработчик интеллектуального
приложения решает, что оно должно прогнозировать и на основе чего, т.е.
что является классами, а что факторами, под влиянием которых объект
моделирования оказывается в состояниях, соответствующих классам.
Это единственный не автоматизированный этап АСК-анализа. Все
остальные его этапы автоматизированы в его программном
инструментарии – интеллектуальной системе «Эйдос».
В нашем случае в качестве классификационных шкал нами выбраны:
– ДЕЙСТВИЕ НА САЙТЕ;
– ЦЕЛЬ ДЕЙСТВИЯ;
Могут быть использованы и другие классификационные шкалы с
подобным смыслом, отражающие длительность обслуживания клиента.
Классы, т.е. группы клиентов с различной длительностью
обслуживания, представляют собой градации классификационных шкал.
Необходимо отметить, что непосредственно в исходных данных указанных
классификационных шкал нет, но их интервальные значения могут быть
посчитаны на основе тех данных, которые есть.
В качестве описательных шкал в создаваемых системно-
когнитивных моделях использованы:
– ПЛАТФОРМА;
– ОПЕРАЦИОННАЯ СИСТЕМА;
– ID ТОВАРА;
– КАТЕГОРИЯ;
– ПОДКАТЕГОРИЯ;
– БРЭНД;
– ФЛАГ ПРОМО;
– ТИП СТРАНИЦЫ.
Эта информация приведена в файле: «description.csv», который
скачивается с сайта чемпионата: https://raif.jet.su:
1. Numb;Номер
2. tstamp;Временной слепок
3. session_id;ID сессии
4. calday;Дата конкретного действия клиента
5. cnt;Количество
6. platform;Платформа
7. os;Операционная система
8. cookie;Cookie пользователя
9. action;Действие на сайте
10. target;Цель действия
17
11. material;ID товара
12. txtlg;Описание товара
13. category1;Категория
14. category2;Подкатегория
15. brand;Брэнд
16. promo;Флаг промо
17. page_type;Тип страницы
Здесь светло-желтым фоном выделены шкалы, градации которых
соответствуют целевым и нежелательным состояниям.
Светло-зеленым фоном выделены шкалы, градации которых
соответствуют значениям факторов, положительно или отрицательно и с
разной силой влияющих на реализацию целевых и нежелательных
состояний.
Не выделенные цветом поля 1-4 отражают источник данных.
5-е поле не имеет вариабельности значений и является бесполезным
для решения задачи.
Поля 8-е и 12-е имеют высокую степень уникальности и с одной
стороны значительно увеличивают размерность модели и затраты
вычислительных ресурсов на создание и использование моделей, а с
другой стороны по ним нет обобщения. Поэтому на этом этапе
исследований и разработок не используются в создаваемых моделях.
Кроме того поле «12. txtlg;Описание товара» имеет нежелательную
кодировку ANSI UTF-8, которую сложно использовать.
3. Формализация предметной области
На этапе формализации предметной области разрабатываются
классификационные и описательные шкалы и градации, которые затем
используются для кодирования исходных данных, в результате чего
формируется обучающая выборка, т.е. по сути производится нормализация
исходных данных. Необходимо отметить, что нормализация исходных
данных осуществляется в форме, удобной для дальнейшей обработки
данных в системе «Эйдос».
3.1. Исходные данные и их характеристика
Исходные данные для решения поставленной задачи скачивается с
сайта чемпионата: https://raif.jet.su.
Фрагмент исходных данных приведен на рисунке:
18
Рисунок 5. Фрагмент исходных данных из файла: «jet_raif_challenge.csv»
Важной особенностью исходных данных является их очень большой
объем: они содержат данные по 4 миллионам посещений сайтов.
Конечно это еще не Big data (большие данные), но уже приближается
к этому.
Ясно, что при таких объемах исходных данных ввести их в систему
для обработки можно только с помощью специально разработанного
программного интерфейса.
И такой программный интерфейс был разработан автором и даже
включен в состав программных интерфейсов системы «Эйдос», и тем
самым по сути стандартизирован (рисунок 6):
Рисунок 6. Экранная форма с главным меню системы «Эйдос»,
на котором показаны программные интерфейсы с внешними источниками
19
данных, включая программный интерфейс подготовки исходных данных
из файла: «jet_raif_challenge.csv» (режим 2.3.2.11)
Это сделано для того, чтобы в перспективе систему «Эйдос» проще
было адаптировать для решения этой задачи с исходными данными
аналогичной структуры.
Ниже в следующем разделе приведен исходный текст программного
интерфейса 2.3.2.11.
3.2. Исходный код программного интерфейса между данными по
задаче «AI в ритейле» Чемпионата RAIF-Challenge 2017 (режим
2.3.2.11) и системой «Эйдос»
Обобщенный алгоритм программного интерфейса между данными
по задаче «AI в банках» Чемпионата RAIF-Challenge 2017 и программным
интерфейсом системы «Эйдос» с внешними данными табличного типа
приведен ниже (язык программирования xBase++):
Исходный текст программного интерфейса между данными по
задаче «AI в ритейле» Чемпионата RAIF-Challenge 2017 и программным
интерфейсом системы «Эйдос» с внешними данными табличного типа
приведен ниже (язык программирования xBase++):
**********************************************************************************************
******** Создание БД Inp_data.dbf и файла: Inp_name.txt из файлов:
******** jet_raif_challenge.csv и description.csv'
**********************************************************************************************
FUNCTION F2_3_2_11()
mNameInpData = "C:\AIDOS-X\AID_DATA\Inp_data\"
DIRCHANGE(mNameInpData) // Перейти в папку Inp_data
cFile='description.csv' ;IF .NOT. FILE(cFile);LB_Warning('В папке: '+mNameInpData+'
нет файла: '+cFile );RETURN NIL;ENDIF
cFile='jet_raif_challenge.csv';IF .NOT. FILE(cFile);LB_Warning('В папке: '+mNameInpData+'
нет файла: '+cFile );RETURN NIL;ENDIF
oScrn := DC_WaitOn( 'Определение минимальных достаточных размеров полей БД "Inp_data.dbf"'
)
***** Можно это сделать на сравнительно небольшом файле
***** Создать и записать БД InpDat.dbf
aStr := { { "Numb" , "C", 255, 0 }, ; // 1 Numb
{ "tstamp" , "C", 255, 0 }, ; // 2 tstamp;Временной слепок
1 <=== Наименование объекта: 1=1+2+3+4
{ "session_i" , "C", 255, 0 }, ; // 3 session_id;ID сессии
{ "calday" , "C", 255, 0 }, ; // 4 calday;Дата конкретного действия
клиента
{ "cnt" , "C", 255, 0 }, ; // 5 cnt;Количество
4
{ "platform" , "C", 255, 0 }, ; // 6 platform;Платформа
5
{ "os" , "C", 255, 0 }, ; // 7 os;Операционная система
6
{ "cookie" , "C", 255, 0 }, ; // 8 cookie;Cookie пользователя
7
{ "action" , "C", 255, 0 }, ; // 9 action;Действие на сайте <======
Классы 2
{ "target" , "C", 255, 0 }, ; // 10 target;Цель действия <======
3
20
{ "material" , "C", 255, 0 }, ; // 11 material;ID товара
8
{ "txtlg" , "C", 255, 0 }, ; // 12 txtlg;Описание товара
9
{ "category1" , "C", 255, 0 }, ; // 13 category1;Категория
10
{ "category2" , "C", 255, 0 }, ; // 14 category2;Подкатегория
11
{ "brand" , "C", 255, 0 }, ; // 15 brand;Брэнд
12
{ "promo" , "C", 255, 0 }, ; // 16 promo;Флаг промо
13
{ "page_type" , "C", 255, 0 } } // 17 page_type;Тип страницы
14
*DC_DebugQout( aStr )
*LB_Warning(aStr) // Отладка
DbCreate( 'InpDat1', aStr )
CLOSE ALL
USE InpDat1 EXCLUSIVE NEW
SELECT InpDat1
*APPEND FROM jet_raif_challenge.csv DELIMITED RECORD 1000
APPEND FROM jet_raif_100.csv DELIMITED
CLOSE ALL
*MsgBox('STOP')
*************************************************************************************
* 1 Numb
* 2 tstamp;Временной слепок 1 <=== Наименование объекта: 1=1+2+3+4
* 3 session_id;ID сессии
* 4 calday;Дата конкретного действия клиента
* ----------------------------------------------
* 5 cnt;Количество 4
* 6 platform;Платформа 5
* 7 os;Операционная система 6
* 8 cookie;Cookie пользователя 7
* ----------------------------------------------
* 9 action;Действие на сайте <====== Классы 2
* 10 target;Цель действия <====== 3
* ----------------------------------------------
* 11 material;ID товара 8
* 12 txtlg;Описание товара 9
* 13 category1;Категория 10
* 14 category2;Подкатегория 11
* 15 brand;Брэнд 12
* 16 promo;Флаг промо 13
* 17 page_type;Тип страницы 14
*************************************************************************************
*** Цикл по записям БД InpDat
USE InpDat1 EXCLUSIVE NEW
SELECT InpDat1
PRIVATE aLenField[FCOUNT()]
AFILL(aLenField, 15)
DBGOTOP()
DELETE FOR RECNO()=1
PACK
DBGOTOP()
FOR j=1 TO FCOUNT()
INDEX ON FIELDNAME(j) TO InpDat
DBGOBOTTOM()
aLenField[j] = MAX(aLenField[j], LEN(ALLTRIM(FIELDGET(j))))
NEXT
21
DC_Impl(oScrn)
CLOSE ALL
*LB_Warning(aLenField) // Отладка
oScrn := DC_WaitOn( 'Преобразование файла: "jet_raif_challenge.csv" в БД "InpDat.dbf"' )
***** Создать и записать БД InpDat.dbf
aLenField[ 1] = 8
aLenField[13] = 8
aStr := { { "Numb" , "C", aLenField[ 1], 0 }, ; // 1 Numb
{ "tstamp" , "C", aLenField[ 2], 0 }, ; // 2 tstamp;Временной слепок
1 <=== Наименование объекта: 1=1+2+3+4
{ "session_i" , "C", aLenField[ 3], 0 }, ; // 3 session_id;ID сессии
{ "calday" , "C", aLenField[ 4], 0 }, ; // 4 calday;Дата конкретного
действия клиента
{ "cnt" , "C", aLenField[ 5], 0 }, ; // 5 cnt;Количество
4
{ "platform" , "C", aLenField[ 6], 0 }, ; // 6 platform;Платформа
5
{ "os" , "C", aLenField[ 7], 0 }, ; // 7 os;Операционная система
6
{ "cookie" , "C", aLenField[ 8], 0 }, ; // 8 cookie;Cookie пользователя
7
{ "action" , "C", aLenField[ 9], 0 }, ; // 9 action;Действие на сайте
<====== Классы 2
{ "target" , "C", aLenField[10], 0 }, ; // 10 target;Цель действия
<====== 3
{ "material" , "C", aLenField[11], 0 }, ; // 11 material;ID товара
8
{ "txtlg" , "C", aLenField[12], 0 }, ; // 12 txtlg;Описание товара
9
{ "category1" , "C", aLenField[13], 0 }, ; // 13 category1;Категория
10
{ "category2" , "C", aLenField[14], 0 }, ; // 14 category2;Подкатегория
11
{ "brand" , "C", aLenField[15], 0 }, ; // 15 brand;Брэнд
12
{ "promo" , "C", aLenField[16], 0 }, ; // 16 promo;Флаг промо
13
{ "page_type" , "C", aLenField[17], 0 } } // 17 page_type;Тип страницы
14
*DC_DebugQout( aStr )
*LB_Warning(aStr) // Отладка
DbCreate( 'InpDat2', aStr )
CLOSE ALL
USE InpDat2 EXCLUSIVE NEW
SELECT InpDat2
*APPEND FROM jet_raif_challenge.csv DELIMITED RECORD 1000 // Отладка
APPEND FROM jet_raif_challenge.csv DELIMITED
*APPEND FROM jet_raif_100.csv DELIMITED
DC_Impl(oScrn)
oScrn := DC_WaitOn( 'Преобразование БД: "InpDat.dbf" в БД "Inp_data.dbf"' )
CLOSE ALL
***** Создать и записать БД Inp_data.dbf
LenCol1234 = aLenField[1]+aLenField[2]+aLenField[3]+aLenField[4]+6
aLenField[13] = 8
aStr := { { "Col1234 " , "C", LenCol1234 , 0 }, ; // 1 (1+2+3+4) Номер объекта,
слепок, ID сессии, дата
{ "action " , "C", aLenField[ 9], 0 }, ; // 2 (9) Действие на сайте
(класс)
22
{ "target " , "C", aLenField[10], 0 }, ; // 3 (10) Цель посещения сайта
(класс)
{ "cnt " , "C", aLenField[ 4], 0 }, ; // 4 (5) <====
{ "platform " , "C", aLenField[ 5], 0 }, ; // 5 (6)
{ "os " , "C", aLenField[ 6], 0 }, ; // 6 (7)
{ "cookie " , "C", aLenField[ 7], 0 }, ; // 7 (8) <====
{ "material " , "C", aLenField[11], 0 }, ; // 8 (11) <====
{ "txtlg " , "C", aLenField[12], 0 }, ; // 9 (12)
{ "category1 " , "C", aLenField[13], 0 }, ; // 10 (13)
{ "category2 " , "C", aLenField[14], 0 }, ; // 11 (14)
{ "brand " , "C", aLenField[15], 0 }, ; // 12 (15)
{ "promo " , "C", aLenField[16], 0 }, ; // 13 (16)
{ "page_type " , "C", aLenField[17], 0 } } // 14 (17) <====
* LB_Warning(aStr) // Отладка
DbCreate( 'Inp_data.dbf', aStr )
CLOSE ALL
USE InpDat2 EXCLUSIVE NEW
USE Inp_data EXCLUSIVE NEW
SELECT InpDat2
DBGOTOP()
DBSKIP(1)
DO WHILE .NOT. EOF()
aR := {}
FOR j=1 TO FCOUNT()
AADD(aR, ALLTRIM(FIELDGET(j)))
NEXT
SELECT Inp_data
APPEND BLANK
FIELDPUT(1, aR[1]+'--'+aR[2]+'--'+aR[3]+'--'+aR[4]) // Номер объекта, слепок, ID
сессии, дата
FIELDPUT(2, aR[9]) // Класс (действие на сайте)
FIELDPUT(3, aR[10]) // Класс (цель)
FOR j=5 TO 7
FIELDPUT(j-1, aR[j] )
NEXT
FOR j=11 TO 17
IF j <> 12
FIELDPUT(j-3, aR[j] )
ENDIF
NEXT
SELECT InpDat2
DBSKIP(1)
ENDDO
DC_Impl(oScrn)
oScrn := DC_WaitOn( 'Преобразование файла: "description.csv" в "Inp_name.txt"' )
CrLf = CHR(13)+CHR(10) // Конец строки (записи) HEX(0D)+HEX(0A)
aInp_name := {}
nHandle := DC_txtOpen( 'description.csv' )
DO WHILE !DC_TxtEOF( nHandle ) // Начало цикла по строкам
mLine = DC_TxtLine( nHandle ) // Выделить строку из текстового файла
mPos = AT(';',mLine)
AADD(aInp_name, SUBSTR(mLine,mPos+1,LEN(mLine)-mPos+1))
DC_TxtSkip( nHandle, 1 )
ENDDO
DC_TxtClose( nHandle )
*************************************************************************************
* 1 Numb
* 2 tstamp;Временной слепок 1 <=== Наименование объекта: 1=1+2+3+4
* 3 session_id;ID сессии
* 4 calday;Дата конкретного действия клиента
23
* ----------------------------------------------
* 5 cnt;Количество 4
* 6 platform;Платформа 5
* 7 os;Операционная система 6
* 8 cookie;Cookie пользователя 7
* ----------------------------------------------
* 9 action;Действие на сайте <====== Классы 2
* 10 target;Цель действия <====== 3
* ----------------------------------------------
* 11 material;ID товара 8
* 12 txtlg;Описание товара 9
* 13 category1;Категория 10
* 14 category2;Подкатегория 11
* 15 brand;Брэнд 12
* 16 promo;Флаг промо 13
* 17 page_type;Тип страницы 14
*************************************************************************************
mInp_name = ''
*mInp_name = mInp_name + aInp_name[1]+'-'+aInp_name[2] + CrLf // Номер объекта и ID
сессии
mInp_name = mInp_name + aInp_name[ 9] + CrLf // Класс (действие на
сайте)
mInp_name = mInp_name + aInp_name[10] + CrLf // Класс (цель)
FOR j=5 TO 8
mInp_name = mInp_name + aInp_name[j] + CrLf
NEXT
FOR j=11 TO 17
mInp_name = mInp_name + aInp_name[j] + CrLf
NEXT
mInp_name = mInp_name + CrLf
StrFile(mInp_name, 'Inp_name.txt') // Запись текстового файла: Inp_name.txt
DC_Impl(oScrn)
LB_Warning('Создание БД Inp_data.dbf и файла: Inp_name.txt из файлов: jet_raif_challenge.csv
и description.csv завершено успешно!')
RETURN NIL
Данный исходный текст включен в исходный текст системы
«Эйдос»: http://lc.kubagro.ru/_AIDOS-X.txt как функция F2_3_2_11(),
запуск которой обеспечивается непосредственно из главного меню
системы (рисунок 6).
Чтобы найти эту функцию в исходном тексте системы «Эйдос»,
открываемом по приведенной ссылке, надо просто нажать: Ctrl+F и в
паявшемся окошке поиска ввести: «N F2_3_2_11 «(рисунок 7):
24
Рисунок 7. Экранная форма браузера с поиском функции 2.3.2.11
в исходном тексте системы «Эйдос»: http://lc.kubagro.ru/_AIDOS-X.txt
В результате работы программного интерфейса 2.3.2.10 формируется
файл исходных данных Inp_data.dbf, содержащий всю информацию из
файла: «jet_raif_challenge.csv» (рисунок 8):
Рисунок 8. Исходные данные (Inp_data.dbf), формируемые API_2.3.2.11
(фрагмент)
При этом необходимо отметить, что файл исходных Inp_data.dbf,
формируемый интерфейсом 2.3.2.11 содержит 4 миллиона записей и имеет
25
размер около 1 Гб. По числу записей этот файл в 4 раза превосходит
возможности новых версий MS Excel. Все его поля имеют минимальный
размер, достаточный для полного размещения исходных данных в них.
Кроме того этим же интерфейсом формируется файл: Inp_name.txt с
русскими наименованиями классификационных и описательных шкал
(колонок) файла Inp_data.dbf:
Действие на сайте
Цель действия
Количество
Платформа
Операционная система
Cookie пользователя
ID товара
Описание товара
Категория
Подкатегория
Брэнд
Флаг промо
Тип страницы.
3.3. Универсальный программный интерфейс (API) системы
«Эйдос» для ввода данных из внешних источников данных типа
таблиц MS Excel
В системе «Эйдос» есть универсальный программный интерфейс
(API) для ввода данных из внешних источников данных типа таблиц MS
Excel.
На рисунке 9 приведена экранная форма этого интерфейса с
параметрами, с которыми он был запущен для ввода данных в систему
«Эйдос» из базы данных Inp_data.dbf, созданной программным
интерфейсом 2.3.2.11, описанным в предыдущем разделе. Файлы
«Inp_data.dbf» с данными и «Inp_name.txt» с русскими наименованиями
шкал, приведенный выше, должны быть в папке: «..\Aidos-
X\AID_DATA\Inp_data\».
26
Рисунок 9. Экранная форма программного интерфейса (API_2.3.2.2)
системы «Эйдос» для ввода данных из внешней базы данных Inp_data.dbf
Отметим, что задана опция не формировать базу данных
Inp_davr.dbf, которое занимает довольно много времени на огромном
объеме исходных данных и не является принципиальным для решения
поставленной задачи.
Вместо описания данного API_2.3.2.2 приведем ниже его HELP
(рисунок 10):
27
Рисунок 10. Экранная форма HELP программного интерфейса
(API_2.3.2.2) системы «Эйдос» для ввода данных
из внешних таблиц MS Excel и баз данных dbf
Данный программный интерфейс имеет развитие средства анализа
корректности исходных данных. В результате его применения
непосредственно на исходных данных, по причине отсутствия в них
вариабельности значений.
После этого программный интерфейс находит в базе исходных
данных Inp_data.dbf классификационные и описательные шкалы и
градации, и, если среди них есть числовые по типу данных, то запрашивает
число интервальных числовых значений, на которое разбивать диапазон
изменения значений числовой шкалы (рисунок 11):
28
Рисунок 11. Внутренний калькулятор API_2.3.2.2 системы «Эйдос»
После запуска API_2.3.2.2 с параметрами, приведенными на
рисунках 10 и 11 начинается процесс формализации предметной области,
включающий разработку классификационных и описательных шкал и
градаций и кодирование с их помощью исходных данных, в результате
чего формируется база событий (обучающая выборка). По сути этот
процесс представляет собой нормализацию базы исходных данных по
значениям факторов и классам. Этапы и стадия исполнения этого процесса
приведены на рисунке 12:
Рисунок 12. Экранная форма отображения этапов и стадии
процесса формализации предметной области
Отметим, что в связи с огромным объемом исходных данных,
содержащих описание 4 миллионов обращений посетителей к сайту в 2
классификационных и 8 описательных шкалах, этот процесс занимает
довольно длительное время: 1 час 34 минуты 43 секунды, даже на
процессоре i7 и SSD диске.
29
При выходе на формирование моделей API_2.3.2.2 автоматически
дал результаты ниже в последующих разделах.
3.4. Классификационные шкалы и градации
В для создания моделей используется 2 классификационных шкалы
по 11 градациями (классами) в каждой (таблица 1):
Таблица 1 – Классификационные шкалы и градации (классы)
KOD_CLS
NAME_CLS
1
ДЕЙСТВИЕ НА САЙТЕ-add
2
ДЕЙСТВИЕ НА САЙТЕ-click
3
ДЕЙСТВИЕ НА САЙТЕ-detailImpression
4
ДЕЙСТВИЕ НА САЙТЕ-listingImpression
5
ДЕЙСТВИЕ НА САЙТЕ-purchase
6
ДЕЙСТВИЕ НА САЙТЕ-remove
7
ДЕЙСТВИЕ НА САЙТЕ-search
8
ДЕЙСТВИЕ НА САЙТЕ-view
9
ЦЕЛЬ ДЕЙСТВИЯ-cart
10
ЦЕЛЬ ДЕЙСТВИЯ-compare
11
ЦЕЛЬ ДЕЙСТВИЯ-wishlist
3.5. Описательные шкалы и градации
В для создания моделей используется 8 описательных шкал
(таблица 2) с суммарным числом градаций 1728 (таблица 3):
Таблица 2 –Описательные шкалы
KOD_OPSC
NAME_OPSC
1
ПЛАТФОРМА
2
ОПЕРАЦИОННАЯ СИСТЕМА
3
ID ТОВАРА
4
КАТЕГОРИЯ
5
ПОДКАТЕГОРИЯ
6
БРЭНД
7
ФЛАГ ПРОМО
8
ТИП СТРАНИЦЫ
Таблица 3 –Описательные шкалы и градации (фрагмент)
KOD_ATR
NAME_ATR
1
ПЛАТФОРМА-DESKTOP
2
ПЛАТФОРМА-MOBILE
3
ПЛАТФОРМА-TABLET
4
ОПЕРАЦИОННАЯ СИСТЕМА-(NOT SE
5
ОПЕРАЦИОННАЯ СИСТЕМА-ANDROID
6
ОПЕРАЦИОННАЯ СИСТЕМА-BLACKBE
7
ОПЕРАЦИОННАЯ СИСТЕМА-CHROME
8
ОПЕРАЦИОННАЯ СИСТЕМА-IOS
9
ОПЕРАЦИОННАЯ СИСТЕМА-LINUX
10
ОПЕРАЦИОННАЯ СИСТЕМА-MACINTO
11
ОПЕРАЦИОННАЯ СИСТЕМА-WINDOWS
12
ОПЕРАЦИОННАЯ СИСТЕМА-XBOX
13
ID ТОВАРА-000000000000000
14
ID ТОВАРА-000000000000001
15
ID ТОВАРА-000000000000002
* * * * * *
440
ID ТОВАРА-000000000050048
30
441
ID ТОВАРА-000000000050049
442
ID ТОВАРА-000000000050050
443
КАТЕГОРИЯ-1010102
444
КАТЕГОРИЯ-1020206
445
КАТЕГОРИЯ-1020306
* * * * * *
764
КАТЕГОРИЯ-6010101
765
КАТЕГОРИЯ-7010101
766
КАТЕГОРИЯ-9100101
767
ПОДКАТЕГОРИЯ-10101
768
ПОДКАТЕГОРИЯ-10202
769
ПОДКАТЕГОРИЯ-10203
* * * * * *
941
ПОДКАТЕГОРИЯ-60101
942
ПОДКАТЕГОРИЯ-70101
943
ПОДКАТЕГОРИЯ-91001
944
БРЭНД-1
945
БРЭНД-10
946
БРЭНД-1000
* * * * * *
1707
БРЭНД-991
1708
БРЭНД-995
1709
БРЭНД-999
1710
ФЛАГ ПРОМО-0
1711
ФЛАГ ПРОМО-1
1712
ТИП СТРАНИЦЫ-[object Object
1713
ТИП СТРАНИЦЫ-404Page
1714
ТИП СТРАНИЦЫ-AddToCart
1715
ТИП СТРАНИЦЫ-Cart
1716
ТИП СТРАНИЦЫ-Checkout
1717
ТИП СТРАНИЦЫ-Compare
1718
ТИП СТРАНИЦЫ-HoldingPage
1719
ТИП СТРАНИЦЫ-InfoPage
1720
ТИП СТРАНИЦЫ-Main
1721
ТИП СТРАНИЦЫ-Portal
1722
ТИП СТРАНИЦЫ-ProductListing
1723
ТИП СТРАНИЦЫ-ProductPage
1724
ТИП СТРАНИЦЫ-Profile
1725
ТИП СТРАНИЦЫ-PromoPage
1726
ТИП СТРАНИЦЫ-SearchResults
1727
ТИП СТРАНИЦЫ-ThankYouPage
1728
ТИП СТРАНИЦЫ-Wishlist
3.6. Обучающая выборка
Обучающая выборка (рисунок 13) представляет собой исходные
данные (рисунок 8), закодированные с помощью классификационных и
описательных шкал и градаций (таблицы 1 - 3):
31
Рисунок 13. Обучающая выборка (фрагмент)
Всего в обучающей выборке представлено 4 млн. наблюдений. По
сути обучающая выборка (рисунок 13) представляет собой базу исходных
данных (рисунок 8), нормализованную с помощью классификационных и
описательных шкал и градаций (таблицы 1 - 3).
Формализация исходных данных создает все необходимые и
достаточные предпосылки для синтеза и верификации статистических и
системно-когнитивных моделей.
4. Синтез и верификация системно-когнитивных моделей
4.1. Синтез и верификация моделей
Синтез и верификация статистических и системно-когнитивных
моделей осуществляется в режиме 3.5 системы «Эйдос». Этот режим был
запущен с параметрами, показанными на верхнем рисунке 14. В результате
через 17 часов 30 минут 59 секунд были получены 3 статистических и 7
системно-когнитивных моделей (нижний рисунок 14). В основном это
время ушло на формирование матрицы абсолютных частот на основе 4
млн. примеров.
Для верификации (оценки достоверности моделей) был использован
бутстрепный метод (поддерживается системой «Эйдос»), т.е. для этого
были использованы не все 4 млн. объекта обучающей выборки, а лишь
2000 из них, отобранных случайным образом по всей выборке. Это заняло
1 час 35 минут 18 секунд, т.е. 3600+35*60+18= 5718 секунд, т.е. 2,859 на
идентификацию 1 посещения в 10 моделях (0,2859 в одной модели).
Если бы для этой цели использовались все объекты, то этот процесс
занял бы немного меньше двух недель непрерывного счета в одной
модели, что не входило в наши планы в связи с ограниченностью времени
проведения чемпионата.
32
33
Рисунок 14. Экранные формы режима синтеза статистических
и системно-когнитивных моделей системы «Эйдос»
Рисунок 15. Экранные формы верификации статистических
и системно-когнитивных моделей системы «Эйдос»
В результате выполнения данного режима создается три
статистических и 7 системно-когнитивных моделей, фрагменты некоторых
34
из которых приведены на рисунках 15-22. Полностью модели не
приводятся из-за их большой размерности: это таблица из 11 колонок и
1728 строк.
Рисунок 15. Модель ABS (фрагмент)
Рисунок 16. Модель PRC2 (фрагмент)
35
Рисунок 17. Модель INF1 (фрагмент)
Рисунок 18. Модель INF3 (фрагмент)
Модель ABS представляет собой матрицу абсолютных частот фактов
наблюдения определенного значения описательной шкалы при
определенном значении классификационной шкалы.
4.2. Частные критерии знаний, используемые в настоящее время
в АСК-анализе и системе «Эйдос»
Приведенные выше и другие статистические и системно-
когнитивные модели рассчитываются на основе матрицы абсолютных
частот с применением различных частных критериев знаний, описанных
ниже в таблице 4:
36
Таблица 4 – Частные критерии знаний, используемые
в настоящее время в АСК-анализе и системе «Эйдос»
Наименование модели знаний
и частный критерий
Выражение для частного критерия
через
относительные частоты
через
абсолютные частоты
INF1, частный критерий: количество знаний по
А.Харкевичу, 1-й вариант расчета относительных
частот: Nj – суммарное количество признаков по j-му
классу. Относительная частота того, что если у
объекта j-го класса обнаружен признак, то это i-й
признак
i
ij
ij P
P
LogI 2
ji
ij
ij NN
NN
LogI 2
INF2, частный критерий: количество знаний по
А.Харкевичу, 2-й вариант расчета относительных
частот: Nj – суммарное количество объектов по j-му
классу. Относительная частота того, что если
предъявлен объект j-го класса, то у него будет
обнаружен i-й признак.
i
ij
ij P
P
LogI 2
ji
ij
ij NN
NN
LogI 2
INF3, частный критерий: Хи-квадрат: разности между
фактическими и теоретически ожидаемыми
абсолютными частотами
---
N
NN
NI ji
ijij
INF4, частный критерий: ROI - Return On Investment, 1-
й вариант расчета относительных частот: Nj –
суммарное количество признаков по j-му классу
i
iij
i
ij
ij P
PP
P
P
I
1
1
ji
ij
ij NN
NN
I
INF5, частный критерий: ROI - Return On Investment, 2-
й вариант расчета относительных частот: Nj –
суммарное количество объектов по j-му классу
i
iij
i
ij
ij P
PP
P
P
I
1
1
ji
ij
ij NN
NN
I
INF6, частный критерий: разность условной и
безусловной относительных частот, 1-й вариант
расчета относительных частот: Nj – суммарное
количество признаков по j-му классу
iijij PPI
N
N
N
N
Ii
j
ij
ij
INF7, частный критерий: разность условной и
безусловной относительных частот, 2-й вариант
расчета относительных частот: Nj – суммарное
количество объектов по j-му классу
iijij PPI
N
N
N
N
Ii
j
ij
ij
Обозначения:
i – значение прошлого параметра;
j - значение будущего параметра;
Nij – количество встреч j-го значения будущего параметра при i-м значении
прошлого параметра;
M – суммарное число значений всех прошлых параметров;
W - суммарное число значений всех будущих параметров.
Ni – количество встреч i-м значения прошлого параметра по всей выборке;
Nj – количество встреч j-го значения будущего параметра по всей выборке;
N – количество встреч j-го значения будущего параметра при i-м значении
прошлого параметра по всей выборке.
Iij – частный критерий знаний: количество знаний в факте наблюдения i-го
значения прошлого параметра о том, что объект перейдет в состояние,
соответствующее j-му значению будущего параметра;
37
Ψ – нормировочный коэффициент (Е.В.Луценко, 2002), преобразующий
количество информации в формуле А.Харкевича в биты и обеспечивающий для нее
соблюдение принципа соответствия с формулой Р.Хартли;
Pi – безусловная относительная частота встречи i-го значения прошлого
параметра в обучающей выборке;
Pij – условная относительная частота встречи i-го значения прошлого
параметра при j-м значении будущего параметра .
Все эти способы метризации с применением 7 частных критериев
знаний реализованы в системно-когнитивном анализе и интеллектуальной
системе «Эйдос» и обеспечивают сопоставление градациям шкал числовых
значений, имеющих смысл количества информации в градации о
принадлежности объекта к классу. Это делается совершенно одинаково
для градаций всех шкал, независимо от их типа (номинальные, порядковые
и числовые) и независимо от единиц измерения, используемых в этих
шкалах.
4.3. Оценка достоверности моделей по F-критерию Ван
Ризбергена и по L-критериям
Для оценки достоверности статистических и системно-когнитивных
моделей в системе «Эйдос» используются классическая F-мера (критерий)
Ван Ризбергена и его инвариантное относительно объема исследуемой
выборки нечеткое мультиклассовое обобщение L-мера, предложенная
проф. Е.В.Луценко [32].
Поскольку разработчиками задачи была предоставлена лишь одна
выборка, то она была использована и как обучающая для синтеза модели, и
как тестовая для ее верификации.
Оценка времени идентификации всей исходной выборки из 4 млн.
примеров в одной модели дает примерно 13 дней. Мы себе этого позволить
не можем в связи с ограниченностью времени проведения чемпионата.
Поэтому было принято решение об оценке достоверности всех 10
моделей на тестовой выборке из 2000 примеров, случайным образом
отобранных из обучающей выборке. Для этого в экранной форме,
приведенной на рисунке 15, мы задали использовать для оценки
достоверности создаваемых моделей 2000 случайных примеров
обучающей выборки. По прогнозу оценка достоверности моделей на
тестовой выборке такого объема должно занять около полутора часов, что
уже более-менее приемлемо.
В системе «Эйдос» есть 7 выходных форм с оценкой достоверности
распознавания:
38
Инвариантное относительно объема исследуемой выборки нечеткое
мультиклассовое обобщение F-меры Ван Ризбергена [32] дает для
наиболее достоверной из полученных моделей INF5 при интегральном
критерии «Резонанс знаний» [32]
10
неплохой результат: 0,847 (рисунок 19-
А). Если же оценивать эффективность использования этих моделей по
критерию сравнения достоверности полученных в них результатов
истинной и ложной идентификации и не идентификации со случайным
угадыванием, то эта модель обеспечивают в среднем более чем в 3 раза, и
даже в 5 (при интегральном критерии «Сумма знаний») раз более высокую
вероятность правильной классификации, чем случайное угадывание
(рисунок 19-Б).
10
Будет описан чуть ниже
39
А)
Б)
Рисунок 19. Оценка достоверности моделей по L-критерию
проф.Е.В.Луценко и путем сравнения достоверности распознавания
в модели со случайным угадыванием
40
Рисунок 19-В. Оценка достоверности моделей по L1-критерию проф.Е.В.Луценко [33]
41
Рисунок 19-Г. Оценка достоверности моделей по L2-критерию проф.Е.В.Луценко [33]
42
43
Вместо объяснения сути L-критериев проф.Е.В.Луценко приведем
HELP данного режима (рисунок 20) и сошлемся на статью [32], в которой
они подробно описаны:
Рисунок 20. Описание сути F-критерия Ван Ризбергена
и L-критериев проф.Е.В.Луценко [32]
На рисунке 21 приведены частотные распределения уровней
сходства-различия при истинно и ложно положительных и отрицательных
решениях для модели INF5.
44
Рисунок 21.Частотные распределения уровней сходства-различия
истинных и ложных положительных и отрицательных решений в модели
INF5, наиболее достоверной по L-критериям проф.Е.В.Луценко
Из рисунка 21 видно, что при всех значениях уровней сходства выше
15% встречаются только истинно-положительные решения, а при уровнях
различия более 30% – истинно-отрицательные.
Еще более наглядно это видно из рисунка 22, на котором приведена
разность частотных распределений истинных и ложных решений, слева
отрицательных, а справа положительных для наиболее достоверной
модели INF5:
Рисунок 22. Разность частотных распределений истинных и ложных
решений: слева отрицательных, а справа положительных в модели
INF5, наиболее достоверной по L-критериям проф.Е.В.Луценко
Из рисунка 22 видно, что:
– при положительных решениях уже начиная с уровня сходства 10%
частота истинных решений всегда значительно выше частоты ложных
решений;
– ложно-положительные решения есть, но для них характерны
низкий уровень сходства: не более 10%;
– при отрицательных решениях частота истинных решений
значительно выше, чем частота ложных решений за исключением
небольших диапазонов уровней различия в диапазоне: {-10%, - 20%}.
45
4.4. Выбор наиболее достоверной модели и придание ей статуса
текущей
Из предыдущего раздела (рисунок 19-А) мы видим, что наиболее
достоверной моделью по L-критериям и по сравнению со случайным
угадыванием является системно-когнитивная модель INF5 с интегральным
критериями «Резонанс знаний» и «Сумма знаний» соответственно.
Поэтому в соответствии со схемой преобразования данных в
информацию, а ее в знания, приведенной на рисунке 4, придадим ей статус
текущей модели (рисунок 23):
46
Рисунок 23. Придание наиболее достоверной системно-когнитивной
модели INF5 статуса текущей модели
5. Решение задачи посещения сайта клиентом в наиболее
достоверной модели
Все способы метризации шкал с применением 7 частных критериев
знаний, приведенные в таблице 2, реализованы в системно-когнитивном
анализе и интеллектуальной системе «Эйдос» и обеспечивают
сопоставление градациям шкал числовых значений, имеющих смысл
количества информации в градации о принадлежности объекта к классу.
Это делается совершенно одинаково для градаций всех шкал, независимо
от их типа (номинальные, порядковые и числовые) и независимо от единиц
измерения, используемых в этих шкалах.
Это обеспечивает сопоставимость обработки разнородных типов
данных в системно-когнитивных моделях. Поэтому является корректным
применение интегральных критериев, включающих операции умножения и
суммирования, для обработки числовых значений, соответствующих
градациям шкал. Это позволяет единообразно и сопоставимо обрабатывать
эмпирические данные, полученные с помощью любых типов шкал,
применяя при этом все математические операции [29].
Рассмотрим интегральные критерии знаний, используемые в
настоящее время в АСК-анализе и системе «Эйдос-Х++» для верификации
моделей и решения задач идентификации и прогнозирования.
1-й интегральный критерий «Сумма знаний» представляет собой
суммарное количество знаний, содержащееся в системе факторов
различной природы, характеризующих сам объект управления,
47
управляющие факторы и окружающую среду, о переходе объекта в
будущие целевые или нежелательные состояния.
Интегральный критерий представляет собой аддитивную функцию
от частных критериев знаний и имеет вид::
).,( iijjLII
В выражении круглыми скобками обозначено скалярное
произведение. В координатной форме это выражение имеет вид:
,
1
M
iiijjLII
где: M – количество градаций описательных шкал (признаков);
}I{I ijij
– вектор состояния j–го класса;
}L{L ii
– вектор состояния распознаваемого объекта, включающий все виды
факторов, характеризующих сам объект, управляющие воздействия и окружающую среду
(массив–локатор), т.е.:
.,0
;,0:,
;,1
действуетнефакторйiесли
nюистинностьсдействуетфакторйiеслиnгдеn
действуетфакторйiесли
Li
В текущей версии системы «Эйдос-Х++» значения координат
вектора состояния распознаваемого объекта принимались равными либо 0,
если признака нет, или n, если он присутствует у объекта с
интенсивностью n, т.е. представлен n раз (например, буква «о» в слове
«молоко» представлена 3 раза, а буква «м» - один раз).
2-й интегральный критерий «Семантический резонанс знаний»
представляет собой нормированное суммарное количество знаний,
содержащееся в системе факторов различной природы, характеризующих
сам объект управления, управляющие факторы и окружающую среду, о
переходе объекта в будущие целевые или нежелательные состояния.
Интегральный критерий представляет собой аддитивную функцию
от частных критериев знаний и имеет вид:
,
1
1
M
iijij
lj
jLLII
M
I
где:
M – количество градаций описательных шкал (признаков);
j
I
– средняя информативность по вектору класса;
48
L
– среднее по вектору объекта;
j
– среднеквадратичное отклонение частных критериев знаний вектора класса;
l
– среднеквадратичное отклонение по вектору распознаваемого объекта.
Приведенное выражение для интегрального критерия
«Семантический резонанс знаний» получается непосредственно из
выражения для критерия «Сумма знаний» после замены координат
перемножаемых векторов их стандартизированными значениями:
.,
l
i
i
j
jij
ij LL
L
II
I
Свое наименование интегральный критерий сходства
«Семантический резонанс знаний» получил потому, что по своей
математической форме является корреляцией двух векторов: состояния j–
го класса и состояния распознаваемого объекта.
Итак, в системно-когнитивной модели для каждой градации
описательной шкалы, т.е. признака, содержится информация о
принадлежности объекта с этим признаком к каждому из классов, т.е.
признаки рассматриваются как частные критерии. А интегральные
критерии позволяют посчитать суммарное количество информации во всей
системе признаков объекта о его принадлежности к каждому из классов.
На рисунке 24 мы видим отображение стадий процесса оценки
длительности обслуживания банком тех же 2000 посещений клиентами
тестовой выборки, на которых ранее оценивалась адекватность моделей.
Интересно, что в одной модели эта оценка заняла 8 минут 6 секунд,
т.е. (8*60+6)/2000=0,243 секунды на клиента.
49
Рисунок 24. Экранная форма, отображающая стадии процесса оценки
длительности обслуживания банком тех же 2000 посещений клиентов
тестовой выборки, на которых ранее оценивалась адекватность моделей
В системе «Эйдос» есть 5 выходных форм с результатами
распознавания и 7 форм с оценкой достоверности распознавания:
Рассмотрим форму 4.1.3.1 (рисунок 30):
Результатом распознавания (идентификации, диагностики,
прогнозирования, оценки риска) некоторого объекта является список всех
классов, ранжированный в порядке убывания сходства этого объекта с
классами (рисунок 25):
Рисунок 25. Результат оценки посещения сайтом клиентом
выделенным курсором в левом окне
50
Из рисунка 25 мы видим, что оценка в соответствии с моделью
соответствует факту (около этих случаев стоит «птичка»).
Рассмотрим форму 4.1.3.2 (рисунок 26):
Выше мы уже видели, что сходство объекта с классом измеряется
суммарным количеством информации в признаках этого объекта о его
принадлежности к данному классу. Класс, к которому действительно
относится распознаваемый объект, отмечен «птичкой».
Рисунок 26. Результат оценки сходства-различия посещения
сайта клиентами с классом: «ADD»
6. Решение задачи поддержки принятия решений
(исследование влияния значений факторов на оценку
посещения сайта потенциальным клиентом)
Выше мы уже видели, что в системно-когнитивной модели для
каждой градации описательной шкалы, т.е. признака, содержится
информация о принадлежности объекта с этим признаком к каждому из
классов, т.е. признаки рассматриваются как частные критерии. На этой
основе могут быть решены и задача длительности обслуживания клиента
банком, и задача поддержки принятия решений о политике,
увеличивающей длительность этого обслуживания.
Задача поддержки принятия решений является обратной задачей по
отношению к задаче оценки рисков.
При оценке длительности обслуживания клиента банком
(распознавании, идентификации) с помощью используются интегральные
критерии, с помощью которых рассчитывается суммарное количество
информации во всей системе признаков объекта (т.е. частных критериев) о
его принадлежности к каждому из классов.
51
При поддержке принятия решений, наоборот, по заданному классу
(та или иная длительность обслуживания клиента банком) определяется
система признаков, способствующая возникновения страхового случая,
соответствующего классу.
Эта информация выводится в различных выходных формах: в
информационных портретах, нелокальных нейронов и SWOT-диаграмм
классов [33]. В данном разделе в рисунках 27 приведены информационные
портреты всех классов, т.к. они сами по себе представляют интерес, а
остальные формы мы приведем в следующем разделе. На рисунках 27 мы
видим не только сами значения факторов, обуславливающие состояния
объекта моделирования, но и силу и направление их влияния в виде
весовых коэффициентов.
Данный режим позволяет исследовать также влияние любого
фактора на переход моделируемой системы в состояние, соответствующее
классу. Для этого в режиме 421, в котором отображаются
информационные портреты классов, в правом окне надо поставить курсор
на нужный фактор и кликнуть по кнопке: «Включить фильтр по фактору».
В результате получим экранную форму, отражающую влияние значений
именно данного фактора на возникновение ситуации, соответствующей
классу, на котором стоит курсор в левом окне.
52
\
53
54
55
56
Рисунок 27. Система детерминации действия на сайте посетителя,
выделенного в левом окне курсором, в системно-когнитивной модели INF5
Отметим, что первый акт внедрения далекого прототипа системы
«Эйдос», разработанного в на компьютерах WANG-2200C в среде
персональной технологической системы «Вега-М» разработки автора, в
котором упоминаются информационные портреты классов, получен
автором еще в далеком 1987 году, т.е. 30 лет назад:
57
58
7. Решение задачи исследования моделируемой
предметной области путем исследования ее модели
7.1. Автоматизированный SWOT-анализ классов и значений и
значений факторов
SWOT-анализ – это традиционная форма анализа, в котором
определяется, какие факторы способствуют, а какие препятствуют,
переходу исследуемого объекта в то или иное состояние.
При этом определяется не только знак влияния факторов, но и сила
их влияния. Традиционно это делается экспертами неформализуемым
путем на основе опыта, интуиции и профессиональной компетенции (т.е.
проще говоря «от фонаря»).
В системе «Эйдос» это делается на основе системно-когнитивных
моделей, созданных непосредственно на основе эмпирических данных [33]
(рисунки 28):
59
60
61
62
63
64
65
66
67
68
69
Рисунок 28. SWOT-анализ класса, отмеченного курсором в верхнем окне
В этих режимах можно исследовать влияние какого-либо одного
фактора на переход исследуемой системы в состояние, соответствующее
классу. Для этого в правом или левом нижнем окне надо поставить курсор
на нужный фактор и включить фильтр по фактору.
7.2. Нелокальные нейроны
В 2003 году Е.В.Луценко были предложены нелокальные нейронные
сети прямого счета [26]. Идея, лежащая в основе этих сетей близка
популярному в настоящее время подходу байесовских нейросетей.
На рисунках 29 приведены нелокальные нейроны некоторых классов
без фильтра по фактору:
70
Рисунок 29. Нелокальные нейроны всех классов без фильтра по фактору
в наиболее достоверной модели INF5
7.3. Нелокальная нейронная сеть
На рисунке 30 приведен фрагмент однослойной нелокальной
нейронной сети с наиболее сильными синоптическими связями:
71
Рисунок 30. Фрагмент однослойной нелокальной нейронной сети
с наиболее значимыми связями
В этой сети значимость рецепторов убывает справа на лево, т.е. на
рисунке 30 показаны наиболее сильные нейронные связи. Слева на
рисунке 30 находятся классы (нейроны) с высокой, посередине со средней,
а справа со слабой степенью детерминации значениями факторов.
7.4. 2D-семантические сети значений факторов
На рисунке 31 приведена 2D-семантическая сеть классов,
отражающее их сходство и различие по системам детерминации
значениями факторов.
На рисунке 32 приведена 2D-семантическая сеть значений факторов,
отражающая сходство-различие влияния этих значений факторов на
принадлежность к классам, используемым в системно-когнитивных
моделях.
72
Рисунок 31. 2D-семантическая сеть классов
Рисунок 32. 2D-семантическая сеть значений факторов
73
Подобные ориентированные графы часто называют когнитивными
диаграммами. Обычно они разрабатываются экспертами
неформализуемым путем на основе опыта, интуиции и профессиональной
компетенции, т.е. по сути мягко говоря «на глазок». В системе «Эйдос» это
делается на основе системно-когнитивных моделей, созданных
непосредственно на основе эмпирических данных.
В 2D-семантической сети значений факторов красными линиями
соединены значения, имеющие сходное влияние на моделируемую
систему, а синими линиями – различное. Толщина линий означает степень
сходства и различия.
Значения факторов оказывающие сходное влияние показаны на 2D-
семантической сети рядом. В результате на диаграмме мы видим явно
выраженные две группы значений факторов, образующих
противоположные по влиянию кластеры. Эти кластеры образуют полюса
конструкта.
Конструкт представляет собой понятие, имеющее противоположные
по смыслу полюса и спектр промежуточных смысловых значений.
Пример конструкта: «температура»: имеет противоположные по
смыслу полюса: «горячее» и «холодное» и спектр промежуточных
значений температуры (например шкала Цельсия).
Человек мыслит в системе конструктов, которая образует парадигму
реальности [5]. Система «Эйдос» обеспечивает:
– формирование обобщенных образов классов (обобщенных
онтологий) на основе примеров объектов обучающей выборки, описанных
с одной стороны признаками, а с другой принадлежностью к обобщенным
категориям (классам), т.е. на основе конкретных онтологий;
– сравнение образов конкретных объектов с обобщенными образами
классов;
– сравнение обобщенных образов классов друг с другом и
формирование кластеров и конструктов.
Таким образом, система «Эйдос» является инструментом познания
[31].
7.5. Когнитивные функции
Вместо того, чтобы описывать что такое когнитивные функции,
приведем окно режима с соответствующим пояснением:
74
Кроме того этот вопрос подробно раскрыт в главах 11-13
монографии: [19] и в тематической подборке [34].
На рисунках 36 приведены примеры некоторых когнитивных
функций, построенных на основе созданных моделей:
75
76
77
78
Рисунок 36. Когнитивные функции, отражающие причинно-следственные
зависимости между описательными и классификационными шкалами
в наиболее достоверной модели INF5
В когнитивных функциях цвет отражает количество информации в
градации описательной шкалы о переходе объекта моделирования в
состояние, соответствующее классу, т.е. градации классификационной
шкалы.
8. Использование разработанной методики в адаптивном
режиме и ее локализация для региона
Поскольку интеллектуальная система «Эйдос», представляющая
собой программный инструментарий для создания системно-когнитивных
моделей и решения в них задач оценки рисков, принятия решений и
79
исследования моделируемой предметной области находится в полном
открытом бесплатном доступе на сайте автора по адресу:
http://lc.kubagro.ru/aidos/_Aidos-X.htm, то созданные в ней модели можно
пересоздать в любое время на обновленных или локализованных исходных
данных. Это обеспечивает адаптацию созданных моделей с целью учета
динамики предметной области или локализовать их для заданного региона
России или другой страны. Адаптированные и локализованные модели
обеспечивают более высокую достоверность, чем не адаптированные и
нелокализованные.
9. Исследование ценности факторов и их значений для
решения задачи классификации целей посещений сайта
клиентами и оптимизация системы факторов
Чем выше вариабельность по классам значений частных критериев
некоторой градации описательной шкалы (значения фактора, признака) в
статистических и системно-когнитивных моделях, тем выше ценность
этого признака для решения задачи разделения объектов по классам.
В качестве количественной меры вариабельности может быть
выбрано среднее отклонение модулей частных критериев от среднего,
дисперсия или среднеквадратичное отклонение. В системе «Эйдос» принят
3-й вариант.
Если рассортировать все признаки в порядке убывания их ценности и
просуммировать их ценность нарастающим итогом, то получится
логистическая Паретто-кривая (рисунки 37 и 38 и таблица 5):
80
Рисунок 37. Паретто-кривая ценности значений факторов для разделения
клиентов по целям посещения сайта и действиям на нем в модели INF3
Рисунок 38. Паретто-кривая ценности значений факторов для разделения
клиентов по целям посещения сайта и действиям на нем в модели INF5
Таблица 5 – Ценность значений факторов для разделения клиентов
по длительности обслуживания банком в модели INF5 (фрагмент)
N
U
M
N
U
M
_
P
R
C
K
O
D
_
A
T
R
N
A
M
E
_
A
T
R
Z
N
A
C
H
_
A
T
R
Z
N
_
A
T
R
NI
T
Z
N
A
C
H
_
P
R
C
Z
N
_
P
R
C
NI
T
1
0,06
1726
ТИП СТРАНИЦЫ-SearchResults
33,45
33,45
1,14
1,14
2
0,12
1177
БРЭНД-1760
32,93
66,38
1,12
2,27
3
0,17
1205
БРЭНД-1815
32,92
99,30
1,12
3,39
* * * * * * * * * *
285
16,49
32
ID ТОВАРА-000000000000026
2,07
1458,82
0,07
49,84
286
16,55
1722
ТИП СТРАНИЦЫ-ProductListing
2,06
1460,89
0,07
49,91
287
16,61
1239
БРЭНД-1876
2,05
1462,94
0,07
49,98
288
16,67
1638
БРЭНД-781
2,05
1464,99
0,07
50,05
289
16,72
1469
БРЭНД-2186
2,04
1467,03
0,07
50,12
290
16,78
527
КАТЕГОРИЯ-2060503
2,03
1469,06
0,07
50,19
291
16,84
814
ПОДКАТЕГОРИЯ-20605
2,03
1471,10
0,07
50,26
* * * * * * * * * *
293
16,96
1014
БРЭНД-1105
2,02
1475,15
0,07
50,39
294
17,01
1614
БРЭНД-710
2,02
1477,18
0,07
50,46
295
17,07
759
КАТЕГОРИЯ-5240103
2,02
1479,20
0,07
50,53
* * * * * * * * * *
860
49,77
720
КАТЕГОРИЯ-5050501
0,97
2227,37
0,03
76,09
861
49,83
924
ПОДКАТЕГОРИЯ-50505
0,97
2228,34
0,03
76,12
862
49,88
1054
БРЭНД-115
0,97
2229,31
0,03
76,16
863
49,94
391
ID ТОВАРА-000000000030023
0,97
2230,28
0,03
76,19
864
50,00
335
ID ТОВАРА-000000000010001
0,97
2231,25
0,03
76,22
865
50,06
744
КАТЕГОРИЯ-5160306
0,97
2232,22
0,03
76,26
866
50,12
410
ID ТОВАРА-000000000040057
0,97
2233,19
0,03
76,29
Из таблицы 5 и рисунка 38 видно, что:
81
– 16,7% наиболее ценных значений факторов обеспечивают 50%
суммарной ценности всей системы значений всех факторов;
– 50% наиболее ценных значений факторов обеспечивают 76,1%
суммарной ценности всей системы значений всех факторов.
По рисунку 37 мы видим, что в модели INF3 очень значимые и
малозначимые градации факторов разделены еще более резко. В любом
случае ясно, что можно взять небольшое число наиболее значимых
факторов и с их использованием надежно решать задачу на значительно
меньшем объеме данных, может быть даже без использования
искусственного интеллекта.
Рассмотрим теперь ценность описательных шкал (факторов) для
решения задачи разделения клиентов по длительности обслуживания
(таблица 6 и рисунок 39).
Для этого запустим режим 3.7.4 системы «Эйдос». После
выполнения расчетов система выводится окно, приведенное ниже.
Выполнив рекомендации, приведенные на этом окне получим
таблицу 6 и рисунок 39.
82
Рисунок 39. Ценность описательных шкал для классификации посетителей
сайта по целям и действиям в модели INF5
Таблица 6 – Ценность описательных шкал для классификации посетителей
сайта по целям и действиям в модели INF5
NUM
NUM_PRC
KOD_OPSC
NAME_OPSC
ZNACH_OS
ZN_OSNIT
ZNACH_PRC
ZN_PRCNIT
1
12,50
8
ТИП СТРАНИЦЫ
5,17
5,17
40,01
40,01
2
25,00
6
БРЭНД
1,72
6,89
13,27
53,28
3
37,50
3
ID ТОВАРА
1,71
8,59
13,20
66,48
4
50,00
4
КАТЕГОРИЯ
1,65
10,24
12,75
79,23
5
62,50
5
ПОДКАТЕГОРИЯ
1,41
11,66
10,95
90,18
6
75,00
2
ОПЕРАЦИОННАЯ СИСТЕМА
0,61
12,26
4,68
94,86
7
87,50
7
ФЛАГ ПРОМО
0,54
12,81
4,21
99,07
8
100,00
1
ПЛАТФОРМА
0,12
12,93
0,93
100,00
Из таблицы 6 и рисунка 39 видно, что:
– 25% наиболее ценных факторов обеспечивают более 50%
суммарной ценности всей системы факторов;
– 50% наиболее ценных факторов обеспечивают более 79%
суммарной ценности всей системы факторов.
Все это означает, что разнообразие исходных данных, приведенных
разработчиками задачи для классификации посетителей сайта по целям и
действиям, является избыточным для ее решения и может быть
существенно сокращено без ущерба для достоверности этой оценки.
83
10. Выводы
Поставленная задача разделения клиентов по длительности
обслуживания банком решена с применением автоматизированного
системно-когнитивного анализа (АСК-анализ) и его программного
инструментария – универсальной когнитивной аналитической системы
«Эйдос».
По итогам конкурса предложенное в данной статье решение в
рейтинге на сайте чемпионата заняло 1-е место (рисунок 40).
Полная информация о системе «Эйдос» есть в самой системе
(рисунок 41), а также на сайте разработчика: http://lc.kubagro.ru/ [35] и в
работах, приведенных в списке литературы [1-41].
Решение задачи может совершенствоваться. Например, с целью
повышения адекватности моделей могут быть проведены численные
эксперименты по созданию моделей с различными параметрами (в
примере были созданы модели с небольшим числом интервальных
значений числовых шкал), путем разделения классов на типичную и
нетипичную части (дивизивная кластеризация). Есть и другие
возможности совершенствования решения, в т.ч. путем совершенствования
самой системы «Эйдос».
84
Рисунок 40. Рейтинг решений и сертифкацит участника
в номинации: «AI в ритейле»
Рисунок 47. Информация о системе «Эйдос» в самой системе
85
Отметим также, что система «Эйдос» находится в полном открытом
бесплатном доступе, причем с актуальными исходными текстами
(http://lc.kubagro.ru/_AIDOS-X.txt), на сайте автора по адресу:
http://lc.kubagro.ru/aidos/_Aidos-X.htm.
Литература:
1. Луценко Е.В. Универсальная автоматизированная система распознавания образов "Эйдос"
(версия 4.1).-Краснодар: КЮИ МВД РФ, 1995.- 76с. http://elibrary.ru/item.asp?id=18630282
2. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в
поддержке принятия решений (на примере универсальной автоматизированной системы распознавания
образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с. http://elibrary.ru/item.asp?id=21745340
3. Симанков В.С., Луценко Е.В. Адаптивное управление сложными системами на основе
теории распознавания образов. Монография (научное издание). – Краснодар: ТУ КубГТУ, 1999. - 318с.
http://elibrary.ru/item.asp?id=18828433
4. Симанков В.С., Луценко Е.В., Лаптев В.Н. Системный анализ в адаптивном управлении:
Монография (научное издание). /Под науч. ред. В.С.Симанкова. – Краснодар: ИСТЭК КубГТУ, 2001. –
258с. http://elibrary.ru/item.asp?id=21747625
5. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными
объектами (системная теория информации и ее применение в исследовании экономических, социально-
психологических, технологических и организационно-технических систем): Монография (научное
издание). – Краснодар: КубГАУ. 2002. – 605 с. http://elibrary.ru/item.asp?id=18632909
6. Луценко Е.В. Интеллектуальные информационные системы: Учебное пособие для студентов
специальности 351400 "Прикладная информатика (по отраслям)". – Краснодар: КубГАУ. 2004. – 633 с.
http://elibrary.ru/item.asp?id=18632737
7. Луценко Е.В., Лойко В.И., Семантические информационные модели управления
агропромышленным комплексом. Монография (научное издание). – Краснодар: КубГАУ. 2005. – 480 с.
http://elibrary.ru/item.asp?id=21720635
8. Луценко Е.В. Интеллектуальные информационные системы: Учебное пособие для студентов
специальности "Прикладная информатика (по областям)" и другим экономическим специальностям. 2-е
изд., перераб. и доп.– Краснодар: КубГАУ, 2006. – 615 с. http://elibrary.ru/item.asp?id=18632602
9. Луценко Е.В. Лабораторный практикум по интеллектуальным информационным системам:
Учебное пособие для студентов специальности "Прикладная информатика (по областям)" и другим
экономическим специальностям. 2-е изд.,перераб. и доп. – Краснодар: КубГАУ, 2006. – 318с.
http://elibrary.ru/item.asp?id=21683721
10. Наприев И.Л., Луценко Е.В., Чистилин А.Н. Образ-Я и стилевые особенности деятельности
сотрудников органов внутренних дел в экстремальных условиях. Монография (научное издание). –
Краснодар: КубГАУ. 2008. – 262 с. http://elibrary.ru/item.asp?id=21683724
11. Луценко Е. В., Лойко В.И., Великанова Л.О. Прогнозирование и принятие решений в
растениеводстве с применением технологий искусственного интеллекта: Монография (научное издание).
– Краснодар: КубГАУ, 2008. – 257 с. http://elibrary.ru/item.asp?id=21683725
12. Трунев А.П., Луценко Е.В. Астросоциотипология: Монография (научное издание). –
Краснодар: КубГАУ, 2008. – 264 с. http://elibrary.ru/item.asp?id=21683727
13. Луценко Е.В., Коржаков В.Е., Лаптев В.Н. Теоретические основы и технология применения
системно-когнитивного анализа в автоматизированных системах обработки информации и управления
(АСОИУ) (на примере АСУ вузом): Под науч. ред.д.э.н., проф. Е.В.Луценко. Монография (научное
издание). – Майкоп: АГУ. 2009. – 536 с. http://elibrary.ru/item.asp?id=18633313
14. Луценко Е.В., Коржаков В.Е., Ермоленко В.В. Интеллектуальные системы в контроллинге и
менеджменте средних и малых фирм: Под науч. ред. д.э.н., проф. Е.В.Луценко. Монография (научное
издание). – Майкоп: АГУ. 2011. – 392 с. http://elibrary.ru/item.asp?id=21683734
15. Наприев И.Л., Луценко Е.В. Образ-Я и стилевые особенности личности в экстремальных
условиях: Монография (научное издание). – Saarbrucken, Germany: LAP Lambert Academic Publishing
GmbH & Co. KG,. 2012. – 262 с. Номер проекта: 39475, ISBN: 978-3-8473-3424-8.
16. Трунев А.П., Луценко Е.В. Автоматизированный системно-когнитивный анализ влияния
факторов космической среды на ноосферу, магнитосферу и литосферу Земли: Под науч. ред. д.т.н., проф.
86
В.И.Лойко. Монография (научное издание). – Краснодар, КубГАУ. 2012. – 480 с. ISBN 978-5-94672-519-
4. http://elibrary.ru/item.asp?id=21683737
17. Трубилин А.И., Барановская Т.П., Лойко В.И., Луценко Е.В. Модели и методы управления
экономикой АПК региона. Монография (научное издание). – Краснодар: КубГАУ. 2012. – 528 с. ISBN
978-5-94672-584-2. http://elibrary.ru/item.asp?id=21683702
18. Горпинченко К.Н., Луценко Е.В. Прогнозирование и принятие решений по выбору
агротехнологий в зерновом производстве с применением методов искусственного интеллекта (на
примере СК-анализа). Монография (научное издание). – Краснодар,КубГАУ. 2013. – 168 с. ISBN 978-5-
94672-644-3. http://elibrary.ru/item.asp?id=20213254
19. Орлов А.И., Луценко Е.В. Системная нечеткая интервальная математика. Монография
(научное издание). – Краснодар, КубГАУ. 2014. – 600 с. ISBN 978-5-94672-757-0.
http://elibrary.ru/item.asp?id=21358220
20. Луценко Е.В. Универсальная когнитивная аналитическая система «Эйдос". Монография
(научное издание). – Краснодар, КубГАУ. 2014. – 600 с. ISBN 978-5-94672-830-0.
http://elibrary.ru/item.asp?id=22401787
21. Орлов А.И., Луценко Е.В., Лойко В.И. Перспективные математические и инструментальные
методы контроллинга. Под научной ред. проф.С.Г.Фалько. Монография (научное издание). – Краснодар,
КубГАУ. 2015. – 600 с. ISBN 978-5-94672-923-9. http://elibrary.ru/item.asp?id=23209923
22. Орлов А.И., Луценко Е.В., Лойко В.И. Организационно-экономическое, математическое и
программное обеспечение контроллинга, инноваций и менеджмента: монография / А. И. Орлов, Е. В.
Луценко, В. И. Лойко ; под общ. ред. С. Г. Фалько. – Краснодар : КубГАУ, 2016. – 600 с. ISBN 978-5-
00097-154-3. http://elibrary.ru/item.asp?id=26667522
23. Лаптев В. Н., Меретуков Г. М., Луценко Е. В., Третьяк В. Г., Наприев И. Л.. :
Автоматизированный системно-когнитивный анализ и система «Эйдос» в правоохранительной сфере:
монография / В. Н. Лаптев, Г. М. Меретуков, Е. В. Луценко, В. Г. Третьяк, И. Л. Наприев; под научной
редакцией проф. Е. В. Луценко. – Краснодар: КубГАУ, 2017. – 634 с. ISBN 978-5-00097-226-7.
http://elibrary.ru/item.asp?id=28135358
24. Луценко Е. В., Лойко В. И., Лаптев В. Н. Современные информационно-коммуникационные
технологии в научно-исследовательской деятельности и образовании: учеб. пособие / Е. В. Луценко, В.
И. Лойко, В. Н. Лаптев; под общ. ред. Е. В. Луценко. – Краснодар: КубГАУ,. 2017. – 450с. ISBN 978-5-
00097-265-6. http://elibrary.ru/item.asp?id=28996636
25. Лойко В. И., Луценко Е. В., Орлов А. И. Современные подходы в наукометрии: монография
/ В. И. Лойко, Е. В. Луценко, А. И. Орлов. Под науч. ред. проф. С. Г. Фалько – Краснодар: КубГАУ, 2017.
– 532 с. ISBN 978-5-00097-334-9. Режим доступа: https://elibrary.ru/item.asp?id=29306423
26. Луценко Е.В. Системная теория информации и нелокальные интерпретируемые нейронные
сети прямого счета / Е.В. Луценко // Политематический сетевой электронный научный журнал
Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный
ресурс]. – Краснодар: КубГАУ, 2003. – №01(001). С. 79 – 91. – IDA [article ID]: 0010301011. – Режим
доступа: http://ej.kubagro.ru/2003/01/pdf/11.pdf, 0,812 у.п.л.
27. Луценко Е.В. Прогнозирование рисков ОСАГО (андерайтинг) с применением системно-
когнитивного анализа / Е.В. Луценко, Н.А. Подставкин // Политематический сетевой электронный
научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ)
[Электронный ресурс]. – Краснодар: КубГАУ, 2007. – №05(029). С. 90 – 112. – Шифр Информрегистра:
0420700012\0096, IDA [article ID]: 0290705008. – Режим доступа: http://ej.kubagro.ru/2007/05/pdf/08.pdf,
1,438 у.п.л.
28. Луценко Е.В. Прогнозирование рисков автострахования КАСКО с применением системно-
когнитивного анализа / Е.В. Луценко, В.Е. Коржаков // Политематический сетевой электронный
научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ)
[Электронный ресурс]. – Краснодар: КубГАУ, 2008. – №06(040). С. 91 – 104. – Шифр Информрегистра:
0420800012\0071, IDA [article ID]: 0400806011. – Режим доступа: http://ej.kubagro.ru/2008/06/pdf/11.pdf,
0,875 у.п.л.
29. Луценко Е.В. Метризация измерительных шкал различных типов и совместная сопоставимая
количественная обработка разнородных факторов в системно-когнитивном анализе и системе «Эйдос» /
Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного
аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2013.
– №08(092). С. 859 – 883. – IDA [article ID]: 0921308058. – Режимдоступа:
http://ej.kubagro.ru/2013/08/pdf/58.pdf, 1,562 у.п.л.
30. Луценко Е.В. Открытая масштабируемая интерактивная интеллектуальная on-line среда для
обучения и научных исследований на базе АСК-анализа и системы «Эйдос» / Е.В. Луценко //
87
Политематический сетевой электронный научный журнал Кубанского государственного аграрного
университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2017. –
№06(130). С. 1 – 55. – IDA [article ID]: 1301706001. – Режим доступа:
http://ej.kubagro.ru/2017/06/pdf/01.pdf, 3,438 у.п.л.
31. Луценко Е.В. Проблемы и перспективы теории и методологии научного познания и
автоматизированный системно-когнитивный анализ как автоматизированный метод научного познания,
обеспечивающий содержательное феноменологическое моделирование / Е.В. Луценко //
Политематический сетевой электронный научный журнал Кубанского государственного аграрного
университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2017. –
№03(127). С. 1 – 60. – IDA [article ID]: 1271703001. – Режимдоступа:
http://ej.kubagro.ru/2017/03/pdf/01.pdf, 3,75 у.п.л.
32. Луценко Е.В. Инвариантное относительно объемов данных нечеткое мультиклассовое
обобщение F-меры достоверности моделей Ван Ризбергена в АСК-анализе и системе «Эйдос» / Е.В.
Луценко // Политематический сетевой электронный научный журнал Кубанского государственного
аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2017.
– №02(126). С. 1 – 32. – IDA [article ID]: 1261702001. – Режим доступа:
http://ej.kubagro.ru/2017/02/pdf/01.pdf, 2 у.п.л.
33. Луценко Е.В. Количественный автоматизированный SWOT- и PEST-анализ средствами
АСК-анализа и интеллектуальной системы «Эйдос-Х++» / Е.В. Луценко // Политематический сетевой
электронный научный журнал Кубанского государственного аграрного университета (Научный журнал
КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2014. – №07(101). С. 1367 – 1409. – IDA [article
ID]: 1011407090. – Режим доступа: http://ej.kubagro.ru/2014/07/pdf/90.pdf, 2,688 у.п.л.
34. Луценко Е.В. Подборка публикаций по когнитивным функциям. [Электронный р есурс]. –
Режим доступа: http://www.twirpx.com/file/775236/
35. Сайт проф. Е.В.Луценко: http://lc.kubagro.ru/
36. Луценко Е.В. Системно-когнитивный анализ временных рядов на примере фондового рынка
(когнитивная структуризация и формализация предметной области) / Е.В. Луценко, Е.А. Лебедев //
Политематический сетевой электронный научный журнал Кубанского государственного аграрного
университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2009. –
№07(051). С. 1 – 37. – Шифр Информрегистра: 0420900012\0073, IDA [article ID]: 0510907001. – Режим
доступа: http://ej.kubagro.ru/2009/07/pdf/01.pdf, 2,312 у.п.л.
37. Луценко Е.В. Системно-когнитивный анализ временных рядов на примере фондового рынка
(синтез и верификация семантической информационной модели) / Е.В. Луценко, Е.А. Лебедев //
Политематический сетевой электронный научный журнал Кубанского государственного аграрного
университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2009. –
№07(051). С. 38 – 46. – Шифр Информрегистра: 0420900012\0072, IDA [article ID]: 0510907002. – Режим
доступа: http://ej.kubagro.ru/2009/07/pdf/02.pdf, 0,562 у.п.л.
38. Луценко Е.В. Системно-когнитивный анализ временных рядов на примере фондового рынка
(прогнозирование, принятие решений и исследование предметной области) / Е.В. Луценко, Е.А. Лебедев
// Политематический сетевой электронный научный журнал Кубанского государственного аграрного
университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2009. –
№07(051). С. 47 – 82. – Шифр Информрегистра: 0420900012\0071, IDA [article ID]: 0510907003. – Режим
доступа: http://ej.kubagro.ru/2009/07/pdf/03.pdf, 2,25 у.п.л.
39. Луценко Е.В. Повышение качества моделей «knowledge management» путем разделения
классов на типичную и нетипичную части / Е.В. Луценко, Е.А. Лебедев, В.Н. Лаптев //
Политематический сетевой электронный научный журнал Кубанского государственного аграрного
университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2009. –
№10(054). С. 78 – 93. – Шифр Информрегистра: 0420900012\0109, IDA [article ID]: 0540910005. – Режим
доступа: http://ej.kubagro.ru/2009/10/pdf/05.pdf, 1 у.п.л.
40. Луценко Е.В., Лебедев Е.А. Определение кредитоспособности физических лиц и риска их
кредитования. Ж-л Финансы и кредит, №32 (236), 2006. – Режим доступа:
http://www.financepress.ru/mag06/fik0632.php, 1,188 у.п.л.
41. Луценко Е.В. 30 лет системе «Эйдос» – одной из старейших отечественных универсальных
систем искусственного интеллекта, широко применяемых и развивающихся и в настоящее время /
Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного
аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2009.
– №10(054). С. 48 – 77. – Шифр Информрегистра: 0420900012\0110, IDA [article ID]: 0540910004. –
Режим доступа: http://ej.kubagro.ru/2009/10/pdf/04.pdf, 1,875 у.п.л.