Serhiy ShtovbaVasyl' Stus Donetsk National University
Serhiy Shtovba
Dr
About
140
Publications
87,193
Reads
How we measure 'reads'
A 'read' is counted each time someone views a publication summary (such as the title, abstract, and list of authors), clicks on a figure, or views or downloads the full-text. Learn more
556
Citations
Introduction
Full Professor in Information Technology.
Editor-in-Chief of Ukrainian Journal of Information Systems and Data Science, ISSN 2786-9482 https://jujisds.donnu.edu.ua/index
Additional affiliations
November 1993 - present
Publications
Publications (140)
A new structure of fuzzy regression model is suggested. Here, a fuzzy number with parametric membership function is set into correspondence to each point of factor space. Dependence of parameters of this membership function on affecting factors is described by well-defined regression models. Regression coefficients are determined by a fuzzy learnin...
Purpose
The purpose of this paper is to identify leaders and trends in branding research studies, undertaken during 2000-2019. Identification was made in the following categories: most popular subjects; most productive countries; most productive institutions; most productive scholars; most productive sources; most cited publications and most cited...
The paper dedicates to development of an information technology for the design of Mamdani-type fuzzy systems derived from experimental datasets. The proposed information technology provides synthesis of accurate, compact and interpretable fuzzy rule bases. A distinctive feature of the information technology is the following four-stage operation sch...
We estimated the level of interactions between all the pairs of the research groups and between all the pairs of the research divisions for 4 five-year periods on base of Dimensions data. The level of interactions is assessed by Jaccard index. Paired interaction for research divisions shows that every consecutive five-year period has decreased irre...
Estimating a level of similarity of two objects is a common problem in pattern recognition, clustering, and classification. Among these problems can be reviewer recommendation, similar text documents analysis, human pose detection in video, species distribution clustering, recommendation in internet-shops etc. In case of categorical attributes an o...
Сьогодні ради із захисту PhD-дисертацій формують у ручному режимі. Це обумовлює як корупційні ризики, так і значні витрати часу на пошук та аналіз кандидатів з великими шансами пропустити кваліфікованих опонентів. Тому виникає зацікавленість у автоматизації формування разових рад для усунення зазначених ризиків впливу людського фактора. Стаття фоку...
Метою дослідження є розробка метрики для оцінювання схожості двох дисциплін з освітніх програм з однієї і тієї ж спеціальності. Метрика принципово відрізняється від традиційного суб’єктивного порівняння змісту дисциплін освітніми експертами. Метрика не враховує змістовне наповнення дисциплін, а розраховує схожість на основі внеску дисципліни у форм...
Сьогодні ради із захисту PhD-дисертацій формують в ручному режимі. Це обумовлює як корупційні ризики, так і значні витрати часу на пошук та аналіз кандидатів з великими шансами пропустити кваліфікованих опонентів. Тому виникає зацікавленість у автоматизації формування разових рад, яка дозволила б усунути зазначені ризики впливу людського фактору. С...
Contains data about 67 PhD theses from the National Agency for Higher Education Quality Assurance of Ukraine. The data is used for experiments on reviewer assignment problem.
Ідентифіковано рівні спорідненості наукових спеціальностей у межах Австралійсько–Новозеландської стандартної класифікації наук ANZCRC-2020. Ідентифікація здійснена з використанням інформаційної системи Dimensions шляхом аналізу 33.8 млн публікацій за 2019–2023 рр. Рівень спорідненості оцінено за індексом Жаккара. Встановлено, що із 14535 можливих п...
Knowledge about research specialties’ kinship level is needed for solving such problems as: improving current research classification system; detecting similar scientific and educational institutions to set up cooperative relations or perform their reorganization; automatic reviewer assignment for peer reviewing PhD-thesis, papers, grant proposals...
В академічній спільноті тривають гарячі дискусії стосовно доцільності об'єднання спеціальностей, належності різних спеціальностей до однієї галузі знань тощо. Для обґрунтування подібних рішень важливо мати достовірні оцінки рівня спорідненості спеціальностей. Такі оцінки необхідні і для правильної організації конкурсу із розподілу бюджетних місць,...
В академічній спільноті тривають гарячі дискусії стосовно доцільності об’єднання спеціальностей, належності різних спеціальностей до однієї галузі знань тощо. Для обґрунтування подібних рішень важливо мати достовірні оцінки рівня спорідненості спеціальностей. Такі оцінки необхідні і для правильної організації конкурсу із розподілу бюджетних місць,...
Останнім часом все гостріше постає проблема якісного та своєчасного наукового рецензування. Наукові рецензенти здійснюють експертизу рукописів статей, доповідей конференцій, монографій, дисертацій, запитів на гранти тощо. Наукових рецензентів призначають переважно вручну в умовах дефіциту часу. За великих обсягів рецензування досягти високої якості...
Автоматизація розпізнавання об’єктів на зображеннях є доволі поширеною задачею з очевидним практичним застосування у промисловому виробництві, медицині, транспорті, безпеці та інших галузях. Сьогодні існує кілька хмарних сервісів, які пропонують онлайн-інструменти для вирішення різних завдань, пов’язаних з розпізнаванням зображень. Вони мають низку...
Розглядається задача моделювання багатофакторних залежностей з неперервним виходом за допомогою нечітких баз знань. Однією із головних конкурентних переваг нечіткого моделювання є інтерпретабельність нечітких баз знань – користувачу, далекому від математичних методів, доволі легко можна зрозуміло пояснити, на підставі чого отримується той чи інший...
A dataset for categorizing researchers. It contains 2489 researchers for categorization. Each researcher has a distribution of his/her papers over the research classification system ANZSRC-2020, and a distribution of his/her interests from Google Scholar over ANZSRC-2020. The data is taken from Dimensions for 2019-2023. It also contains the overall...
Оцінювання схожості двох об’єктів — це поширена задача в розпізнаванні образів, кластеризації та класифікації. Прикладами таких задач є підбір рецензентів наукових робіт, аналіз схожості текстових документів, ідентифікація поз людей у відеоряді, кластеризація природних ареалів, формування рекомендацій в інтернет-магазинах тощо. У випадку категоріал...
Запропоновано алгоритм тематичного моделювання науковців за науковими спеціальностям на основі їх інтересів у профілях у Google Scholar. Алгоритм використовує перелік наукових спеціальностей із системи класифікації наук ANZSRC. Інформаційним ресурсом для тематичного моделювання є база категоризованих наукових публікацій із системи Dimensions. Інтер...
An algorithm for topic modeling of researchers based on their interests from Google Scholar's profiles is proposed. As topics for modeling, we took research groups from research classification system ANZSRC-Australian and New Zealand Standard Research Classification. Researchers' distribution to research groups is found based on their interests' us...
The article identifies the relations between global brands and research activity during 2009-2018. Two types of relations are studied: support of the research by global brands and usage of the global brands in the research. The research support by 27 global brands and the global brands usage in the research are analysed over 2009-2018. The support...
У навчальному посібнику наведено базовий теоретичний матеріал та практичні приклади з регресійного аналізу, класифікації, категоризації та
кластеризації. Навчальний посібник призначено для студентів спеціальностей 151 – “Автоматизація та комп'ютерно-інтегровані технології”, 124 – “Системний аналіз”, 125 – “Кібербезпека” та 126 – “Інформаційні техн...
We calculated the similarity of 10878 pairs of the research fields for 2010-2019 and for 2000-2009 on base of Dimensions data. The similarity of the research fields is assessed by Jaccard index. The most tied research fields for 2010-2019 are Specialist Studies in Education and Curricular and Pedagogy, whereas this pair holds rank #6 for 2000-2009....
Соціальні мережі все частіше стають середовищем для погроз, образ та інших складових кібербулінгу. В онлайнових соціальних мережах задіяна величезна кількість людей, тому виникає потреба в автоматизації діяльності із захисту користувачів від антисоціального впливу. Одним із важливих напрямків такої діяльності є виявлення токсичних коментарів, що мі...
Тези доповідей конференції "MATLAB та комп'ютерні обчислення в освіті, науці та інженерії", Київ, 16-18 травня 2019 р.
Social networks sometimes become a medium for threats, insults and other components of cyberbullying. A huge number of people are involved in online social networks. Hence, a protection of network users from antisocial behavior is an important activity. One of the major tasks of such activity is automated detecting the toxic comments with threats,...
The article presents a hierarchical fuzzy rule base for intelligent support of decision making about cause of structural crack of stone building. According to civil engineering practice the causes of structural cracks are classified by the followings diagnoses: static overload; dynamic overload; especial overload; defects of basis and foundation; t...
Класифікація це віднесення об’єкта за деякими ознаками до одного з класів. До класифікації зводяться різноманітні задачі прийняття рішень в інженерії, економіці, медицині, соціології та в інших областях. В нечітких класифікаторах залежність «входи – вихід» описуються за допомогою лінгвістичних правил <Якщо – тоді>, антецеденти яких містять нечіткі...
В последние годы исследовались различные приемы повышения качества обучения нечетких классификаторов, один из которых состоит в выборе функции ошибки – целевой функции
соответствующей задачи оптимизации. Минимизация этой функции на обучающей выборке должна происходить быстро. Полученная при таком обучении нечеткая модель должна обеспечивать низкую...
У навчальному посібнику наведено теоретичний матеріал з технологій ідентифікації багатофакторних залежностей за допомогою баз знань. Знання представляються деревами рішень та нечіткими правилами. Розглядаються задачі ідентифікації регресійного та класифікаційного типу. Навчальний посібник призначено для студентів напряму підготовки 6.050202 “Автома...
Анализируется статистика статей украинских ученых, включенных в WoS. Статья считается украинской, если хотя бы один автор указал хотя одним своим местом работы украинскую организацию. Анализ осуществляется на 4 уровнях: 1) публикации; 2) цитируемость; 3) шедевры – высокоцитируемые статьи; 4) звезды – авторы большего количества шедевров.
Прямой аналог индекса Хирша: банкет = журнал; тост = публикация; упоминание в тосте (тостуемый) = цитирование
In a fuzzy classifier, the maping “inputs–output” is described by the linguistic 〈If–then〉 rules, the antecedents in which contain the fuzzy terms “low,” “average,” “high,” and so on. To increase the correctness, the fuzzy classifier is learned by using experimental data. The problems with equal and different costs of various classification errors...
Деякі люди звертаються до соціальної мережі лише епізодично, а деякі – практично «живуть» в них, що інколи межує із патологією. Для когось соціальна мережа — це відпочинок, але дехто не приймає рішень без обговорення в мережі. Достовірно встановлено, що онлайнові соціальні мережі сьогодні реально впливають на пове-дінку їх учасників поза мережею. В...
В нечетком классификаторе отображение "входы – выход" описывается лингвистическими правилами <Если – то>, антецеденты которых содержат нечеткие термы "низкий", "средний", "высокий" и т.п. Для повышения безошибочности нечеткий классификатор обучают по экспериментальным данным. Рассмотрены задачи с одинаковой и с разной ценой ошибок классификации раз...
В техніці, економіці, медицині, біології, політиці, спорті та в інших областях накопичені результати спостережень за різноманітними багатофакторними залежностями. Задача ідентифікації полягає в побудові за результатами спостережень математичних моделей аналізованих багатофакторних залежностей. Ідентифікацію залежностей здійснюють у 2 етапи. На перш...
For prediction of software system development efforts the paper proposes application of a fuzzy hybrid model in which rule antecedents are given by fuzzy terms and consequents – by " inputs – output " linear dependencies with fuzzy coefficients. According to experimental data, identification of the dependence of software module development efforts...
This paper suggests a new scientometric index that estimates knowledge diffusion and has two constituents: the first one is equivalent to a usual citation index, i.e., it describes the visible diffusion of scientific knowledge; the second one reflects the implicit diffusion of scientific knowledge and is expressed through the number of implicit cit...
Сегодня для оценивания результативности научной деятельности совместно с экспертными заключениями все чаще используют и наукометрические показатели. Проведен обзор основных наукометрических показателей, которые учитывают количество публикаций и количество цитирований как отдельно, так и совместно. Показаны способы учета дополнительной информации по...
Процеси створення, виведення на ринок та експлуатації брендів характеризуються невизначеністю різної природи, що обумовлено труднощами прогнозування реакції великої групи людей. Одним із найбільш ефективних інструментів моделювання гуманіс-тичних систем в умовах невизначеності є нечіткі технології. Вста-новлено, що в брендинзі найчастіше застосовую...
В нечітких класифікаторах зв’язок «входи—вихід» описується лінгвістичними правилами «Якщо — тоді», антецеденти яких містять нечіткі терми «низький», «середній», «високий» тощо. Для підвищення безпомилковості нечіткий класифікатор навчають за експерименталь-ними даними. Узагальнено критерії навчання нечіткого класифікатора на випадок платіжної матри...
A new scientometric indicator named SH-index is proposed. SH-index is a rational number. Its integer part equals integer part equals usual Hirsch index. The fractional part shows progress of the author in reaching the next unit of Hirsch index. SH-index is simple, interpretable, and inheriting all the advantages of Hirsch index. The new indicator e...
Предложен новый наукометрический показатель, который оценивает диффузию знаний и имеет две составляющие: первая эквивалентна обычному индексу цитирования, т. е. описывает видимую диффузию научных знаний; вторая – отражает скрытую диффузию научных знаний и выражается через количество
неявных цитирований. Практическая ценность предложенного показател...
Досліджено залежність між спротивом суспільства до корупції та часткою тіньової економіки для 30-ти європейських країн за даними 2003—2012 рр. Спротив корупції визначено за даними Transparency International. Тінізацію економіки визначено за даними Ф. Шнайдера. Встановлено групи країн з комплементарним та з конкурентним відношенням між корупцією та...
В доповіді аналізуються критерії точності, компактності, прозорості та інтерпретабельності нечітких баз знань, які використовуються для моделювання залежностей з неперервним, дискретним та нечітким виходом. Критерії точності. Вибір критерію точності залежить від типу задачі ідентифікації.
Одночасне оперування з правилами різних типів дозволяє описувати досліджувані залежності в різних зонах факторного простору за допомогою нечітких правил найбільш релевантного формату. Потреба в такій гібридизації обумовлена тим, що ті чи інші особливості складних багатофакторних залежностей краще описують нечіткі правила різних типів. В доповіді за...
Набув подальший розвиток метод нечіткого ієрархічного моделювання за рахунок розробки моделей коректного поєднання нечітких баз знань Мамдані, Ларсена, Цукамото,Сугено, класифікаційної та синглтонної для опису багатофакторних залежностей. Встанолено, що необхідною умовою узгодженості нечітких баз знань є ідентичність атрибутів поєдненних змінних. Р...
A genetic algorithm of searching for the set of rules is proposed in order to form a fuzzy knowledge base balanced according to the accuracy and compactness criteria. The algorithm is distinguished by introduction of the linear constraint into the statement of optimization problem. The constraint sets the level of the model accuracy compensation by...
Предлагается генетический алгоритм поиска набора правил для формирования нечеткой базы
знаний, сбалансированной по критериям точности и компактности. Отличием алгоритма является
введение в постановку задачи оптимизации линейного ограничения, которое задает уровень
компенсации точности модели ее компактностью. Это приближает область допустимых решен...
The knowledge base quality is viewed as the property of the model of dependence under study to satisfy customer's requirements according to many criteria, accuracy and compactness being the most popular among them. Fuzzy knowledge bases that simulate three types of dependences are investigated with the output in the form of a crisp number, fuzzy nu...
Ключевые слова: нечеткая база знаний, критерии качества, точность, компактность, нечеткая идентификация. Введение Предпосылкой успешной разработки теории формализованного проектирования нечетких баз знаний является определение термина «качество нечетких баз знаний». Проще всего качество отождествить с точностью, т. е. c отклонением результатов нече...
Запропоновано новий наукометричний показник, що оцінює дифузію знань. Він має дві складові, які визначаються за кількістю прямих та прихованих цитувань Запропонований підхід успадковує механіз-ми оцінювання діяльності персоналу в сітьовому маркетингу. Аналогом прямого цитування висту-пають персональні продажі працівника, а непрямого цитування — про...
Запропоновано нову структуру нечіткої бази знань, в якій антецеденти задаються нечіткими термами, а консеквенти — лінійними залежностями «входи—вихід» з нечіткими коефіцієнтами. За-пропоновано алгоритм логічного виведення за цією базою знань для випадку чітких та нечітких вхід-них даних. На основі теорії нечіткої ідентифікації сформульовано математ...
Досліджено задачу оптимізації розміщення зовнішньої реклами торгових марок за критеріями ви-трат та кількістю контактів з цільовою аудиторією. Оптимізацію розміщення реклами зведено до нелінійної задачі про рюкзак. Тестові приклади показали, що прийняті розв’язки цієї задачі оптимізації можна отримати як за жадібним, так і за генетичним алгоритмом...
Виконано огляд нечітких діагностичних моделей, які застосовуються у будівництві та експлуа-тації будинків та споруд. Застосування нечітких баз знань дозволяє за відсутності аналітичних за-лежностей між параметрами стану та діагностичними рішеннями побудувати адекватні матема-тичні моделі на основі досвіду експертів та експериментальних даних.
Предложен новый наукометрический показатель – Sh-индекс. В Sh-индексе целая часть
является обычным индексом Хирша, а дробная показывает, насколько ученый приблизился к
следующему значению индекса Хирша. Дробная часть рассчитывается как доля
опубликованных статей, необходимых для достижения следующего значения индекса
Хирша
я. Модифицирована постановка задачи оптимального размещения базовых станций в беспроводных сетях с учетом затухания сигналов в радиоканале. Разработан эвристический метод решения этой задачи на основе муравьиных алгоритмов оптимизации.
The state of a task for optimal allocation of wireless network base stations is modified taking with account the...
A new scientometric indicator – Sh-index is proposed. In Sh-index the integer part is a usual Hirsch-index and the fractional part shows how close a scientist is to the next value of Hirsch-index. The fractional part is calculated as a proportion of published papers required to reach the next value of Hirsch-index.
Whenever a problem to predict and ensure reliability of human-machine systems is posed, regression models are usually applied
to evaluate the influence of different factors on faultlessness, exactitude, operating speed, and other characteristics of
the operator performance. The Sugeno fuzzy knowledge bases are proposed to model multi-factor relatio...
Розглядається задача ідентифікації залежності середньої тривалості міжнародного розшуку осіб від двох факторів: рівня інформаційного забезпечення правоохоронних органів країни очікуваного перебування злочинця та рівня сумлінності персоналу, задіяного в розшуку. Вибірка експериментальних даних сформована за особами, міжнародний розшук яких ініці-йов...
Описана разработанная автором автоматизированная система обеспечения надежности алгоритмических процессов в условиях неопределенности. Теоретическую основу системы составляют методы софт-компьютинга.
The paper deals with the description of automatic system, developed by the author, for assuring reliability of algorithmic processes in uncertainty conditions. Soft-computing methods constitute theoretical basis of the system. Keywords: algorithmic process, reliability, modeling, optimization, soft computing, fuzzy
numbers.
The paper considers the training of a fuzzy model with the help of a training set with fuzzy model output values. Two ways
are proposed for constructing fuzzy rule-based multifactor models that produce fuzzy numbers at their outputs. The problem
of tuning such fuzzy models on the basis of a fuzzy training set is formulated, methods of its solution...
Для повышения точности нечеткую модель обучают, т.е. итерационно изменяют ее параметры для минимизации отклонения результатов логического вывода от экспериментальных данных. Настраивают как веса правил, так и функции при-надлежности нечетких термов. Обучение нечеткой модели Мамдани представляет собой задачу нелинейной оптимизации, исследованию кото...
Запропоновано ймовірнісні матричні моделі надійності операторів та логічних умов, які врахову-ють можливість суміщення помилок різних типів під час виконання алгоритмічного процесу. Встано-влено, що відомі багатоарні моделі надійності алгоритмічних структур за несумісних помилок, залишаться правильними і при підстановці в них запропонованих матричн...
В монографії досліджується моделювання та оптимізація надійності багатовимірних алгоритмічних процесів, при виконанні яких вносяться, виявляються та усуваються помилки різних типів. Пропонуються постановки та методи розв’язання задач чіткої та нечіткої оптимізації надійності таких процесів. Узагальнено багатовимірні моделі надійності операторів, ло...
Рассмотрены вопросы проектирования нечетких систем в пакете Fuzzy Logic Toolbox вычислительной среды MATLAB. Даны необходимые сведения в области теории нечетких множеств и нечеткой логики. Приведен теоретический материал по проектированию нечетких систем. Изложены теория нечеткой идентификации, методы нечеткой кластеризации и их применение для экст...
Typical violations of transparency of the Mamdani fuzzy model, which arise as a side effect of learning by experimental data are revealed. We suggest a new learning scheme of the Mamdani fuzzy model, which differs from the known ones by the following: 1) expansion of supports of fuzzy sets of output variable; 2) excluding coordinates of maxima of m...
Эта монография является авторским переводом с украинского языка монографии “Моделювання та оптимізація надійності багатовимірних алгоритмічних процесів” (ISBN 978-966-641-231-0). В монографии исследуется моделирование и оптимизация надежности многомерных алгоритмических процессов, при выполнении которых возможно внесение, обнаружение и исправление...
This paper generalizes the method of identification of nonlinear dependences by a fuzzy knowledgebase to the case of fuzzy training sets. In such a set, terms are used to estimate inputs. The computer experiments performed showed that the fuzziness of experimental data is no obstacle to identification. The use of fuzzy training sets allows one to a...
This paper generalizes the method of identification of nonlinear dependences by a fuzzy knowledgebase to the case of fuzzy training sets. In such a set, terms are used to estimate inputs. The computer experiments performed showed that the fuzziness of experimental data is no obstacle to identification. The use of fuzzy training sets allows one to a...
We suggested a model of competitiveness of brand product, which takes into account 10 factors. The model is based on 52 fuzzy rules of type. Potential of application of the model for control of competitiveness of brand product is shown. We state a problem of learning of fuzzy model of competitiveness on the basis of experimental data.
1]. Прогнозирование конкурентоспособности обычно проводят по методу взве-шенной суммы частных технико-экономических показателей [2–4]. При этом не-явно предполагается, что недостаток одних показателей можно компенсировать избытком других. Пропорции таких «взаимозачетов» постоянны на всем фактор-ном пространстве, они определяются весовыми коэффициен...
Навчання нечіткої бази знань являє собою ітераційну процедуру зміни її параметрів для мінімізації відхилення результатів логічного висновку від експериментальних даних. Запропоновано 2 способи побудови багатофакторних моделей на нечітких базах знань, на виході яких отримують нечіткі числа. Запропонована постановка задачі навчання таких нечітких баз...
Предлагается новая структура нечеткой регрессионной модели. Вместо аппроксимации зависимости «входы–выход» функцией с нечеткими коэффициентами каждой точке факторного пространства ставится в соответствие нечеткое число с параметрической функцией принадлежности. Зависимость параметров этой функции принадлежности от влияющих факторов описывается четк...
В статье рассматривается задача многокритериального анализа проектов создания бренда. Определены особенности этой задачи и обоснована целесообразность применения метода нечеткого многокритериального анализа при выборе лучшего варианта бренд-проекта. Предложены правила «что,
если» анализа бренд-проектов, которые определяют необходимые изменения конк...
В статье рассмотрен способ настройки нечетких баз знаний с помощью нечеткой обучающей выборки. Этот способ развивает ранее предложенный метода нечеткой идентификации нелинейных зависимостей. Проведенные компьютерные эксперименты показывают, что нечеткость в экспериментальных данных не является препятствием для идентификации. Если нечеткая выборка в...
This paper proposes the method, which allows predicting such reliability figures of a discrete algorithmic process as the fuzzy time and the fuzzy probability of correct execution. Fuzzy numbers represents the uncertain source modeling data. Fuzzy rule bases used for taking into account dependence of source data on many influencing factors. Fuzzy l...
Предложено два метода построения функций принадлежности нечетких множеств за распределением экспериментальных данных. Эти методы, в отличие от метода гистограмм, не требуют больших выборок данных. Основной идей предложенных методов является использование кластеризации экспериментальных данных, по которой синтезируются функции принадлежности при экс...
This paper reviews the theory and applications of ant algorithms, new methods of discrete optimization based on the simulation of self-organized colony of biologic ants. The colony can be regarded as a multi-agent system where each agent is functioning independently by simple rules. Unlike the nearly primitive behavior of the agents, the behavior o...
A fuzzy model of brand competitive strength index is proposed. The model takes into account 10 factors via 52 fuzzy rules. The paper also consists of a problem statement of fuzzy model tuning on the basis of an experimental data set. Examples show applications of the model for the prediction of the brand competitiveness index of Ukrainian vodkas as...