Content uploaded by Ekaterina Petrova
Author content
All content in this area was uploaded by Ekaterina Petrova on Sep 09, 2022
Content may be subject to copyright.
Кодирование и
систематизация
шрифтов прямого
начертания
по методу RHA
Петрова Е.Т., Петров Т.Г.
Санкт-Петербург, 2021
The Coding and Systematization of Upright fonts by the RHA method
Аннотация
Количество шрифтов неопределенно велико и продолжает расти. Трудности их упорядочения
связаны с большим разнообразием возможных подходов к их описаниям, с этим же связано
отсутствие единого основания классификации. Так, шрифты группируются по качественным
признакам: историческим, пластическим, назначению, типу создания др. Внутри самих групп
шрифты располагаются в алфавитном порядке названий, не имеющих связи с изображением
знаков. При таких способах упорядочения не отражаются непрерывность и возможные законо-
мерности изменения форм шрифтов. Поиск шрифтов, сходных по форме, и выявление клонов
затруднены.
2
Из всего множества шрифтов для их упорядочения были выбраны наиболее употребительные –
наборные прямые. В предлагаемой работе использован метод кодирования составов сложных
систем RHA, где R-качественно-количественная ранговая формула, Н и А – две количественные
интегральные характеристики: сложности и простоты. Объектом нашего описания был выбран
знак «Н» – общий для кириллицы и латиницы. Он помещён в фиксированную рамку фонтОкно,
в которой выделены 4 компонента. Цель презентации – содействовать освоению метода для
создания каталогов шрифтов и диаграмм НА для разносторонних исследований шрифтов, а
также иных объектов со сходной структурой распределения компонентов.
Состояние дела
Если вы профессионал и сталкиваетесь с подбором шрифтов, то чувствуете
себя как рыба в воде. Начинающим дизайнерам, учащимся, аналитикам
и мета-дизайнерам нужное начертание помогают найти поисковики по
заданному изображению, программы-менеджеры в компьютерной базе
пользователя, так как общая проблема поиска: имя шрифта не несёт
информации о его свойствах [15] .
3
Исторические, географические, морфологические и корпоративные классификации
понятны теоретикам и профессионалам [2]. Для систематизации шрифтов в каталоге
Джеффа Левела, Брюса и Бренды Ньюмен приводятся 8 значимых классификаций [13].
Это вторая проблема: множество классификаций не соотносимы друг с другом [10].
Также появление пиратских версий шрифтов множит общее количество, но внесение
их в список легальных шрифтов незаконно. Это значит, что невозможен учёт их
использования.
В этой ситуации необходимо создание системы, с помощью которой можно
отображать и соотносить все шрифты и классификации на едином шрифтовом поле.
3
Цели работы
01
02
Предложить буквенно-числовую систему кодирования и упорядочения
шрифтов прямого начертания, позволяющую однозначно упорядочивать
их, идентифицировать и выявлять клоны.
03
Представить пример реализации системы в виде таблицы и диаграмм,
где одинаковые шрифты (например, клоны) находятся рядом, а похожие
располагаются близко.
Тем самым расширить представление о возможностях математического
описания шрифтов, их разнообразии, их систематизации и изучения.
4
Метод RHA [5, 6]
в приложении
к кодированию
графического
образа буквы
Имея в виду широкие возмо-
жности метода, в том числе
и при описании рисунка
камня [7], была естественна
попытка разработать способ
кодирования плоских фигур,
частным случаем которых
являются шрифты.
5
Условия, предъявляемые
к исследуемым объектам,
для их классификации
с помощью метода RHA:
1. Определённость – чёткость
выделенности компонентов.
2. Сумма выделенных компонентов
состава должна быть равна 100%
(или единице).
О выбранном методе
Для решения этих задач мы использовали информационный язык и метод
на его основе RHA [5, 6], который был создан для систематизации химических
составов геологических объектов, в результате использования которого, мы
получаем код в виде последовательности:
R – ранговая формула – последовательность символов элементов по
снижению их содержаний , Н – энтропия Шеннона как мера сложности
состава, А – анэнтропия Петрова как мера простоты (в химии-чистоты),
а также диаграммы НА.
Впоследствии на его базе были разработаны способы однозначного описания – кодирования
и систематизации составов объектов любой природы. Были сформированы каталоги: химиче-
ских составов минералов, минеральных составов горных пород, возрастных распределений
населения. Разработаны алгоритмы кодирования структур кристаллов, рисунков цветного камня
и другого. Предложены диаграммы для представления процессов эволюции составов.
6
Как видим, эти характеристики являются
разнородными. (словарь терминов)
Для метода RHA требуются
характеристики однородные, что позволит
привести их сумму к 100% (или единице).
Это заставляет отойти от общепринятого
описания шрифтов.
Поскольку буквы при одинаковой
высоте различаются по форме и,
как правило, по ширине, в пределах
алфавита для сравнимости их описания
было принято решение выбрать одну
букву – как представителя шрифта.
7
1. Пропорции
2. Контраст
3. Насыщенность
4. Наклон
Общеизвестны
качественные
характеристики
шрифтов:
Выбор буквы
“Н” проста – не имеет выносных
элементов.
У неё чёткие границы слева и справа.
У “Н” чётко выражены вертикальные,
горизонтальный штрихи и
внутрибуквенный просвет.
Знак “Н” принадлежит и к латинице,
и к кириллице.
В своей работе авторы
презентации обратились
к книге Э. Шпикермана
“О шрифте” [11], где для
сравнения шрифтов
используется буква “Н”.
8
Она удобна для наших
целей тем, что:
Как видим, разнообразие форм буквы “Н” неопределённо велико.
Буквы не соразмерны ни по высоте, ни по ширине, ни по декоративным
элементам, ни по способу заливки буквы.
Упростим ситуацию. Для начала приведём “Н” разных шрифтов к одной высоте,
которую мы примем за 1 (единицу) в дальнейшей работе.
Ситуация улучшилась, но остаётся напряжённой в связи с обилием
стилистических особенностей.
9
Имеем:
Упростим форму буквы, удалив
декоративные элементы. Тем самым
выявляются базовые, структурообра-
зующие конструктивные компоненты.
А именно: штамбы и перекладина.
Так можно видеть их соотношения
яснее.
Освобождённое от декоративных эле-
ментов очко буквы назовём каркасом.
3. Очко буквы – (letter face, character) – это видимое изображение буквы,
отпечаток на носителе (например, бумаге или экране).
4. Каркас – это совокупность конструктивных деталей буквы, очко литеры, ли-
шенное засечек, росчерков, вариаций тона и т.п. декоративных особенностей.
Введение понятия “каркаса”
3. 4.
10
В случае, если один штамб
короче другого, штамбы
приравниваются по
“базовой линии” (baseline)
и/или “линии прописных”
(cap height). Если ширина
штамба неравномерна, то
берётся средняя величина
между толстым и тонким
участками.
1.
2.
1. Буква “Н” шрифта
Rustica 2. её каркас
Так выглядит
ряд каркасов
приведённых
ранее шрифтов.
11
Получив из очка буквы её каркас, мы чётко выделили несущие части:
штамбы и перекладину. Расчёт соотношения только этих частей не учитывает
ширину а также внутреннее пространство. Для полноты описания каркаса
требуется учёт всех четырёх параметров. Поэтому необходимо каркас поместить
в такие условия, где штамбы, перекладина, внутреннее пространство и ширина
будут учитываться как равноправные.
Для сопоставления каркасов строим прямоугольную
ячейку, в которую будут помещаться каркасы и сохраняться
их пропорции. Назовём такой прямоугольник фонтОкном.
Ширину фонтОкна следует
задать заведомо бОльшую,
чем ширина известных авто-
рам шрифтов, чтобы учесть
существование аномально
широких.
Поэтому было решено выб-
рать ширину F теоретически.
«фонтОкно» (F)Как известно, существует «золотое сечение»
= 1.618... Оно связывает природу, геометрию
и эстетику, чем занимается современная наука
об описании любых разнообразий – теория
информации. Частным случаем разнообразия
являются рисунки шрифтов. При построении
фонтОкна учтём указанную пропорцию.
Ширина самого широкого найденного шрифта
при высоте 1 – Expanded Antique (автора
Stephens Shanks) составляет 2.2, то есть более
ширины прямоугольника с шириной 1.618 [12] .
12
Поэтому была выбрана ширина прямоугольника (F) бОльшая,
чем 2.2, с учётом пропорций Ле Корбюзье[3], приведённых в
его «Модулоре». Конкретно, сумма числа «золотого сечения»
и единицы: 1.618+1=2.618 Напоминаем, что высота каркаса
приведена к 1 и она совпадает с высотой F.
Каркас “Н” в фонтОкне
Поместим каркас вплотную к левой
стороне фонтОкна (на рисунке) и
выделим в нём следующие компоненты:
Fs – площадь фонтОкна
Ss – суммарная площадь двух штамбов или S1+S2
Bs – площадь соединительного штриха
Cs – площадь внутреннего свободного пр-ва или C1+C2
Os – площадь остаточного внешнего пространства
S Stress – основной вертикальный штрих;
B Bar – соединительный горизонтальный штрих;
С Counter – внутреннее свободное пространство;
O Outdoor – остаточное внешнее пространство.
13
ОS1S2
С1
С2
B
Доли компонентов
в площади фонтОкна в %%:
FS = SS + BS + CS + OS= 2.618,
что принимается за 100%
Индекс "s" около символов компонентов означает, что их числовые характеристики относятся к значениям их площадей (S).
В случае, если штамбы
не равны по площади
(Flat10ArtDeco), вид карка-
са остается неизменным.
14 Предельные случаи каркасов
при заполнении фонтОкна почти
одним компонентом
слева. Без фонтОкна и справа в
фонтОкне.
О
S
B
C
О≈100%
S≈100%
B≈100%
C≈100%
Min % Max %
Зависимость вида каркаса от долей
площадей его компонентов в F по
мере приближения к заполнению
всей площади фонтОкна, указанным
(слева) компонентом от минимального
до максимального значений.
Как мы видели, соотношения площадей компонентов фонтОкна
определяют облик каркаса.
Требуется такая форма описания фонтОкна, которая, учитывая
площади компонентов, фиксирует порядок их значимости (рейтинг).
Ранговая формула (R)
Ранговая формула шрифта –
это последовательность символов
компонентов в порядке уменьшения
их доли площадей в фонтОкне.
16
Эта форма описания была найдена при разработке
метода RHA (1971) и именуется ранговой формулой.
1 2
2
1
Построение R-формулы
16
ФонтОкно с помещённым в него каркасом “Н” шрифта
Broggadocio имеет следующие площади компонентов:
S=42,8 % B=0,3 % C=3,4 % O=53,5 %
Располагая символы компонентов в порядке уменьшения
их площадей, получаем последовательность:
O > S > C > B
Освобождаясь
от знаков
неравенства,
получаем
ранговую
формулу:
OSCВ
Знак “=” в ранговой формуле
17
При равенстве или близости площадей компонентов между
их символами ставится знак равенства “=”.
Так делается, когда при делении площади большей на меньшую получают
результат меньше 1,15 (менее 15 относительных процентов)
Это важно при поиске сходных форм каркасов.
В случае точного равенства символы компонентов в ранговой формуле
располагаются по специальному алфавиту, о котором речь пойдёт далее.
№R-формула Название
шрифта Очко Каркас в FSsBsCsOs
2 S=OCB King Tut Black 39.42 4.01 20.25 36.32
Разнообразие ранговых формул и задача их упорядочения
18
Как видим, R-формулы отличаются друг от друга. Есть
каркасы неразличимые по R, но разные по начертанию.
Здесь это – OSCB. Выявлять подобные случаи, в общем,
трудно, а в больших массивах практически невозможно.
Guinness Extra Stout NF
S = 66%
O = 20%
C = 13%
B = 1%
O = 58%
C = 29%
S = 8%
B = 5%
Lodge
Vienna Extended LET
C = 83.1%
O = 8.5%
S = 5%
B = 3.4%
S = 57%
O = 40%
B = 2.5%
C = 0.5%
YWFT Pudge
R = SOCB R = COSB
R = OCSB R = SOBC
O = 52%
S = 45%
C = 2%
B = 1%
Avatar R = OSCB
O = 62.5%
S = 36.25%
C = 1.22%
B = 0.03%
Loudine R = OSCB
Поэтому нужен способ упорядочения ранговых формул!
От ранговых формул к их
упорядоченной последовательности
Последовательность знаков в ранговой формуле похожа на слово, и по своей структуре, будучи линейной
совокупностью знаков и их смыслов, - является словом, поэтому с ними можно обращаться как со словами.
Для получения однозначной последовательности слов используются алфавиты.
Алфавитов существует много. Кроме алфавитов национальных языков существуют естественные: алфавит
химических элементов (Таблица Мендедеева) как алфавит химических составов минералов, шкалы длин
радио- и световых волн, натуральный ряд чисел (1-2-3-4….), шкала возрастных распределений населения
(5-10-15-20…). В этих алфавитах существует смысловые связи между соседними символами (знаками), и они
получили особое название интенсиональные [9], в отличие от экстенсиональных, не имеющих таких
связей. Алфавиты национальных языков – слабоинтенсиональны.
Существуют и искусственные: квази-естественные – алфавиты языков литера-
турных произведений (например: синдарин эльфийского языка Толкина и др.)
Наш алфавит искусственный, слабоинтенсиональный, так как смысловые связи между элементами каркаса
практически отсутствуют. Связь между ними появляется только при помещении каркаса в фонтОкно, что
обусловлено жесткостью условия равенства 100% суммы площадей фонтОкна. Изменение площади одного
элемента влечёт изменение всех остальных!
19
Искусственный алфавит для шрифтов
20
В нашем профессиональном деле за базовый алфавит
следует принять такой, который отразит особенности
предмета — важность соотношений площадей фонтОкна.
Именно:
S (штамбы) определяют насыщенность;
соотношение B (перекладины) и S – контрастность;
C (внутренний просвет) – светлоту;
О (свободное пространство фонтОкна) отражает ширину каркаса.
Поэтому наш алфавит будет выглядеть так: S B C O
Может показаться, что вариантов
последовательностей символов
неопределённо много. На самом
деле оно конечно и может быть
строго определено, а именно, –
равно количеству перестановок
из четырёх символов по формуле
N=4!, что читается как “4-факториал”.
Количество
возможных
R-формул (R’s)
21
1 SBCO 7 BSCO 13 CSBO 19 OSBC
2 SBOC 8 BSOC 14 CSOB 20 OSCB
3 SCBO 9 BCSO 15 CBSO 21 OBSC
4 SCOB 10 BCOS 16 CBOS 22 OBCS
5 SOBC 11 BOSC 17 COSB 23 OCSB
6 SOCB 12 BOCS 18 COBS 24 OCBS
Оранжевым выделены те пять R-формул, которые
удалось установить у каркасов в сотне случайным
образом выбранных реальных шрифтов.
Использовав алфавит S B C O,
получаем полный упорядоченный
набор возможных R-формул:
Формула для расчёта:
4! = 1 х 2 х 3 х 4 = 24
Одному слову обычно соответствует
одно понятие. В нашем случае одному
слову - R-формуле - соответствует много
каркасов.
После сбора и обработки 98 шрифтов
оказалось, что количество шрифтов
в группе с одинаковой R существенно
различны, как показано справа.
SOCB - 3
COSB - 1
OSBC - 5
OSCB - 54
OCSB - 35
Распределение
шрифтов
по ранговым
формулам
22
Первый успех налицо:
шрифты можно распределять
по выделенным 24 группам – R-классам.
Однако, распределения только по
ранговым формулам недостаточно.
Внутри ранговой формулы порядок
отсутствует – таблица на след. слайде.
Количество
шрифтов
имеющих
одинаковые
R-формулы:
ШРИФТ КАРКАС в FOSSSCSBS
Acsioma_
Shock 63.65 31.78 3.06 1.50
Aksent 54.51 27.47 12.80 5.22
Bodoni Bold 68.53 18.16 12.85 0.46
Braggadocio 53.73 42.77 3.20 0.30
FF Archian
Stencil Pro 73.29 16.54 8.04 2.13
PT_PTS95
Black 69.99 20.67 7.16 2.18
Super C 95.50 2.30 2.15 0.05
YWFT Black
Slabbath 66.89 27.25 4.05 1.80
Шрифты R-класса
OSCB
23
Попытка упорядочить
каркасы внутри одной
R-формулы посредством
естественным алфавитом
порядок не достигается.
Для упорядочения форм
каркасов по вертикали
требуется обобщающая
характеристика полного
набора площадей каждого
каркаса, т. е. сжимающая
информацию о совокупности
4-х площадей фонтОкна – их
интегральная характеристика.
Метод RHA представляет возможность упорядочения составов
по универсальному алфавиту – числовой последовательности.
Интегральных характеристик наборов данных известно неопределенно много.
Среди них наиболее распространены средние величины [1]. Способов расчётов
средних величин также много. В методе RHA используются две:
1) Информационная энтропия (Н) – мера сложности – отрицательное
средневзвешенное логарифмов содержаний компонентов в составе, и
2) Анэнтропия (А) – мера простоты – отрицательное среднеарифметическое
логарифмов содержаний.
Информационные, в нашем случае интегральные, характеристики рассчитываются
в долях единицы. Поэтому приведенные в таблицах %% значения площадей
фонтОкна перед расчётами делятся на 100.
Рассмотрим первую интегральную характеристику набора площадей фонтОкна – Н.
24
25
На рисунке показан теоретически
полученный каркас. Он вписан в F
с площадями компонентов равными
25%. Это самый сложный каркас.
Поэтому он получил название
SuperСompl (Самый Сложный).
OS = 25%
SS = S1+ S2 = 25%
CS = C1+ C2 =25%
BS = 25%
Н – мера сложности, она же равномерности
распределения площадей компонентов F.
Сложность минимальна и равна нулю, когда
имеется одна-единственная площадь любого
элемента фонтОкна, которой заполнено всё
фонтОкно.
Сложность максимальна в противоположной
ситуации, а именно, когда площади всех 4-х
компонентов фонтОкна равны друг другу.
И в жизненных случаях, когда мы выбираем
из многих сходных предметов, мы имеем дело
с максимальной сложностью. Чем меньше
различия и чем больше предметов, тем
сложнее ситуация выбора.
О
S1S2
С1
С2
B
Энтропия (H)
Сложное порождает простое.
Поэтому в дальнейшем мы будем
упорядочивать энтропии
каркасов по их снижению.
OS=SS=CS=BS
Эта формула была предложена Клодом Шенноном в 1948 г.
H = - (p1lnp1+ p2lnp2+ p3lnp3+ p4lnp4 )
Где ln — натуральный логарифм, pi — площадь в долях единицы (Σpi=1)
или, что то же H = - (Σ pilnpi)
26
Формула сложности (H)
О необычайной широте применения понятия сложности и этой формулы
можно прочесть в книгах Е. Седова «Одна формула и весь мир» [8]
и А. Моля «Теория информации и эстетическое восприятие» [4] .
В нашем случае, ЭТОЙ всеобъемлющей характеристики не хватает,
что становится ясным при знакомстве со следующей таблицей.
Таковы правила работы с вероятностями / частотами в теории информации, % не используются.
HШРИФТ КАРКАС в FOSSSCSBS
0.825 YWFT Black
Slabbath 66.89 27.25 4.05 1.80
0.825 Braggadocio 53.73 42.77 3.20 0.30
0.822 Acsioma_
Shock 63.65 31.78 3.06 1.50
0.810 FF Archian
Stencil Pro 73.29 16.54 8.04 2.13
0.809 Acsioma_
Next Rough 65.05 30.52 2.91 1.53
0.806 Acsioma_
Medium 64.38 31.47 2.71 1.44
0.797 SchoolBook_
Cond Bold 64.38 31.78 2.50 1.33
0.797 Acsioma_
Next 72.39 16.94 10.04 0.63
27
Введение дополнительной
интегральной характеристики
на примере R-класса OSCB
При расположении каркасов
по снижению H мы видим, что по
соседству стоят похожие каркасы
(Acsioma), но даже при равенстве
H (выделено красным) рядом нахо-
дятся и резко различающиеся.
Причина проста: у фонтОкна
четыре детали с площадями,
определяющими вид каркаса. Для
следующего шага в упорядочении
необходимо ввести вторую
интегральную характеристику.
28
Ниже приведена иллюстрация того, когда анэнтропия
максимальна. В этом случае одна из площадей
компонентов стремится к 100%. Однако, фонтОкно
полностью занято одним-единственным элементом
быть не может — “Н“ теряет свою узнаваемость.
Поэтому мы учитываем остальные три компонента,
вводя для них минимальные значения, достаточные
для их учёта, а именно 0.001%.
На рисунке представлены теоретические каркасы
в фонтОкне (слева) и без него (справа).
В случаях, когда мы выбираем подходящий
нам предмет из какого-то многообразия,
или когда существует один-единственный
предмет мы имеем дело с максимальной
простотой ситуации.
То есть простота максимальна при
очевидности выбора. (“Выбор” — как одно из
основных понятий теории информации.) У нас идёт
выбор среди площадей фонтОкна.
Когда единственный элемент F занимает
всю его площадь — это ситуация, когда
анэнтропия максимальна.
Мера простоты
А – анэнтропия
О≈100%
S≈100%
B≈100%
C≈100%
H A Каркас Шрифт
0.825 0.845 YWFT Black
Slabbath
0.825 1.294 Braggadocio
Эта формула как мера простоты (в химии – чистоты) была предложена
Т.Г. Петровым в 1971 г. и получила название анэнтропия:
А = -1/n*(Σlnpi)-lnn
Где ln — логарифм, p — площадь в долях единицы, n — количество компонентов (4),
i — номер компонента
(Минус единица, деленная на n, умножается на сумму произведений логарифмов площадей каждого
компонента выбранного шрифта. Из полученного результата вычитается логарифм количества компонентов).
29 Формула простоты - анэнтропии А
Подробнее об этой формуле и её смысле читайте на сайте автора.
Как видим, при близости
обоих параметров Н и А
каркасы очень похожи
(слева); а при совпадении
только Н каркасы сильно
различаются (справа).
H A Каркас Шрифт
0.809 0.947 Acsioma_
Next Rough
0.806 0.975 Acsioma_
Medium
То, что нужно начинать с энтропии (Н), это ясно, — она отвечает за
относительно большие площади, за ведущие особенности шрифта
И за начало ранговой формулы. Однако, далее возникает альтернатива
— изменения по её возрастанию или по снижению?
Минимальные значения сложности (Н) имеют 4 каркаса (28 слайд), поскольку
в этих случаях в фонтОкне остаётся один-единственный из 4-х компонентов.
Максимум энтропии имеет единственный вышеупомянутый каркас
SuperCompl (25 слайд). Поэтому берём его за начало упорядочения.
Как упорядочивать каркасы по Н и А
30
Соответственно, сначала каркасы в пределах одной ранговой формулы
упорядочиваются по снижению энтропии (H). В случае совпадения
значений энтропии, каркасы упорядочиваются по возрастанию анэнтропии
Покажем это на реальной таблице RHA – каталога собранной коллекции шрифтов.
31
Начало RHA-каталога
№ R-формула Н А Шрифт Очко Каркас в FSsBsCsOs
SBCO
1 S=B=C=O 1.386 0.000 SuperCompl 25.00 25.00 25.00 25.00
SOCB
2 S=OCB 1.187 0.303 King Tut Black 39.42 4.01 20.25 36.32
3 SOCB 1.134 0.340 Blackoak Std 52.01 4.01 20.24 23.74
4 SOCB 0.980 0.787 Guinness Extra
Stout NF 50.7 0.88 9.73 38.7
COSB
5 COSB 0.900 0.678 Vienna
Extended LET 4.56 3.07 62.8 29.6
OSBC
6 OSBC 0.908 0.759 Cuadrifonte 38.31 4.03 2.19 55.47
7 OSB=C 0.896 0.729 Tonal 33.60 3.47 3.03 59.89
На слайдах
31-33 вырезки из
полной таблицы
(вся таблица
по ссылке)
Каталог
начинается
с ранговой
формулы SBCO
– порядок букв
в этом слове
соответствует
порядку букв
в принятом
алфавите
(см. слайд 20).
В нашей
коллекции
существует
единственный
шрифт с такой
R-формулой –
теоретический
SuperCompl.
Примеры резких переходов форм в таблице
32
В рамках од-
ной R-форму-
лы, в данном
случае OSCB,
видны участ-
ки с малыми
изменения-
ми значений
энтропии
и резкими
различиями
анэнтропии и
форм каркасов.
(Например:
17 и 18, 21 и 22)
№ R-формула Н А Шрифт Очко Каркас в FSsBsCsOs
14 OSCB 0.966 0.491 Glaser Stencil 16.34 3.63 14.00 66.03
15 OSCB 0.937 0.713 Georgia 19.16 1.21 15.05 64.58
16 OSCB 0.911 0.582 PT_PTC75
Caption Bold 16.31 2.76 12.31 68.62
17 OS=CB 0.909 0.704 Book Antiqua 15.86 1.41 15.59 67.14
18 OSCB 0.908 1.169 Falstaff 33.66 0.22 8.54 57.58
19 OSCB 0.884 0.773 SchoolBook_
Bold 16.74 1.12 13.88 68.25
20 OSCB 0.878 0.660 Project Fairfax 18.84 2.21 9.65 69.31
21 OSCB 0.866 0.667 Regata 19.61 2.40 8.25 69.74
22 OSCB 0.866 +∞ GHSans 18.20 0.001 15.15 66.65
№ R-формула Н А Шрифт Очко Каркас в FSsBsCsOs
73 OCSB 0.874 0.651 Arial 10.09 2.33 17.56 70.02
74 OCSB 0.864 0.661 Verdana 10.16 2.30 16.82 70.72
75 OCSB 0.863 0.768 SchoolBook_Book 12.45 1.26 16.51 69.77
76 OCSB 0.862 0.765 Bengaly 12.82 1.28 15.97 69.93
77 OCSB 0.848 0.908 Bodoni 13.17 0.69 16.32 69.82
78 OCSB 0.837 0.702 Tahoma 10.18 2.07 15.49 72.26
79 OCSB 0.835 0.704 Kabel 9.28 2.12 16.50 72.10
80 OCSB 0.826 0.898 Pacioli 8.20 0.89 21.09 69.82
81 OCSB 0.824 0.864 Times New
Roman 10.81 0.95 16.77 71.46
33 Часть таблицы со шрифтами с близкими Н и А
В этой части
таблицы мы
видим, как
в рамках
R-формулы
OCSB распола-
гаются буквы
с близкими
значениями
Н и довольно
близкими А.
В этом случае
каркасы
наиболее
сходны.
(Например:
№№ 73 и 74;
78 и 79)
Как видно на предыдущих слайдах и в полной
таблице, на фоне относительно плавных
изменений форм каркасов, существуют участки
с их резкими изменениями.
Дело в том, что в колонку — линейно — упорядочиваются
фигуры, у которых компонентов больше одного, в нашем
случае четыре.
Единственное средство продолжить добиваться улучшения
порядка в расположении рисунков каркасов — переходить
к диаграммному представлению данных.
Вынесем данные HA на диаграмму для одной из R-формул.
34
35
Каркасы R-класса
OSCB и SuperCompl
(крайний внизу справа)
Как видим, в рамках одной R-формулы
сходные по насыщенности и контрасту
каркасы выстраиваются вдоль дуг.
Происходит общее изменение
форм каркасов от теоретичес-
кого с максимальной Н и
минимальной А к их
противоположным
значениям
(справа вверх налево).
Увеличим участок
диаграммы.
Номера соответствуют
опубликованной
таблице.
36
Участок диаграммы НА каркасов OSCB в интервале Н=0.68-0.79
Одинаковому или близкому по значению
сложности (Н) могут соответствовать
каркасы разные по насыщенности,
светлоте и контрасту.
Каркасы, сходные по значе-
нию H, но разные по форме
располагаются друг над
другом вдоль оси А, что
проясняет причины
неравномерности
изменений форм
каркасов
в таблице.
38
Дополнение
Может возникнуть сомнение
в необходимости введённого
понятия — “свободного пространства”
и его графического образа — “фонтОкна”
для формализации описания шрифтов.
Приведём диаграмму НА для сопоставления
степени упорядочения материалов при учёте
свободного пространства и без него, то есть
результатов расчётов на 4 и на 3 компонента.
Видны различия в распре-
делении каркасов: с учётом
свободного пространства
при помещении в фонтОкно,
и без его учёта.
В первом случае, – верхнее
“семейство” – каркасы, наи-
более сходные с соседними,
располагаются вдоль плав-
ной дуги.
Во втором учтены только
три параметра: штамбы,
перекладина и внутреннее
пространство. Наблюдается
скученность и хаотичность .
Диаграмма НА каркасов R-классов OCSB и CSB
39
40
●Введено упрощение буквы “Н” до каркаса, что даёт возможность перейти к количественному описанию каркасов.
●Введено фонтОкно (F) с помещением в него каркаса для описания шрифтов как совокупности площадей S, B, C, O.
Далее фонтОкно рассматривается, как специальный образ буквы.
●Числовые значения S, B, C, O приняты за основу кода RHA и их алфавитного упорядочения.
●Введен предметно-профессиональный алфавит S B C O.
●Код RHA — ранговая формула, энтропия, анэнтропия — использован для краткого описания совокупности
площадей компонентов фонтОкна.
●Выявлен полный набора возможных ранговых формул — 24.
●Выявлено пять R-классов из всех, находящихся в коллекции, состоящей из 99 случайно отобранных шрифтов.
●Введен и сконструирован теоретический каркас SuperCompl, имеющий максимальную сложность —
энтропию и максимальную простоту — анэнтропию, в качестве начала алфавита и начала упорядочения
каркасов по снижению энтропии.
●Построена таблица RHA в алфавитном порядке S B C O, по снижению H при данной R и возрастанию А
при равенстве H.
●Иерархия кодов RHA проявлена в структуре таблицы и расположении ранговых формул.
●Диаграмма НА использована для визуализации природы немонотонности изменения рисунка каркасов
в таблице RHA в пределах R-класса.
●Анэнтропия на диаграмме НА делает различимыми сильно варьирующие по форме объекты, близкие
или одинаковые по значению энтропии.
●Каркас Supercompl находится в крайней точке (MaxH, MinA) диаграммы НА.
Результаты использования метода RHA
в приложении к систематизации прямых шрифтов
Предложенная система кодирования при организации
расширенного банка данных открывает возможности:
➔1) находить похожие/одинаковые по начертанию каркасы,
в том числе клоны;
➔2) выявлять зрительно-тематические связи между назначениями
текстов и часто употребляемыми начертаниями для них;
➔3) отслеживать историю, тенденции и моду на те или иные начертания;
➔4) выделять области наиболее употребимых начертаний,
в том числе для создания новых шрифтов в определённых целях.
41
Перспективы развития
●Расширение информационного шрифтового поля добавлением
нового параметра — наклона.
●Использование метода RHAT, как развитие метода RHA при
добавлении третьей количественной характеристики Т —
толерантности — для повышения различимости каркасов .
●Переход к 3D диаграмме представления данных.
●Создание специализированного программного продукта
на базе описанного метода.
42
Инструмент — программа Petros-3
Работа идёт в комплексе с программами Excel и Word в среде Windows 10. Объём программы 2.5 Гб.
43
В работе использовался программный комплекс Petros-3 [5] .
Комплекс предназначен для содержательного, а именно, качественно-
количественного кодирования в форме RHAT составов объектов любой
природы при любых интервалах значений данных, систематизации кодов
с описаниями объектов, что обеспечивает формирование компонентно-
алфавитных иерархических периодических систем, свёртку информации
и обзор больших массивов R, получение сведений о наполнении Базы Данных,
а также представление составов на 2D диаграммах при изучении процессов
изменения составов и измерения расстояний между компонентными составами
объектов изучения в пространстве изучаемых признаков.
Программа доступна для свободного скачивания по ссылке на сайте автора метода.
43
44
Словарь основных терминов (в порядке появления в тексте)
Кодирование – способ единообразного сокращенного описания свойств объектов, позволяющий
приводить их в единую систему (порядок, структуру). (слайд 4)
Очко буквы – видимое изображение буквы на носителе, отпечаток, отображение (например на бумаге). (слайд 10)
Каркас – очко буквы “Н” освобождённое от декоративных элементов. (слайд 10, 11)
ФонтОкно (F) – прямоугольник со сторонами 2.618 х 1, предназначенный для размещения в нём каркаса. (слайд 12)
Компоненты фонтОкна – сумма площадей штамбов (S), площадь перекладины (B), сумма площадей внутреннего
пространства (С), площадь внешнего пространства (О). (слайд 13)
Площадь фонтОкна – сумма площадей компонентов F равна 100% (слайд 13)
Ранговая формула (R) – полуколичественная характеристика каркаса – последовательность буквенных
обозначений компонентов фонтОкна в порядке невозрастания доли площадей в фонтОкне. (слайд 15, 16)
Алфавит SBCO – искусственный предметно-профессиональный, или компонентный алфавит для систематизации R-
формул каркасов. (слайд 20)
R-класс – совокупность одинаковых R-формул. Имеется 24 класса возможных ранговых формул. (слайд 21)
Сложность каркаса – степень равномерности распределения площадей компонентов F,
минимальна при заполнении F только одним компонентом. (слайд 25)
Энтропия (H) – здесь – мера сложности распределения площадей каркаса. (слайд 25, 26)
Шрифт Supercomp (получен теоретически) – все площади компонентов каркаса “Н” этого шрифта в F
равны 25% Его энтропия максимальна и равна ln4. (слайд 25)
Простота каркаса – мера неравномерности распределения площадей каркаса, она же мера близости
к заполнению всего F каркаса. (слайд 28)
Анэнтропия (A) – мера простоты распределения площадей каркаса. Предложена Т.Г. Петровым. (слайд 28, 29)
RHA как код шрифта – буквенно-числовое представление шрифта с использованием площадей фонтОкна.
Таблица RHA содержит R-формулы, H, A, имена шрифтов, очко буквы “Н”, каркасы в F, площади SBCO (слайд 31, 32, 33)
Диаграмма НА представляет распределение каркасов или аллографов в виде точек. (слайды 35, 36)
Программа Petros обеспечивает обработку первичных данных фонтОкон в виде таблицы и построении диаграмм,
визуализируя составы поликомпонентных объектов. (слайд 40)
Благодарности
С.В. Мошкину за создание программного комплекса Petros 3, его
совершенствование и обслуживание с момента создания по нас-
тоящее время, и особо — за введение в программу алфавита SBCO.
С.В. Чебанову за деятельное участие в подготовке статьи,
опубликованной в журналах НТИ и ADML.
К.М. Кириченко и А. Хенкину за ряд существенных замечаний,
позволивших лучше изложить сложный материал.
К.М. Кириченко за создание плагина для измерения площадей
каркасов в фонтОкне.
45
«Automatic Documentation and Mathematical Linguistics»
E. T. Petrova, Tomas G. Petrov, Sergey Chebanov, S. V. Moshkin Method
of Coding for Multicomponent Objects (RHA) and Its Application for
Ordering Roman Fonts. May 2019. Automatic Documentation and
Mathematical Linguistics
«Научно-техническая информация»
Е.Т. Петрова, Т.Г. Петров, С.В. Чебанов, С.В. Мошкин Метод кодирования
многокомпонентных объектов (RHA) и его применение для
упорядочения шрифтов прямого начертания. // Научно-техническая
информация НТИ сер 2, 2019 с.28-44
«Вестник»
Петрова Е.Т., Петров Т.Г. Кодирование и систематизация шрифтов
на базе информационного языка - метода RHA. // Вестник
Санкт-Петербургского государственного университета технологии
и дизайна. № 1, 2015 Серия 2. Искусствоведение. Филологические
науки. 3(3):143-159 DOI: 10.3103/S0005105519030087
Опубликованные статьи по классификации
шрифтов прямого начертания методом RHA
Литература
●1. Джини К. «Средние величины», М.: Статистика, 1970.
●2. Королькова А. «Живая типографика», IndexMarket, 2007
●3. Ле Корбюзье Модулор: Mod-1. Mod-2. — М.: Стройиздат, 1976.- 239 c.
●4. Моль А. «Теория информации и эстетическое восприятие» М.: «МИР», 1966, 352 с.
●5. Петров Т.Г., Мошкин С.В. Метод RHA и его реализация в программном комплексе Petros-3. Вычисления
в геологии. 2011, №1, С. 50-53
●6. Петров Т.Г. Информационный язык для описания составов многокомпонентных объектов. //Научно-
техническая информация. Сер 2. 2001, №3. С. 8-18
●7. Петров Т.Г., Шуйский А.В. Параметрическое описание рисунка цветного камня. // Современные
проблемы науки и образования 2013,- №5
●8. Седов Е. «Одна формула и весь мир», Книга об энтропии. М.: Знание, 1982.—176 с.
●9. Чебанов, С.В., Петров Т.Г. Интенсиональность, интенсиональные алфавиты, интенсиональные слова
и словари. Сб. Актуальные проблемы современной когнитивной науки. Иваново. 20013 С.239-266
●10. Шмелёва А. «Классификация шрифтов: практика и проблемы», “Publish”, 2003 № 1, с.78-82
●11. Шпикерман Э. «О шрифте», М: «Манн, Иванов и Фербер», 2017
●12. Kapr A., Schriftkunst. Geschichte, Anatomie und Schönheit der Lateinischen Buchstaben. VEB Verlag der
Kunst. Dresden. 1971. 432 р.
13. Jeff Level, Brenda Newman, Bruce Newman. The Precision Type Font Reference Guide
●14. Lingchen Dai, Kang Zhang, Xianjun S. Zheng, Ralph R. Martin, Yina Li & Jinhui Yu. Visual complexity of
shapes: a hierarchical perceptual learning model. The Visual Computer January. 2021
●15. Schulz F. «The Anatomy of a Thousand Typefaces» «Анатомия тысячи шрифтов», Хабр, пер. NIX, 30.01.2018
47
Контакты
Томас Г. Петров
tomas_petrov@rambler.ru
https://tomaspetrov.ru
Екатерина Т. Петрова
katia.petrova@gmail.com
Благодарим за внимание :-)