ArticlePDF Available

Osmanlıca Belgelerin Elektronik Çeviri Uygulamaları İçin Bir İmla Kılavuzu Örneği: Dervaze

Authors:

Abstract

Bu çalışmanın amacı elektronik imla kılavuzu Dervaze'yi (dervaze.com) ve Osmanlıca metinleri Türkçeye, Türkçesini Osmanlıcaya çeviren morfolojik çeviri aracını tanıtmaktır. Dervaze'de halihazırda Osmanlı Türkçesine ait 72600 adet kelime yer almaktadır. Kelimelerin hem Latince hem Osmanlıca yazımı hem de ebced değerlerini sözlükte bulmak mümkündür. Elektronik bir kaynak olması dolayısıyla kelimelerin farklı ilişkileri (eşanlam, eşköken vs.) eklenebilmektedir ve benzer Osmanlıca yazılışa sahip kelimeleri listeleyebilmektedir. Bu imla kılavuzunun Osmanlı Türkçesi döneminin tüm söz varlığını barındırması planlanmaktadır. Dervaze aynı zamanda Osmanlı Türkçesiyle yazılmış metinleri günümüze kazandırmak için hazırladığımız çeviri programına da işlerlik kazandırmaktadır. Çeviri aracı Türkçe bir kelimenin morfolojik analizini yaparak, kök ve eklerini bulmakta, daha sonra bu kök ve ekleri ayrı ayrı Osmanlıcaya çevirmektedir. Türkçe ve Osmanlıca arasındaki yazım kuralları tam olarak birbirine çevrilemediği için bu yol tercih edilmiştir. Amaç Osmanlı Türkçesinin XIX. ve XX. yüzyıl metinlerini çevirmek olduğu için, imla kılavuzunun kaynakları da bu yönde belirlenmiştir. 1856 yılında yayımlanan Redhouse sözlüğü ve 1928 İmla Encümeni'nin kurallarına dayanan Belviranlı'nın Osmanlıca İmla Lügati tercih edilmiş, bununla birlikte İnternet'te bulunan çeşitli kelime listeleri de imla varyasyonlarını belirtmek amacıyla kullanılmıştır. İmla varyasyonları özellikle Osmanlı Türkçesinin imla kuralları çok net belirlenmemiş Türkçe unsurlarında önem kazanmaktadır. Bunların elektronik olarak tanınması ancak listelenmesiyle mümkündür ve bu nedenle tüm imla varyasyonları sözlük maddelerine dahil edilmiştir. Oluşturmakta olduğumuz sistemin OCR (Optik Karakter Tanıma) özellikleri kullanıma girdikçe, dönemin tüm kelimeleri asıl kaynaklardan taranacak ve farklı imlalar da kılavuzda yer alacaktır. XIX. yüzyıldan geriye doğru sürecek bir kaynak taraması çalışmasıyla, Osmanlı Türkçesinin söz varlığının tamamını kayda geçirmeyi hedeflemekteyiz.
International Journal of Languages’ Education and Teaching
Volume 5, Issue 3, September 2017, p. 78-84
Received
Reviewed
Published
Doi Number
09.07.2017
02.08.2017
27.09.2017
10.18298/ijlet.1824
Dervaze: A Spelling Dictionary for Digital Translation
of Ottoman Documents
Ayşegül ERGİŞİ
1
& İ. Emre ŞAHİN
2
ABSTRACT
The goal in this paper is to present Dervaze, which is utilized in translation of Ottoman Turkish to Modern Turkish and vice
versa through morphological analysis. As of today in the dictionary there are spellings of more than 72600 Ottoman Turkish
words. It is planned to store all Ottoman Turkish vocabulary in the dictionary. Dervaze underpins the translation facilities
between historical Ottoman texts to Modern Turkish. The translation tool analyses the suffix and roots of Turkish words, then
renders these separately in the target language. Such a technique is preferred because the most roots are irregular in Ottoman
Turkish and there is no one to one mapping between these two orthographies. The primary objective in the dictionary is to
translate XIX. and XX. century texts of Ottoman Turkish. Our initial sources are 1856 Redhouse Lexicon and Belviranlı's
spelling dictionary which relies on 1928 Spelling Committee's decisions. Various word lists available on the Internet are also
added despite their poor quality to identify spelling variations. Spelling variations are especially important in Turkish origin
words in Ottoman language, as there are no fixed spelling rules for them. It is required to list them in their entirety, as the one
of the aspects of the dictionary is to provide a basis for an Optical / Intelligent Character Recognition system for the Ottoman
language. As the OCR facilities become available we plan to extend the dictionary with all the primary sources automatically.
Going back from XIX. century documents, we plan to include all vocabulary of Ottoman Turkish in the dictionary.
Key Words: Lexicography, dictionary-making, computer-assisted translation, optical character recognition, Ottoman
Turkish.
Osmanlıca Belgelerin Elektronik Çeviri Uygulamaları İçin Bir İmla
Kılavuzu Örneği: Dervaze
ÖZET
Bu çalışmanın amacı elektronik imla kılavuzu Dervaze'yi ve Osmanlıca metinleri Türkçeye, Türkçesini Osmanlıcaya çeviren
morfolojik çeviri aracını tanıtmaktır. Dervaze'de Osmanlı Türkçesine ait 72600 adet kelime yer almaktadır. Bu kılavuzun
Osmanlı Türkçesi döneminin tüm söz varlığını barındırması planlanmaktadır. Dervaze aynı zamanda Osmanlıca metinleri
günümüze kazandırmak için hazırladığımız çeviri programına da işlerlik kazandırmaktadır. Çeviri aracı Türkçe bir kelimenin
morfolojik analizini yaparak, kök ve eklerini bulmakta, daha sonra buk ve ekleri ayrı ayrı Osmanlıcaya çevirmektedir.
Türkçe ve Osmanlıca arasındaki yazım kuralları tam olarak birbirine çevrilemediği için bu yol tercih edilmiştir. Amaç Osmanlı
Türkçesinin XIX. ve XX. yüzyıl metinlerini çevirmek olduğu için imla kılavuzunun kaynakları da bu yönde belirlenmiştir. 1856
yılında yayımlanan Redhouse sözlüğü ve Belviranlı’nın 1928 İmla Encümeni'nin kurallarına dayanan imla kılavuzu tercih
edilmiş, İnternet'te bulunan çeşitli kelime listeleri de imla varyasyonlarını belirtmek amacıyla kullanılmıştır. İmla varyasyonları
özellikle Osmanlı Türkçesinin imla kuralları çok net belirlenmemiş Türkçe unsurlarında önem kazanmaktadır. Bunların
elektronik olarak tanınması ancak listelenmesiyle mümkündür ve bu nedenle tüm imla varyasyonları sözlük maddelerine dahil
edilmiştir. Oluşturduğumuz sistemin Optik Karakter Tanıma özellikleri kullanıma girdikçe, dönemin tüm kelimeleri
kaynaklardan taranacak ve farklı imlalar da kılavuzda yer alacaktır. XIX. yüzyıldan geriye doğru recek bir kaynak
taramasıyla, Osmanlı Türkçesinin söz varlığının tamamını kayda geçirmeyi hedeflemekteyiz.
Anahtar Kelimeler: Sözlükbilim, sözlük hazırlama, bilgisayar destekli çeviri, optik karakter tanıma, Osmanlı Türkçesi.
1
Yard. Doç. Dr., Lefke Avrupa Üniversitesi, aysegulergisi@gmail.com
2
Doktora Öğrencisi, Bilkent Üniversitesi, emre.sahin@teknokrat.com.tr
79 Ayşegül ERGİŞİ & İ. Emre ŞAHİN
International Journal of Languages’ Education and Teaching
Volume 5, Issue 3, September 2017
1. Giriş
Sözlük biliminin, son yarım yüzyılda çok büyük bir gelişme göstermesinin en önemli nedeni bilgi
teknolojilerinin, bilgisayarların hızla gelişmesidir. Bilgisayarların birçok bilgiyi depolayabilmesi,
sınıflandırabilmesi, kolay erişilebilir kılması sayesinde önceleri elle ve tek tek toplanan fişler
arasından yapılan bir seçki sonucunda oluşturulan basılı sözlüklerin yanı sıra sanal ortamda çok hızlı
biçimde hazırlanan pratik sözlükler de önem kazanmıştır. Özellikle İnternet'in kolay erişilebilir
olmasıyla çevrim içi (online) sözlükler, avuç içi bilgisayarlar ve akıllı telefonlara indirilen uygulama
(program) zlükleri yaygın biçimde kullanılmaya başlanmıştır. Çevrim içi ve uygulama elektronik
sözlüklerden bazıları; Türk Dil Kurumu'nun hazırladığı sözlükler, İngilizce-Türkçe ve Türkçe-
İngilizce sözlükler, Türkçe kelimelerin etimolojisi hakkında bilgi veren sözlükler, hukuk, tıp ve ticaret
terimlerini veren sözlüklerdir.
Bilgisayar ve internetin elektronik sözlük yapımında sağladığı kolaylıklara çeviribilim alanına
getirdiği olanakları da eklemek gerekir. Bir dilden başka bir dile, bir lehçeden başka bir lehçeye çeviri
yapan araçlar geliştirilmeye başlanmıştır. Ancak çeviri araçlarının bazı sorunları olduğu, kullanıcıyı
doğru sonuçlara ulaştırmadığı da bilinmektedir. Google ve Yandex çeviri araçları gibi. Bunun nedeni
bu araçların zcüklerin yalnızca birebir karşılıklarıbulmaya çalışması ve araçlara dillerin yapısal
özelliklerinin, söz dizimi kurallarının ayrıntılarıyla öğretilmemesidir. Dil çeviri programlarının
dışında kalan alfabe çeviri programlarının ise doğru sonuçlar verdiği bilinmektedir. Örneğin Kiril-
Latin çeviri programı olan Gaspıralı, yirmi Türk lehçesinin Kiril alfabesiyle yazılmış sözcüklerini Latin
harflerine çevirebilmektedir. (http://gaspirali.kultur.gov.tr/)
2. Elektronik İmla Kılavuzu: Dervaze
İmla, Türk Dil Kurumu'nun Bilim ve Sanat Terimleri Ana Sözlüğü'nde "Bir dilin söz varlığını o dilde
yürürlükte olan ses, ekil, köken vb. kurallara uygun olarak yazıya geçirme; dildeki sözleri kurallarına
uygun olarak yazma." olarak tanımlanmıştır.
(http://www.tdk.gov.tr/index.php?option=com_bilimsanat&arama=kelime&guid=TDK.GTS.596144c6f
13e43.37291384) İmla, bir yazıda doğabilecek birtakım kavram kargaşasının önüne geçilmesi, yanlış
okumanın önlenmesi, okumanın ve anlamanın kolaylaştırılması, okuma ve yazmada herkesin aynı
kurallara tabi olması için belirlenmiş olan kurallardır. Yazım kurallarını uygulamada yazım kılavuzu,
yazımda birliğin sağlanması düşüncesinden yola çıkılarak ortaya çıkan birleştirici, herkesin
benimseyeceği, kullanacağı kurallar ve yazım biçimlerine yer verilen kurallardan oluşan ortak yazım
rehberidir. Biz bu yazıda elektronik yazım kılavuzu olarak nitelediğimiz Dervaze'yi tanıtmaya
çalışacağız. Adı corpus sözcüğünün karşılığı olan Dervaze, çeşitli kaynaklardan derlenmiş Osmanlı
Türkçesine ait sözcüklerden oluşan bir yazım kılavuzudur. Bu kılavuz aynı zamanda Osmanlı
Türkçesiyle yazılmış metinleri günümüze kazandırmak için hazırladığımız çeviri programına işlerlik
kazandıran bir vasıtadır.
Osmanlı Türkçesi dönemlere göre ve okunan metin türüne göre değişen oranda Arapça, Farsça ve
Türkçeden alınmış çeşitli sözcük ve kalıplara sahip bir yazı dilidir. Arap alfabesinin kullanılduğı Eski
Anadolu Türkçesi ve Osmanlı Türkçesi dönem metinlerinin imlasında sözcüklerin bağlı olduğu dilin
kuralları esas alınmaktadır. Bir sözcük Arapça veya Farsça kökenli ise bu dillerdeki yazılış şeklinde
bir değişiklik yapılmaz, o dildeki imlasıyla yazılır. Türkçe kökenli sözcüklerin yazımında ise
80 IJLET 2017, Volume 5, Issue 3
International Journal of Languages’ Education and Teaching
Volume 5, Issue 3, September 2017
yüzyıldan yüzyıla değişiklik görülür. Eski Anadolu Türkçesi metinlerinde yazım sorununu çözmek
için harekeler kullanılmıştır. 13. ve 15. yüzyıllarda yazılmış Türkçe el yazmalarının çoğunlukla
harekelendirilmiş olması imla sorununun varlığına işaret eder (Kanar, 2010, s. 5). Yüzyıllar boyunca
yazı dili olarak önemini korumuş olan Osmanlı Türkçesi metinlerinin günümüze aktarılması için
yapılması gereken şey; yazım kurallarına uygun olarak bu dile ait tüm sözcükleri, kalıpları,
tamlamaları belirlemektir.
3
Dervaze'den önce Osmanlı Türkçesinin tüm sözcüklerini kapsayan,
müstakil bir elektronik imla kılavuzu mevcut değildi.
4
Bu sözcükleri ve imlalarını kapsayan zlüğü
hazırlamak amacıyla İnternet'te dağınık halde bulunan bazı sözlüklerden yararlandık. Bunların telif
haklarını ihlal etmeden Osmanlıca sözcükleri ve tamlamaları toplamaya başladık.
Sözlükte Osmanlı Türkçesine ait toplam 72600 adet sözcük yer almaktadır. Bu sayının yaklaşık otuz
bini (29647) İngiliz sözlükbilimci James W. Redhouse'un hazırladığı 1856 yılına ait İngilizce-Osmanlıca
Sözlük'ten alınmıştır. Bu sözlük yazarın Kırım Savaşı esnasında İngiliz askerlerine Türkçeyi pratik
yoldan öğretmek amacıyla 1855'te birinci baskısı yapılan Vademecum of the Ottoman colloquial
language adlı eserinden faydalanılarak hazırlanmıştır. Arapça, Farsça ve Türkçe kökenli çok sayıda
sözcük, bu sözlüğün İngilizce-Osmanlıca bölümünden alınmıştır. Yazım kılavuzunun en önemli
kaynağını Redhouse oluşturmaktadır.
İngilizce sözcük
Türü
Okunuşu
Abbreviate
v.a.
kısaltmak
ihtisâr etmek
-ed
p.p.
kısa
muhtasar
Abdicate
v.n.
terk-i saltanat etmek
saltanattan çekilmek
Abhor
v.a.
hiç sevmemek
menfûr tutmak
Abide
v.a.
oturmak
kalmak
sâkin olmak
İkinci kaynağımız Ali Kemal Belviranlı'nın 1978 yılında basılan Osmanlıca İmlâ Lügati'dir. Eserde 18359
Osmanlıca sözcüğün yazılışı mevcuttur. Her türde sözcüğün yazımının yer aldığı eserin eksiği
Arapça ve Farsça tamlamaların sayıca yetersiz oluşu ve bunların yazımının 1928 Encümen kaidelerine
uygun olarak tamlayan ve tamlananın bitişik olarak yazılmasıdır.
3
Basılı birkaç imkılavuzu: Muhammed Ali Ensari'nin Osmanlıca İmla Müfredatı (Hayrat Vakfı Yayınları), Hasan
Basri Hürata'nın Osmanlıca İmla Kılavuzu (Gece Kitaplığı), Ali Kemal Belviranlı'nın Osmanlıca İmla Lügatı (Marifet Yayınları),
Mehmet Kanar'ın Osmanlıca Yazım Kılavuzu (Say Yayınları).
4
Yalnızca Pamukkale Üniversitesi Çağdaş Türk Lehçeleri ve Edebiyatları bölümü tarafından hazırlanan elektronik
sözlükteki sözcüklerin (15940 sözcük) Osmanlıca yazılışları mevcuttur. http://ctle.pau.edu.tr/osmtr/index.php. Bir de android
telefonlar için Zafer Şık tarafından hazırlanan Osmanlıca lügat sayılmalıdır (60 bin sözcük).
https://play.google.com/store/apps/details?id=com.tahirhoca.osmanlicasozluk
81 Ayşegül ERGİŞİ & İ. Emre ŞAHİN
International Journal of Languages’ Education and Teaching
Volume 5, Issue 3, September 2017
Diğer kaynaklarımız ise İnternet’te bulduğumuz sözcük listeleridir. Bunlardan bazıları Mehmet
Kanar'ın Osmanlı rkçesi Sözlüğü, Hayrat Vakfı'nın listesi vd... Bu kaynaklardan Hayrat Vakfı'nın
listesindeki sözcükler harekeli yazıldığı için diğer liste ve kaynaklardan ayrılmaktadır. Bu durum
Arapça ve Farsça tamlamaların yazımıyla ilgili açığımızı belli ölçüde kapatmaktadır.
Ayrıca 10 binden fazla özel ismin yer aldığı bir liste de Dervaze'ye dahil edilmiştir. Belviranlı'dan
aldığımız yer isimleri ve bu özel isim listesiyle Osmanlıca metinlerin çevrimi için gerekli yazılışlar
elde edilmiştir.
Dervaze'de Osmanlıca sözcüklerin Arap alfabesiyle yazımı ve Latin harfleriyle karşılıkları yer almakla
birlikte sözcüklerin Ebced değerleri de yer almaktadır. Elektronik kaynak olması dolayısıyla
sözcüklerin farklı ilişkileri de zaman içerisinde eklenecektir. Başta imla kılavuzu olarak hazırlanan
Dervaze'nin Osmanlıcanın tüm söz varlığını barındıran bir sözlüğe doğru geliştirilmesi
planlanmaktadır. Özellikle çeviri aracımı etkinleştirdiğimiz zaman Osmanlıca sözcükler asıl
kaynaklardan taranacak ve bu sayede farklı yazımlar Dervaze'ye dahil edilmiş olacaktır.
Dervaze'yi kullanılabilir hale getirirken, planda olmayan bir arama algoritması da oluşturulmuştur.
Bu arama algoritmasının amacı kullanıcının yazılışını tam olarak bilmediği bir Osmanlıca kelimenin
karşılığını bulabilmesini sağlamaktır. Elektronik sözlüklerde arama stasları geniş tutulmadığı
takdirde kullanıcı sözlükteki bilgiye erişememektedir. Bu nedenle bir Osmanlıca sözlük arama
algoritması geliştirdik. Bu algoritma Türkçe bir kelime noktasız (uoi) gibi harflerle yazılsa veya
okunuşu yaklaşık olarak bilinen bir kelimenin Türkçeye yakın varyasyonları bulunsa dahi sözlüğün
sonuç vermesini sağlamaktadır.
3. Morfolojik Çeviri Aracı
Dervaze'nin Osmanlıca belgelerin okunmasına olanak sağlayacak bir çeviri aracının kaynağı
olduğunu belirtmiştik. "Osmanlıca Belgelerin Transkripsiyonu ve Tercümesi için Mobil ve Web
Uygulamalarının Geliştirilmesi” adlı TÜBİTAK projesi kapsamında Osmanlı Türkçesinden günümüz
Türkçesine ve günümüz Türkçesinden Osmanlı Türkçesine çeviri yapan bir araç geliştirmekteyiz.
Günümüz Türkçesi ve Osmanlıca arasında imla kuralları bakımından farklılıklar olduğu için
Osmanlıca bir metindeki sözcüklerin morfolojik analizini yapacak bir araca ihtiyaç duyulmaktadır.
3.1. Türkçe Morfolojik Analiz Aracı
1990'lı yıllardan beri Türkçenin morfolojisi ve bilgisayarda bunun çözümlenmesi konusunda
akademik çalışmalar mevcuttur. Ancak bu akademik çalışmalar daha çok dilbilimsel incelemeyi öne
almış ve Osmanlı Türkçesi ve Türkçenin arasında kurulması gereken bağların bazı gereklerine cevap
verememiştir. Halihazırdaki Türkçe morfolojik analiz araçlarından Çağrı Çöltekin'in
https://github.com/coltekin/TRmorph adresinde sunduğu TRMorph analiz aracı incelenmiş, Osmanlı
Türkçesi açısından gerekli olabilecek ve sık kullanılan izafe yapılarının olmadığı ve gereğinden fazla
karmaşık sayılabilecek bir sonuç ürettiği görülmüştür. Bu nedenle morfolojik analiz çalışmamız,
doğrudan Osmanlı Türkçesi ve Türkçenin birbirine çevrilmesi amacıyla sıfırdan yapılmıştır.
Bu çalışmamız esnasında, Türkçe bir morfolojik analiz aracının, 2 katmanlı standart yapılar yerine,
sadece hece analizi yapan ve bunları doğrudan birim kümelerine çeviren bir tekniğin kullanılmasının
82 IJLET 2017, Volume 5, Issue 3
International Journal of Languages’ Education and Teaching
Volume 5, Issue 3, September 2017
daha uygun olacağı anlaşılmıştır. Bu farklılık literatürde kullanılan iki katmanlı morfoloji yerine iki
farklı yüzey analizinin birbirine tercümesi yoluyla takip edilmiştir. Bu sayede Türkçe bir kelimenin
sözlük yardımıyla eklerine ayrılması ve bu eklerin Osmanlıcaya çevrilmesi mümkün olmuştur.
Örnek 1
Geliyorum kelimesinin harften harfe Osmanlıca çevrimi  şeklindedir ve bu çevrim yanlıştır.
Bu kelimeyi doğru şekilde çevirebilmek için gel + iyor + um şeklinde analiz edilmekte, bu ek ve
köklerin her biri farklı kurallarla çevrilmektedir. Buna göre "gel" kökü  şeklinde, "iyor" eki 
şeklinde, "um" eki de ile çevrilmekte ve bunlar birleştiğinde  doğru yazılışına
ulaşılmaktadır.
Örnek 2
Osmanlı Türkçesinde bol miktarda bulunan Arapça ve Farsça kökenli kelimelerin imlalarında genel
olarak orijinal dillerine sadık kalınır. Hocalarımızın kelimesinin harften harfe Osmanlıca çevrimi
 şeklindedir ve bu çevrim de yanlıştır. Bu kelimeyi doğru şekilde çevirmek için "hoca"
kelimesinin Farsça aslında  şeklinde yazıldığını bilmek gerekir. Aynı şekilde sondaki "-ın"
ekinin de Osmanlıca ile değil Nef veya Kef-i Türki adı verilen bir harfle yazıldığını bilmek
gerekir. Bundan dolayı bu kelimenin doğru çevrimini ancak sözlük, imla ve morfolojik analiz
bilgisinin ortak kullanıldığı bir yöntemle yapabiliriz. Kelimenin doğru yazılışı  
şeklindedir.
Morfolojik analizde kullandığımız yüzey formundan yüzey formuna çevrim yönteminin bir
dezavantajı, Türkçe ünlü uyumu kurallarının da ayrı ayrı belirlenmesi şartıdır. Osmanlı Türkçesinde
çoğu sesli harf yazılmadığından dolayı sesli uyumu farklı bir şekilde ifade edilmektedir. Örneğin
geldik kelimesinin sonundaki -dik eki  ile, kaldık kelimesinin sonundaki -dık eki ise  ile
yazılmaktadır. Buradaki farklılık ince k ve kalın k ile gösterilmektedir.
Bu gibi farklılıkları ifade etmek için Foma'da bulunan bayraklama mekanizmalarını kullandık. Türkçe
eklerin birçoğunda ünlü uyumu kökle belirlendiği için, kelime köklerinin son ünlüsü, eklerin ne
şekilde yazılacağını da belirlemektedir. Ancak bazı durumlarda, örneğin Şimdiki Zaman (-yor) ekinde
ünlü uyumu yoktur ve bu ekin aldığı diğer ekler de bu eke uyar. Örneğin "geldiler" kelimesinin
sonundaki "ler" ve "geliyorlar" kelimesinin sonundaki "lar" aynı köke ait olmakla beraber, biri ince
diğeri kalındır.
Standart morfolojik analiz ünlü uyumu kurallarını yüzey farklılığı saydığı için bunları aynı harfle
göstermeyi tercih eder. Bizim gayemiz Osmanlıcanın yüzey formunu doğru olarak göstermek olduğu
için ünlü uyumunun doğru çevrilmesi konusunda da çalışmalar yaptık.
Türkçe morfolojik analiz aracı, derlediğimiz 60.000 çekimli Türkçe kelimenin bulunduğu veri
kümesinde bulunan kelimelerin %87'sini doğru çevirebilmektedir. Bu oran, gerek kelime listesindeki
hatalardan gerekse ba istisnai kuralların eklenmemiş olmasından dolayı bu seviyededir ancak bir
yıldan az Osmanlıca eğitimi almış bir öğrenciden yine de daha yüksektedir.
83 Ayşegül ERGİŞİ & İ. Emre ŞAHİN
International Journal of Languages’ Education and Teaching
Volume 5, Issue 3, September 2017
3.2. Osmanlıca Analiz Aracı
Öncelikle bu konuda yapılmış herhangi bir akademik çalışmaya ulaşamadığımızı belirtmek gerekir.
Osmanlı Türkçesinin tüm zenginliğine ve yapılmış edebi çalışmaların çokluğuna karşın, formel bir
dilbilgisi çalışması mevcut değildir. Bu nedenle normal şartlar altında akademik bir çalışma olarak
yapılması gereken çalışmamız, bu konuda önemli bir adım teşkil etmektedir.
Osmanlı Türkçesini öğretme amacını güden kitapların pek çoğunda bile Arapça, Türkçe ve Farsça
unsurların farklı yapıları dikkate alınmamış ve bunların arasındaki dilbilimsel farklılıklar açıkça izah
edilmemiştir. Morfolojik analizin amacı, Türkçe dilbilgisindeki zengin ek yapsıortaya çıkarmaktır.
Örnek vermek gerekirse Osmanlı Türkçesi de, aynen Türkçede olduğu gibi çoğul ekini kelimelere -ler
ekini getirerek yapmaktadır, ancak bunun yanında Arapça ve Farsça unsurların kendi kuralları içinde
çoğullaştırıldıkları ve bu dillerde çoğul olarak kullanılan kelimelerin Osmanlıcada aynen kullanıldığı
görülmektedir. Bu nedenle doğrudan bir harf çevrimi yapmak birçok açıdan Osmanlıca kurallarına
aykırı sonuçlar doğurur.
Yaptığımız çalışmalarda Osmanlı Türkçesinin ilk morfolojik analiz ve bilişimsel dilbilim aracını ortaya
koyduğumuzu düşünüyoruz. Daha önce yapılmış bir çeviri aracının bilgisine eriştiysek de, ilgili
yüksek lisans tez çalışmasında herhangi bir testten veya morfolojik analizden bahsedilmediği için,
doğrudan hece tercümesine veya düzenli ifadelere (regular expression) dayalı basit bir çevrime
dayandığı izlenimini edindik. Osmanlıca Morfololojik analiz aracımız, temelde Osmanlıcadan
Türkçeye tercüme gayesi güttüğü için, üç noktada dikkatle çalıştık:
Bunların birincisi birden fazla ek alan ve bazıları Osmanlıcada düzensiz yazılan ifadelerin
durumudur. Örnek vermek gerekirse, iyelik eki -in bazı durumlarda sadece , bazı durumlarda 
şeklinde yazılmaktadır. Morfolojik analiz aracının bu iki durumu da kapsaması gerekmektedir ki her
iki yazılışı da doğru olarak çevirebilsin.
İkinci önemli konu alternatif imlalar konusudur. Bazı Arapça ve Farsça kelimeler ve Türkçe
kelimelerin önemli bir bölümü kişiden kişiye farklı şekillerde yazılabilmektedir. Okunuşu bilen bir
insanın okumakta zorluk çekmediği bu imlalar bilgisayara aktarılması gereken formel bir yapı
içerisinde zorluklar oluşturmaktadır. Örneğin zahir kelimesi genellikle  şeklinde yazılmakla
beraber, Arapça aslına uygun olmayan  şeklinde de yazıldığı görülmüştür. Bu gibi
varyasyonların bir kısmı da eklerdedir. Türkçe eklerin arasında kurallı bir kaynaştırma harf sistemi
yoktur. Bu nedenle sistemin hem kaynaştırma harfi varmış gibi, hem de yokmuş gibi ekleri incelemesi
gerekmektedir.
Üçüncü ve en önemli konu ise ünlü uyumu konusudur. Osmanlıca eklerin pek çoğu ünlü
bulundurmadığı ve sadece ünsüz harfleri yazdığı için Türkçe ünlülerin yazılması köklerden başlayan
bir sınırlamanın eklere kadar taşınmasını gerektirir .  şeklinde yazılan "geldi" ve  şeklinde
yazılan "kaldı" kelimelerinin ek kısımlarının her ikisi de  ile yazılmaktadır. Ancak Türkçeye
çevrimde bu eklerin farklı şekilde yazılması gerekmektedir. Hangi şekilde yazılacağını ise köke
bakarak karar verebiliriz.
Bununla beraber buradaki basitliği ve ünlü uyumununu her zaman taşımayan çeşitli durumlar da
mevcuttur. Bunların başında şimdiki zaman eki -yor gelir. Bu, Osmanlı Türkçesinde  şekilinde
84 IJLET 2017, Volume 5, Issue 3
International Journal of Languages’ Education and Teaching
Volume 5, Issue 3, September 2017
yazılır ve geliyor, üzüyor ve çalışıyor gibi tüm durumlarda "yor" şeklinde okunur. Dili bilen bir insan
için sorun olmayan bu gibi istisnai durumlar, formel analizde, çok ayrıntılı kuralların yazılmasını
gerektirmiştir. Burada ayrıca zaman içinde Türkçenin geçirdiği değişikliği her zaman formel olarak
anlatmanın imkansızlığı göz önüne alınmalıdır.
Osmanlıca analiz aracı şu aşamalarda çalışmaktadır:
Diagram.
Osmanlıca Kelime -> İstisna Listesinde Var mı -> Morfolojik Analiz Sonuçları -> En Yaygın Kullanım -
> Sonuç Listesi
Bu morfolojik analiz sonuçları kelime köklerinin bir listede yer almasını gerektirmektedir. Bunun için
bu projeden daha önce derlemeye başladığımız imla kılavuzunu kullandık. Yaklaşık 80 bin kelime
kökü barındıran yazım kılavuzunda bu köklerin isim mi, fiil mi olduğuna göre farklı şekillerde
çözümlemelere ulaşmaktayız. Morfolojik analiz aracını elimizde bulunan 60.000 çekimli kelimelik
listede denediğimizde %83 oranında doğru çözümleme ve çeviri yaptığını gördük. Bu oran 1 yıl
Osmanlıca eğitimi almış çoğu insanın okuyabildiğinden fazladır.
4. Sonuç
Bilgisayarın depolama, sıralama ve çoğaltma becerileri sayesinde dilbilim ve sözlük çalışmaları farklı
bir boyut kazanmıştır. “dervaze.com” adresinden ulaşılabilen Dervaze adlı imla kılavuzu Osmanlıca
bir metnin çeviri aracı yoluyla okunmasını sağlayan Osmanlıca elektronik bir kaynaktır. Bu kaynak
geliştirdiğimiz web ve mobil uygulamalarında Osmanlıca metinlerin günümüz harflerine
aktarılmasında önemli bir rol oynamaktadır ve kılavuzun daha da zenginleştirilmesi
düşünülmektedir. Ayrıca Osmanlıca metinlerin çevrilmesi için oluşturulan morfolojik çeviri aracı
sayesinde eski metinlerin günümüz harflerine aktarılması kolaylaşacaktır. Osmanlıca elektronik
araçlar üreterek bilim ve kültür dünyamıza katkıda bulunacağımızı düşünmekteyiz.
Kaynakça
Belviranlı, A. K. (1978). Osmanlıca İmlâ Lügati, NedveYayınları.
Kanar, M. (2010). Osmanlıca Yazım Kılavuzu, Say Yayınları.
Redhouse, J. (1856). An English and Turkish Dictionary, London.
http://www.tdk.gov.tr/index.php?option=com_bilimsanat&arama=kelime&guid=TDK.GTS.596144c6f1
3e43.37291384 (Erişim tarihi: 08.07.2017)
http://dervaze.com/ (Erişim tarihi: 08.07.2017)
... There are currently two other projects that focus on the automated transcription of Ottoman Turkish [Korkut 2019;Ergişi et al., 2017]. Both are similar in methodology and scope, employing morphological analysis and lexicon-based approaches to romanize OT script. ...
Preprint
Our study utilizes deep learning methods for the automated transcription of late nineteenth- and early twentieth-century periodicals written in Arabic script Ottoman Turkish (OT) using the Transkribus platform. We discuss the historical situation of OT text collections and how they were excluded for the most part from the late twentieth century corpora digitization that took place in many Latin script languages. This exclusion has two basic reasons: the technical challenges of OCR for Arabic script languages, and the rapid abandonment of that very script in the Turkish historical context. In the specific case of OT, opening periodical collections to digital tools require training HTR models to generate transcriptions in the Latin writing system of contemporary readers of Turkish, and not, as some may expect, in right-to-left Arabic script text. In the paper we discuss the challenges of training such models where one-to-one correspondence between the writing systems do not exist, and we report results based on our HTR experiments with two OT periodicals from the early twentieth century. Finally, we reflect on potential domain bias of HTR models in historical languages exhibiting spatio-temporal variance as well as the significance of working between writing systems for language communities that have experienced language reform and script change.
... There are currently two other projects that focus on the automated transcription of Ottoman Turkish [Korkut 2019;Ergişi et al., 2017]. Both are similar in methodology and scope, employing morphological analysis and lexicon-based approaches to romanize OT script. ...
Preprint
A pre-print of our paper can be found at https://arxiv.org/abs/2011.01139 Our study utilizes deep learning methods for the automated transcription of late nineteenth- and early twentieth-century periodicals written in Arabic script Ottoman Turkish (OT) using the Transkribus platform. We discuss the historical situation of OT text collections and how they were excluded for the most part from the late twentieth century corpora digitization that took place in many Latin script languages. This exclusion has two basic reasons: the technical challenges of OCR for Arabic script languages, and the rapid abandonment of that very script in the Turkish historical context. In the specific case of OT, opening periodical collections to digital tools require training HTR models to generate transcriptions in the Latin writing system of contemporary readers of Turkish, and not, as some may expect, in right-to-left Arabic script text. In the paper we discuss the challenges of training such models where one-to-one correspondence between the writing systems do not exist, and we report results based on our HTR experiments with two OT periodicals from the early twentieth century. Finally, we reflect on potential domain bias of HTR models in historical languages exhibiting spatio-temporal variance as well as the significance of working between writing systems for language communities that have experienced language reform and script change.
Osmanlıca İmlâ Lügati
  • A K Belviranlı
Belviranlı, A. K. (1978). Osmanlıca İmlâ Lügati, NedveYayınları.
Osmanlıca Yazım Kılavuzu, Say Yayınları
  • M Kanar
Kanar, M. (2010). Osmanlıca Yazım Kılavuzu, Say Yayınları.