Content uploaded by Olcay Taner Yildiz
Author content
All content in this area was uploaded by Olcay Taner Yildiz on May 01, 2019
Content may be subject to copyright.
Türkçe Do˘
gal Dil ˙
I¸sleme için Arayüzler
User Interfaces for Turkish Natural Language
Processing
Gökçe Uludo˘gan1, Rıza Özçelik1, Selen Parlar1, 2, Gökhan Ercan3, Olcay Taner Yıldız3
1Bo˘
gaziçi Üniversitesi Bilgisayar Mühendisli˘
gi Bölümü, ˙
Istanbul, Türkiye
2Starlang Yazılım Danı¸smanlık, ˙
Istanbul, Türkiye
3I¸sık Üniversitesi Bilgisayar Mühendisli˘
gi Bölümü, ˙
Istanbul, Türkiye
{gokce.uludogan, riza.ozcelik, selen.parlar}@boun.edu.tr, gokhan.ercan@isik.edu.tr, olcaytaner@isikun.edu.tr
Özetçe—Türkçe do˘
gal dil i¸sleme alanında var olan çalı¸smalar-
dan en bilinen iki tanesi Zemberek ve ˙
ITÜ Do˘
gal Dil ˙
I¸sleme
Yazılım Zinciri’dir. Bu çalı¸smalardan Zemberek açık kaynak
kodlu olup çe¸sitli do˘
gal dil i¸sleme bile¸senlerinden olu¸san bir
yazılım kütüphanesidir. ˙
ITÜ Do˘
gal Dil ˙
I¸sleme Yazılım Zinciri ise,
çevrimiçi bir kullanıcı arayüzü sunmasına ra˘
gmen, açık kaynak
kodlu de˘
gildir. Bu çalı¸smada, yine bir Türkçe do˘
gal dil i¸sleme
aracı olan Türkçe Nlptoolkit için bir çevrimiçi arayüz sunuyoruz.
Bu arayüz sayesinde, Nlptoolkit’teki yazım denetleyici, Türkçe
karakter dönü¸stürücü, birimlendirici, cümle bölücü, biçimbir-
imsel çözümleyici ve belirsizlik giderici bile¸senlerini çevrimiçi
olarak kullanmak mümkündür.
Anahtar Kelimeler—Biçimbilimsel Çözümleme, Biçimbilimsel
Belirsizlik Giderme, Yazım Denetimi
Abstract—Among the most popular works in Turkish natural
language processing there are Zemberek and ITU Turkish
Natural Language Processing Pipeline. The former is an open
source software library that consists of various natural language
processing components whereas the latter provides an online user
interface, yet not open source. In this study, we present an online
user interface for Turkish Nlptoolkit, which is another Turkish
natural language processing tool. Thanks to this interface, it is
possible to use asciifier, deasciifier, tokenizer, sentence splitter,
morphological analyzer/disambiguator components of Nlptoolkit
online.
Keywords—Morphological Analysis, Morphological Disam-
biguation, Spell Checker
I. G˙
IR˙
I ¸S
Do˘
gal Dil ˙
I¸sleme (DD˙
I), genel tanımıyla, hesaplamalı yön-
temler kullanarak do˘
gal dilde olu¸sturulan bir metin veya
konu¸smadan anlam çıkarmayı ya da konu¸sma veya metin sen-
tezlemeyi hedefleyen bir yapay zeka koludur. Metin ve konu¸s-
maların do˘
gal dil ile üretiliyor olması, DD˙
I çalı¸smalarının
sadece çalı¸sılan dil üzerinde geçerli birçok özelli˘
ge sahip ol-
masına neden olabilmektedir. Bu nedenle, bir konu¸sma dilinde
DD˙
I alanında yapılan bir çalı¸sma, ba¸ska bir dile do˘
grudan
aktarılamayabilir. Bu da, dil özelinde yapılan çalı¸smaları daha
önemli kılmaktadır.
DD˙
I alanında, birçok açık kaynak kodlu çalı¸sma mev-
cuttur. Bu çalı¸smalar, spaCy [1], NLTK [2] veya Stanford
CoreNLP [3] gibi programlama arayüzü sunan biçimlerde
olabilece˘
gi gibi, Princeton WordNet [4] örne ˘
ginde oldu˘
gu gibi
kullanıcı arayüzü de sunabilmektedir. Ancak, DD˙
I alanındaki
pekçok çalı¸sma ˙
Ingilizce alanında yapıldı˘
gı için, bu çalı¸s-
maların sonuçlarının veya çalı¸smalarda ortaya çıkan araçların
Türkçe’ye do˘
grudan aktarılması mümkün olmamaktadır. Bu da
Türkçe DD˙
I çalı¸smaları için bir te¸svik olu¸sturmu¸s; Zemberek
ve ˙
ITÜ Türkçe DD˙
I Yazılım Zinciri gibi çalı¸smalara zemin
hazırlamı¸stır. Bu çalı¸smalardan Zemberek, açık kaynak kodlu,
Java dilinde yazılmı¸s DD˙
I bile¸senlerinden olu¸san bir yazılım
kütüphanesidir ve bir kullanıcı arayüzü sunmamaktadır. Zem-
berek’in aksine, ˙
ITÜ Türkçe DD˙
I Yazılım Zinciri, var olan
araçlara çevrimiçi eri¸sime olanak sa˘
glayan, ancak kapalı kodlu
bir sistemdir.
Biz de bu çalı¸smada, Türkçe DD˙
I alanında, açık kay-
nak kodlu bir araç derlemesi olan Türkçe Nlptoolkit için
geli¸stirdi˘
gimiz arayüzü sunuyoruz [5]. Böylelikle, ¸su ana kadar
Türkçe için geli¸stirilmi¸s olan DD˙
I araçlarının aksine, hem açık
kaynak kodlu, hem de çevrimiçi arayüze sahip olan bir Türkçe
DD˙
I paketini kullanıma açmı¸s oluyoruz.
Ortaya koydu˘
gumuz bu arayüz, Türkçe Nlptoolkit’in birçok
bile¸senine teknik nedenlerden dolayı kısıtlı da olsa, çevrim-
içi eri¸sim sa˘
glamaktadır. Bu bile¸senleri, Türkçe karakter
dönü¸stürücü (asciifier/deasciıfier) [6], birimlendirici/cümle
bölücü (tokenizer/sentence splitter) [7], yazım denetleyici
(spell checker) [8] ve biçimbilimsel çözümleyici/belirsizlik
giderici (morphological analyzer/disambiguator) [9], [10]
olarak sıralayabiliriz. Bu bile¸senlerden, Türkçe karakter
dönü¸stürücü, birimlendirici/cümle bölücü ve yazım denetleyici
10000 karakter uzunlu˘
gundaki girdilere kadar desteklese de
biçimbilimsel çözümleyici/belirsizlik giderici 1000 karaktere
kadar uzunluktaki girdilere kadar cevap vermektedir.
Bu makale ¸söyle düzenlenmi¸stir: II. kısımda, ¸su ana kadar
geli¸stirilen DD˙
I araçları hakkında bilgi verilmi¸stir. III. kısımda
arayüz tarafından desteklenen bile¸senler hakkında detaylar ver-
ilirken; IV. kısımda ise, sundu˘
gumuz arayüz, çe¸sitli yönleriyle
ele alınmı¸s ve kullanım örnekleri sunulmu¸stur. Son tahlilde, V.
kısımda, çalı¸smamız özetlenmi¸s ve yapılabilecek iyile¸stirmeler
tartı¸sılmı¸stır.978-1-5090-6494-6/17/$31.00 ~ c
~2017 IEEE
II. L˙
ITERATÜR ÖZET˙
I
Do˘
gal dil i¸sleme alanında çok sayıda araç ve arayüz geli¸stir-
ilmi¸stir. Stanford CoreNLP [3], NLTK [2], Apache OpenNLP
[11], spaCy [1] birçok dili destekleyen açık kaynaklı ve
popüler araçlardandır. Türkçeye özgü olan araçlar ise Zem-
berek [12] ve ITU Türkçe Do˘
gal Dil ˙
I¸sleme Yazılım Zinciridir
(ITU Turkish NLP Pipeline) [13].
Zemberek açık kaynaklı bir kütüphane olup ¸su temel
i¸slevleri sa˘
glamaktadır: yazım denetleyici (spell checker),
biçimbilimsel çözümleyici (morphological analyzer), Türkçe
karakter dönü¸stürücü (asciifier/deasciifier), birimlendirici (to-
kenizer). Zemberek’in bir kullanıcı arayüzü bulunmamaktadır.
Dolayısıyla hitap etti˘
gi kullanıcı kitlesi yazılım geli¸stiriciler-
den olu¸smaktadır.
ITU Türkçe Do˘
gal Dil ˙
I¸sleme Yazılım Zinciri,
Türkçe karakter dönü¸stürücü (asciifier/deasciifier),
birimlendirici/cümle bölücü (tokenizer/sentence splitter),
yazım denetleyici (spell checker), biçimbilimsel
çözümleyici/belirsizlik giderici (morphological
analyzer/disambiguator), varlık ismi tanıma (named entity
recognizer) ve ba˘
gımlılık çözümlemesi (dependency parser)
gibi araçlardan olu¸san bir platformdur. Bu platform, hem bir
web arayüzüne hem de bir uygulama programlama arayüzüne
(API) sahiptir. Böylece farklı seviyelerdeki kullanıcılar bu
platformdan faydalanabilir. Fakat bu platform açık kaynaklı
de˘
gildir, dolayısıyla bu araçları de˘
gi¸stirme ve geli¸stirme
imkanı tanımamaktadır.
Sundu˘
gumuz Nlptoolkit, hem açık kaynaklı olup hem de
çevrimiçi bir kullanıcı arayüzüne sahiptir, böylece bir yandan
geli¸stiricilere bu araçları geli¸stirme ya da kendi projelerinde
kullanma imkanı verirken öte yandan arayüzü ile yazılım alt
yapısı olmayan kullancıların bu araçlardan faydalanmasına
imkan tanımaktadır.
III. ARAÇLAR
Nlptoolkit’te var olan araçlar ¸sunlardır: Türkçe karakter
dönü¸stürücü (asciifier/deasciifier), birimlendirici/cümle bölücü
(tokenizer/sentence splitter), yazım denetleyici (spell checker)
ve biçimbilimsel çözümleyici/belirsizlik giderici (morpholog-
ical analyzer/disambiguator). Bu bölümde bu araçların i¸sley-
i¸sinden bahsedilecektir.
A. Türkçe Karakter Dönü¸stürücü
Nlptoolkit’in bu bile¸seni, Türkçe karakterler içeren metinleri
Türkçe karakterlerden arındırmak veya Türkçe karakterlerden
arındırılmı¸s bir metnin Türkçe karakterlerini geri kazandırmak
için kullanılabilir. Bu araç, bir metni Türkçe karakterler-
den arındırmak için oldukça basit bir yol takip etmektedir
ve her bir Türkçe karakteri kar¸sılık gelen Latince haline
dönü¸stürmektedir. Örne˘
gin, Ç harfleri C’ye çevrilirken, ı harfi
i harfine çevrilmektedir.
Bir metne Türkçe karakterleri geri kazandırmak için ise
araç iki farklı yöntem içermektedir. Bu yöntemlerin ilki basit
geri dönü¸stürücüdür (simple deasciifier). Bu yöntem, bir keli-
menin var olabilecek bütün Türkçe karakter kar¸sılıklarını olu¸s-
turmakta ve bu seçeneklerden biçimbirimsel olarak çözüm-
lenebilen bir tanesini rassal olarak seçip sonuç olarak sun-
maktadır. Örne˘
gin, cocuk girdisi için, basit geri dönü¸stürücü
cocuk,çocuk,coçuk ve çoçuk seçeneklerini yaratacak ve
sadece çocuk biçimbirimsel olarak çözümlenebilece˘
gi için
çocuk kelimesini çıktı olarak verecektir. Di ˘
ger yöntem ise n-
karakter geri dönü¸stürücüdür (ngram deasciifier). Bu yöntemde
ise, yine her bir kelime için ilk yöntemdeki gibi bir aday
listesi olu¸sturulur ve ardından her bir kelimenin Türkçe’deki
n-karakter olasılıkları hesaplanarak en muhtemel aday çıktı
olarak verilir.
B. Birimlendirici/Cümle Bölücü
Nlptoolkit’in birimlendirici/cümle bölücü bile¸seni, bir
serbest metnin birimlerini ve/veya cümlelerini saptamak için
kullanılabilir. Bu bile¸sen, kural tabanlı bir bile¸sen olup girdiyi
önceden belirlenmi¸s bir kural kümesini takip ederek cümlelere
ve birimlerine ayırır. Bu kural kümesi, bir sonraki karak-
terin küçük/büyük harf olması gibi cümle düzeyinde kural-
lar içerdi˘
gi gibi, bir girdinin Türkçe’deki yaygın kısaltmalar
arasında olup olmadı˘
gını kontrol etmek gibi dil düzeyinde
kurallar da içerir1. Özetle, birimlendirici/cümle bölücü bile¸seni
bir girdi olarak serbest metin alır ve çıktı olarak birimlerine
ayrılmı¸s bir cümle kümesi verir.
C. Yazım Denetleyici
Yazım denetleyici, verilen metindeki yazım hatalarını bulup
düzelten Nlptoolkit bile¸senidir. Her kelime için hatayı tespit
edip olası do˘
gru adaylar arasından seçim yapar. Bu bile¸sen
iki farklı yazım denetleyici içermektedir. Bunlar basit yazım
denetleyici (simple spell checker) ve n-karakter yazım denet-
leyicidir (ngram spell checker).
Basit yazım denetleyici, basit geri dönü¸stürücü ile benzer
bir yöntem kullanır. Girdideki her kelime için her karakter
gezilip bu karakter olası bütün karakterlerle de˘
gi¸stirilerek
mümkün olabilecek bütün kelimeler olu¸sturulur ve bunlardan
biçimbilimsel olarak çözümlemenebilenlerden bir tanesi rassal
olarak seçilir.
N-karakter yazım denetleyici, benzer ¸sekilde n-karakter
geri dönü¸stürücü ile aynı mantı˘
gı kullanmaktadır. Önce, basit
yazım denetleyicide oldu˘
gu gibi kelimeler için aday listeleri
hazırlanır. Daha sonra ise n-karakter modelinden bu adaylar
için olasılıklar hesaplanarak, her kelime için olasılı˘
gı en yük-
sek olan aday çıktı olarak verilir.
D. Biçimbilimsel Çözümleyici/Belirsizlik Giderici
Biçimbilimsel çözümleyici/belirsizlik giderici bile¸seni, önce
verilen girdinin çözümlemesini yapmakta, sonrasında ise bu
çözümlemedeki belirsizlikleri gidermektedir. Örne˘
gin, Yarın
doktora gidecekler. cümlesinde biçimbilimsel çözümleyici her
kelime için farklı çözümlemeler bulur. Yarın için olası iki
çözümlemeye kar¸sılık gelen anlamlar, ertesi gün ve ikinci ya
da üçüncü tekil ki¸sinin yarısı ¸seklinde olabilir. Biçimbilimsel
belirsizlik giderici, bu belirsizli˘
gi ortadan kaldırarak Yarın için
ertesi gün anlamına gelen çözümlemeyi çıktı olarak verir.
1Bütün kuralları görmek için [7] ziyaret edilebilir.
Biçimbilimsel çözümleyici, Türkçe dil kurallarından olu¸san
bir sonlu durum makinesi kullanarak verilen metini çözümler.
Girdi için olabilecek belirsizlikler dü¸sünülmeden olası bütün
çözümlemeler verilir.
Biçimbilimsel belirsizlik giderici, girdi olarak çözümleme
listesi alır ve belirsizli˘
gi gidererek sadece do˘
gru çözüm-
lemeleri verir. Bu bile¸sen, n-karakter modeller kullanmak-
tadır. Kelimeler ve çözümlemeleri için iki ayrı modelden
faydalanmaktadır. Öncelikle, her çözümleme için kelime ve
çözümlemesinin n-karakter olasılıkları hesaplanarak en iyi kök
kelime seçilir. Sonrasında, çözümlemeler bu kökü içerenlere
indirgenir. Son olarak da kalan bu çözümlemelerden n-karakter
modeline göre en olası olanlar bulunur ve üstlerde yer alacak
¸sekilde çıktı olarak verilir.
IV. ARAYÜZ
Nlptoolkit’in arayüzü temel olarak dört parçadan
olu¸smaktadır. Bu arayüzleri Türkçe karakter dönü¸stürücü
(asciifier/deasciifier), birimlendirici/cümle bölücü
(tokenizer/sentence splitter), yazım denetleyici (spell
checker) ve biçimbilimsel çözümleyici/belirsizlik giderici
(morphological analyzer/disambiguator) olarak sıralayabiliriz.
Her bir arayüzün i¸slevi ve kullanımı a¸sa ˘
gıda bölümler halinde
anlatılmaktadır.
A. Türkçe Karakter Dönü¸stürücü
Nlptoolkit arayüzünün bu bile¸seni, Türkçe karakterler içeren
metinlerdeki Türkçe karakterlerden arındırmak veya Türkçe
karakterlerden arındırılmı¸s bir metnin Türkçe karakterlerini
geri kazandırmak için kullanılabilir. Bir metni Türkçe karak-
terlerden arındırmak için, sol taraftaki girdi alanına metin
girilip Asciify butonuna basılabilir. Bu metni girdi olarak
alan Nlptoolkit, metni önce birimlerine ayıracak ve daha
sonrasında Türkçe karakterlerden arındırılmı¸s halini sa˘
gdaki
alanda gösterecektir. Tersi i¸slemi yapmak için ise, metin
sa˘
gdaki alana girilip alttaki seçiciden Simple veya NGram
seçildikten sonra Deasciify butonuna basılabilir. ˙
Ilk i¸slemde
oldu˘
gu gibi, Nlptoolkit girdiyi öncelikle birimlerine ayıracak
ve ardından metnin Türkçe karakterlerini yerine koyacaktır.
Her iki i¸slemin sonunda da, elde edilen kelime dönü¸sümleri
Download Mappings butonuna basarak indirilebilir. Bu arayüz
¸Sekil 1’de görülebilir. Dikkat edilmelidir ki, bu dönü¸süm için
girilebilecek girdi uzunlu˘
gu 10000 karakter ile sınırlıdır. Daha
uzun bir girdi girilmesi halinde, 10000. karakterden sonraki
kısımlar yoksayılacaktır.
B. Birimlendirici/Cümle Bölücü
Arayüzün birimlendirici/cümle bölücü bile¸seni, bir serbest
metnin birimlerini ve/veya cümlelerini saptamak için kullanıla-
bilir. Türkçe karakter dönü¸stürücüye benzer olarak, birim-
lerine ve/veya cümlelerine ayırılacak metin soldaki alandan
girdi olarak verilebilir. Split/Tokenize butonuna basıldı˘
gında,
Nlptoolkit metni birimlerine ve cümlerine ayıracak ve sa˘
g-
daki ekranda gösterecektir. Elde edilen sonuçlar, birimlerin
bo¸slukla, cümlelerin ise ayrı ayrı satırlarda gösterildi˘
gi bir
biçimde sa˘
gdaki ekrandan kopyalanabilir. Önceki bile¸sene
¸Sekil 1: Türkçe Karakter Dönü¸stürücü
¸Sekil 2: Birimlendirici/Cümle Bölücü
benzer ¸sekilde, bu i¸slemler girdinin 10000. karakterine kadar
uygulanacak, girdinin geri kalanı ihmal edilecektir. Bahsedilen
arayüz ¸Sekil 2’de incelenebilir.
C. Yazım Denetleyici
Yazım denetleyici arayüzü bir metindeki yanlı¸s yazılmı¸s
kelimelerin ve karakterlerin tespiti ve kar¸sılık gelen do˘
gru
yazımları bulmak için faydalanılabilecek bir arayüzdür. Nlp-
toolkit’in bu bile¸seni, NGram ve Simple olmak üzere iki
farklı ¸sekilde tespit yapabilmektedir ve istenen seçenek arayüz-
den seçilebilir. Daha önceden anlatılan bile¸senlere benzer
olarak, seçim yapıldıktan sonra, girdi önce birim/cümle ayırıcı
kullanılarak birimlerine ve cümlelerine ayırılacak ve yazım
denetleyici çalı¸stırıldıktan sonra sonuçlar sa˘
gdaki alanda gös-
terilecetir. Sonuçlar, Download Results butonuna basılarak
indirileblir. ˙
Indirilen sonuçlarda, her yanlı¸s yazılan birim
Levenshtein uzaklık yardımıyla do˘
gru biçimiyle hizalanmı¸s
¸sekildedir. Tıpkı önceki bile¸senlerde oldu˘
gu gibi, bu arayüzde
de karakter sayısı 10000 ile sınırlandırılmı¸stır. Bu bile¸sen de
¸Sekil 3’te görülebilir.
D. Biçimbilimsel Çözümleyici/Belirsizlik Giderici
Biçimbilimsel çözümleyici ve belirsizlik giderici, bir
girdideki birimlerin eklerin ve köklerinin bulunması ve
olası sonuçlar arasından do˘
grusunun seçilmesinden sorumlu
bile¸sendir. Bu bile¸sende, üst tarafta bulunan girdi alanına
yazılan cümleler, Analyze/Disambiguate butonuna basıldı˘
gında
çözümlenecek ve a¸sa˘
gıdaki tabloda gösterilecektir. Çözüm-
leme sonucunda do˘
gru oldu˘
gu tespit edilen çözümlemeler bu
¸Sekil 3: Yazım Denetleyici
¸Sekil 4: Biçimbilimsel Çözümleyici/Belirsizlik Giderici
tabloda en üstte yer almaktadır ve yanlarına do˘
gru olduk-
larını belirtecek bir imge konmu¸stur. Bu tablo da, Download
Results butonu ile biçimli bir ¸sekilde indirilip i¸slenebilir.
Di˘
ger bile¸senlerin aksine, bu arayüzde girdi 1000 karakter ile
sınırlandırılmı¸stır. Bu arayüz de ¸Sekil 4’de incelenebilir.
V. SONUÇ
Bu çalı¸smada, ¸su ana kadar geli¸stirilmi¸s olan Türkçe DD˙
I
araçlarına açık kaynak kodlu ve çevrimiçi arayüze sahip
bir yazılım paketi ekledik. Sundu˘
gumuz bu arayüz, belirli
TE¸SEKKÜRLER
Bu çalı¸sma Tübitak 116E104 nolu proje tarafından destek-
lenmi¸stir.
kısıtlarla, bir tarayıcı üzerinden Türkçe karakter dönü¸stürücü,
birimlendirici/cümle bölücü ve yazım denetleyici ve biçim-
bilimsel çözümleyici/belirsizlik giderici bile¸senlerini kullan-
maya olanak sa˘
glamakta ve i¸slemin sonucunu bir bilgisayar
programı tarafından i¸slenebilecek bir biçimde sunmaktadır.
Bu arayüzü geli¸stirmek adına, arayüz hali hazırda yapılmı¸s
olan di˘
ger araçlarla da uyumlu çalı¸sacak bir yapıya sokulabilir.
Bu ¸sekilde, bütün Türkçe DD˙
I yazılımları tek bir çatıda
toplanacak ve kolaylıkla eri¸silebilecektir.
Sundu˘
gumuz bu yazılıma katkı sa˘
glamak için atılabile-
cek bir ba¸ska adım ise, var olan bile¸senlerin performan-
sını iyile¸stirmektir. Her yapay zeka yazılım gibi Nlptoolkit
de mükemmel de˘
gildir ve açık kaynak kodlu olmasının da
yardımıyla, Türkçe DD˙
I geli¸stiricilerinin katkılarıyla daha iyi
çalı¸sacak hale getirilebilir.
KAYNAKLAR
[1] M. Honnibal and I. Montani, “spacy 2: Natural language understanding
with bloom embeddings, convolutional neural networks and incremental
parsing,” To appear, 2017.
[2] S. Bird, E. Klein, and E. Loper, Natural language processing with
Python: analyzing text with the natural language toolkit. " O’Reilly
Media, Inc.", 2009.
[3] C. Manning, M. Surdeanu, J. Bauer, J. Finkel, S. Bethard, and D. Mc-
Closky, “The stanford corenlp natural language processing toolkit,” in
Proceedings of 52nd annual meeting of the association for computa-
tional linguistics: system demonstrations, 2014, pp. 55–60.
[4] G. A. Miller, R. Beckwith, C. Fellbaum, D. Gross, and K. J. Miller,
“Introduction to wordnet: An on-line lexical database,” International
journal of lexicography, vol. 3, no. 4, pp. 235–244, 1990.
[5] “Nlptoolkit,” http://haydut.isikun.edu.tr/nlptoolkit.ui-1.0/, accessed:
2019-02-08.
[6] “Türkçe karakter dönü¸stürücü,” https://github.com/olcaytaner/
Deasciifier, accessed: 2019-02-07.
[7] “Birimlendirici/cümle bölücü,” https://github.com/olcaytaner/Corpus,
accessed: 2019-02-07.
[8] “Yazım denetleyici,” https://github.com/olcaytaner/SpellChecker, ac-
cessed: 2019-02-07.
[9] “Biçimbirimsel çözümleyici,” https://github.com/olcaytaner/
MorphologicalAnalysis, accessed: 2019-02-07.
[10] “Biçimbirimsel belirsizlik giderici,” https://github.com/olcaytaner/
MorphologicalDisambiguation, accessed: 2019-02-07.
[11] “opennlp,” https://github.com/apache/opennlp, accessed: 2019-02-06.
[12] “Zemberek,” https://github.com/ahmetaa/zemberek-nlp, accessed: 2019-
02-06.
[13] G. Eryi˘
git, “ITU Turkish NLP web service,” in Proceedings of the
Demonstrations at the 14th Conference of the European Chapter of
the Association for Computational Linguistics (EACL). Gothenburg,
Sweden: Association for Computational Linguistics, April 2014.