Conference PaperPDF Available

Türkiye'de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme

Authors:

Abstract

Bu çalışma, Türkiye’de son 15 yılda mimarlıkta bilişim alanında yapılan bilimsel çalışmalara, içerik analizini ve yapay öğrenmeyi bir arada ele alan bir çerçeveden tekrar bakmaktadır. İçerik analizi yöntemi ile bilimsel çalışmalarda ele alınan konular, konuların yıllar özelinde dağılımları ve konuların yıllar içinde türettiği alt konular gibi bulgular elde edilirken, yapay öğrenme yöntemleri ile yazılı içeriklerden öğrenilebilmekte ve yeni içerikler sentezlenebilmektedir. Bu bağlamda çalışma gerçek ve yapay verinin değerlendirildiği iki aşamalı bir çerçeve sunmaktadır. Çalışma kapsamında içerik analizi ve yapay öğrenme ile ilişkili arka plana yer verildikten sonra sırasıyla veri setinin oluşturulması, gerçek veri üzerinden içerik analizi, yapay öğrenme ile sentetik içerik üretimi, gerçek veri üzerinden içerik analizinin ve yapay öğrenme ile sentetik içerik üretiminin sonuçları sunulmuştur. Bu çalışma kapsamında Mimarlıkta Sayısal Tasarım Ulusal Sempozyumu (MSTAS) kitaplarındaki Türkçe bildiri özetleri ve İTÜ Mimari Tasarımda Bilişim Lisansüstü (MBL) programında sonuçlandırılan yüksek lisans ve doktora tezlerinin Türkçe özetleri olmak üzere iki ayrı veri seti ile çalışılmıştır. Bildiri kitapları ve YÖK Tez Merkezi kaynaklarından yararlanılarak tamamlanan veri toplama aşamasının ardından içerik analizi yöntemi kullanılarak her iki veri seti için öne çıkan kavramlar (kelime ve kelime öbekleri) ve bu kavramların yıllara göre dağılımlarının dökümü yapılmıştır. Gerçek veri üzerinden yapılan içerik analizine paralel olarak iki veri seti kullanılarak yapay içerik (özet) üretme altyapısına sahip yapay öğrenme modeli her bir veri seti için ayrı ayrı eğitilmiş ve sonucunda biri MSTAS ve diğeri İTÜ MBL verileriyle eğitilmiş iki ayrı model elde edilmiştir. Son olarak içerik analizinin sonuçlarının rafine edilmesi sonucunda seçilen 6 kavram yazarlar tarafından eğitilmiş her iki modele ayrı ayrı verilerek toplamda 12 adet özet üretilmiştir. Çalışmada son olarak, içerik analizlerinin sonuçları üzerinden MSTAS bildirileri ve İTÜ MBL tezleri arasındaki ilişki irdelenmiştir. Ayrıca eğitilmiş yapay öğrenme modelleri ile üretilmiş olan özetleri değerlendirilmiştir.
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme |
Terzi, Şemsi Barış. Alaçam, Sema. Güzelci, Orkan Zeynel. Güzelci, Handan
MSTAS 2021 İTÜ Dayanıklılık / Dirençlilik / Esneklik 71
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi
Perspektifinden Bir Değerlendirme
Şemsi Barış Terzi 1; Sema Alaçam2; Orkan Zeynel Güzelci3; Handan Güzelci4
1İstanbul Teknik Üniversitesi Mimari Tasarımda Bilişim Yüksek Lisans Programı;
2İstanbul Teknik Üniversitesi Mimarlık Bölümü;
3Porto Üniversitesi Dijital Fabrikasyon Laboratuvarı;
4İstanbul Kültür Üniversitesi İç Mimarlık ve Çevre Tasarımı Bölümü
1www.baristerzi.com, 1baristerzitr@gmail.com; 2www.metametrik.com, 2alacams@itu.edu.tr; 3oguzelci@arq.up.pt;
3www.metametrik.com, 4h.duyar@iku.edu.tr
Özet
Bu çalışma, Türkiye’de son 15 yılda mimarlıkta bilişim alanında yapılan bilimsel çalışmalara, içerik analizini ve yapay öğrenmeyi
bir arada ele alan bir çerçeveden tekrar bakmaktadır. İçerik analizi yöntemi ile bilimsel çalışmalarda ele alınan konular, ko nuların
yıllar özelinde dağılımları ve konuların yıllar içinde türettiği alt konular gibi bulgular elde edilirken, yapay öğrenme yöntemleri ile
yazılı içeriklerden öğrenilebilmekte ve yeni içerikler sentezlenebilmektedir. Bu bağlamda çalışma gerçek ve yapay verinin
değerlendirildiği iki aşamalı bir çerçeve sunmaktadır. Çalışma kapsamında içerik analizi ve yapay öğrenme ile ilişkili arka plana
yer verildikten sonra sırasıyla veri setinin oluşturulması, gerçek veri üzerinden içerik analizi, yapay öğrenme ile sentetik içerik
üretimi, gerçek veri üzerinden içerik analizinin ve yapay öğrenme ile sentetik içerik üretiminin sonuçları sunulmuştur. Bu çalışma
kapsamında Mimarlıkta Sayısal Tasarım Ulusal Sempozyumu (MSTAS) kitaplarındaki Türkçe bildiri özetleri ve İTÜ Mimari
Tasarımda Bilişim Lisansüstü (MBL) programında sonuçlandırılan yüksek lisans ve doktora tezlerinin Türkçe özetleri olmak üzere
iki ayrı veri seti ile çalışılmıştır. Bildiri kitapları ve YÖK Tez Merkezi kaynaklarından yararlanılarak tamamlanan veri toplama
aşamasının ardından içerik analizi yöntemi kullanılarak her iki veri seti için öne çıkan kavram lar (kelime ve kelime öbekleri) ve bu
kavramların yıllara göre dağılımlarının dökümü yapılmıştır. Gerçek veri üzerinden yapılan içerik analizine paralel olarak iki veri
seti kullanılarak yapay içerik (özet) üretme altyapısına sahip yapay öğrenme modeli her bir veri seti için ayrı ayrı eğitilmiş ve
sonucunda biri MSTAS ve diğeri İTÜ MBL verileriyle eğitilmiş iki ayrı model elde edilmiştir. Son olarak içerik analizinin sonuçlarının
rafine edilmesi sonucunda seçilen 6 kavram yazarlar tarafından eğitilmiş her iki modele ayrı ayrı verilerek toplamda 12 adet özet
üretilmiştir. Çalışmada son olarak, içerik analizlerinin sonuçları üzerinden MSTAS bildirileri ve İTÜ MBL tezleri arasındaki ilişki
irdelenmiştir. Ayrıca eğitilmiş yapay öğrenme modelleri ile üretilmiş olan özetleri değerlendirilmiştir.
Anahtar Kelimeler: Hesaplamalı tasarım, mimarlıkta sayısal tasarım, yapay öğrenme, içerik analizi, MSTAS.
APA Stilinde Kaynak Gösterimi: Terzi, Ş., B., Alaçam, S., Güzelci, O., Z. & Güzelci, H. (2021). Türkiye’de sayısal tasarımın son 15
yılı: Yapay öğrenme ve içerik analizi perspektifinden bir değerlendirme. G. Çağdaş, M. Özkar, L. F. Gül, S. Alaçam, E. Gürer, S.
Yazıcı, B. Delikanlı, Ö. Çavuş, S. Altun, & G. Kırdar (Editörler), Mimarlıkta Sayısal Tasarım XV. Ulusal Sempozyumu (sf. 71-81).
https://mstas2021.itu.edu.tr/sempozyum/bildiri-kitabi
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme |
Terzi, Şemsi Barış. Alaçam, Sema. Güzelci, Orkan Zeynel. Güzelci, Handan
MSTAS 2021 İTÜ Dayanıklılık / Dirençlilik / Esneklik 72
The Last 15 Years of Computational Design in Turkey: An Evaluation from
Machine Learning and Content Analysis Perspectives
Şemsi Barış Terzi 1; Sema Alaçam2; Orkan Zeynel Güzelci3; Handan Güzelci4
1Istanbul Technical University Architectural Design Computing Graduate Program;
2 Istanbul Technical University Department of Architecture;
3University of Porto Digital Fabrication Laboratory;
4Istanbul Kultur University Department of Interior Architecture and Environmental Design
1www.baristerzi.com, 1baristerzitr@gmail.com; 2www.metametrik.com, 2alacams@itu.edu.tr; 3oguzelci@arq.up.pt;
3www.metametrik.com, 4h.duyar@iku.edu.tr
Abstract
This study reconsiders the scientific studies in the field of architectural design computing in the last 15 years in Turkey from a
perspective that combines content analysis and machine learning. Content analysis methods have the potential to provide useful
findings in terms of thematic analysis of the scientific studies, distribution of the research topics over the years, and subtopics
derived from the main topics. Machine learning methods provide synthetically generated outcomes based on a given verbal
context through an artificial learning process. In this context, this study presents a two -fold framework to be used in the analysis
of real and synthetic data. In the scope of this paper, data preparation process, content analysis and synthetic content
generation based on real data, findings and outcomes of the comparison of the real and synthetic data were presented, as well
as the background related to content analysis and machine learning. In the scope of this study, two separate data sets were
used: abstracts in the proceedings books of the Computational Design in Architecture National Symposium Series (MSTAS) and
abstracts (in Turkish) of the master's theses and doctoral dissertations concluded in the Istanbul Technical University,
Department of Informatics, Architectural Design Computing Graduate Program (MBL). MSTAS Conference proceedings and
database of the Council of Higher Education, National Thesis Center were employed as the data source. Further to the extraction
of prominent words and phrases from the given two sets of data through the content analysis method, the distribution of these
words and phrases over the years were presented. In parallel with the content analysis on real data, the machine learning model
has been trained separately for each data set. As a result, two different models were obtained, one of which was trained with
MSTAS and the other with ITU MBL data. The two machine learning models generated 12 synthetic abstracts in total based on
given keywords. The keywords were previously obtained from the content analysis phase. Finally, the relationship between
MSTAS abstracts and ITU MBL theses were investigated through the results of content analysis. In addition, the abstracts
generated by trained machine learning models were evaluated.
Keywords: Computational design, digital design in architecture, machine learning, content analysis, MSTAS.
Citation in APA Style: Terzi, Ş., B., Alaçam, S., Güzelci, O., Z. & Güzelci, H. (2021). The last 15 years of computational design in
Turkey: An evaluation from machine learning and content analysis perspectives. In G. Çağdaş, M. Özkar, L. F. Gül, S. Alaçam, E.
Gürer, S. Yazıcı, B. Delikanlı, Ö. Çavuş, S. Altun, & G. Kırdar (Eds.), Computational Design in Architecture, 15th National
Symposium (pp. 71-81). https://mstas2021.itu.edu.tr/sempozyum/bildiri-kitabi
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme |
Terzi, Şemsi Barış. Alaçam, Sema. Güzelci, Orkan Zeynel. Güzelci, Handan
MSTAS 2021 İTÜ Dayanıklılık / Dirençlilik / Esneklik 73
1. Giriş
Bir alandaki bilimsel araştırma konularının dağılımı ve çeşitliliği, bu konuların alandaki araştırmacılar tarafından fark
edilmesi, yaygın olarak kabul rmesi, geliştirilerek yeni araştırma alanlarını beslemesi, ya da sönümlenmesi gibi
farklı şekillerde dönüşmektedir (Brandon ve Betts, 1997). Bilimsel araştırma konularının dışsallaştığı ortamların
başlıcaları kitaplar, makaleler, proje raporları, konferans bildirileri ya da lisansüstü tezlerdir. Bu tür yazılı kaynaklar
retrospektif okumaların yapılabileceği bir veri kaynağı olma potansiyeli taşımaktadır. İçerik analizi (de Sola Pool,
1959; Krippendorff, 1980) ya da yapay öğrenme (Loper ve Bird, 2002; Vaswani ve diğ., 2018) gibi yöntemler ise bir
veri kaynağının semantik, sentaktik, konu odaklı ya da strüktüre olmamış tekniklerle çözümlenerek, daha önce fark
edilmemiş olan ilişkilerin açığa çıkarılmasını olanaklı kılmaktadır. Bu çerçevede çalışmanın amaçlarından birincisi,
Türkiye’de son 15 yılda mimarlıkta bilişim alanında yapılan bilimsel çalışmalara daha yakından bakmak ve araştırma
konularında yıllar özelinde ne gibi dağılımların, değişimlerin ve eğilimlerin ortaya çıktığını incelemektir. Çalışmanın
ikinci amacı ise daha önce yapılan bilimsel çalışmalardan yararlanarak oluşturulan belli bir büyüklükteki veri tabanıyla
yapay öğrenme modellerini eğitmek ve eğitilen modellerin ürettiği içeriklerin niteliklerini değerlendirmektedir. Bu
amaçla, gerçek verilerin içerik analizi yöntemi ile değerlendirilmesi ve aynı verilerle eğitilen yapay öğrenme
algoritmaları ile üretilen sentetik içeriklerin değerlendirilmesi olarak iki aşamalı bir çerçeve oluşturulmuştur. Çalışma
kapsamında, içerik analizi yapılacak gerçek veriler Mimarlıkta Sayısal Tasarım Ulusal Sempozyumu (MSTAS)
kitaplarındaki Türkçe bildiri özetleri ve İTÜ Mimari Tasarımda Bilişim (MBL) programında sonuçlandırılan yüksek
lisans ve doktora tezlerinin Türkçe özetleri olarak seçilmiştir (Şekil 1).
Şekil 1: Çalışmanın genel çerçevesi
2. Arka Plan
İçerik analizi, çoğunlukla metne dayalı bir içerikten yeni anlamlar oluşturmaya ve çıkarımlar sağlamaya yarayan bir
araştırma yöntemidir (Krippendorff, 1980). Görsel ya da işitsel veri gibi farklı temsil biçimlerinin işlenerek içerik
analizi yapıldığı örnekler bulunmakla birlikte analizlerde yaygın olarak kitap, dergi, gazete, makale ve hatta sosyal
medya iletisi gibi metne dayalı kaynakların kullanıldığı görülmektedir. Metne dayalı içerik analizinde metnin uzunluğu
ve kullanılan kelimelerin çeşitliliği, çeşitli eğilim, dağılım ve örüntülerin elde edilmesinde etkili olmaktadır. Örneğin,
bir metindeki en sık tekrarlanan kelimelerin ve bunların metin içindeki dağılımının nicel olarak hesaplanması
mümkündür. Bir metindeki kelimelerin dağılımındaki değişime bakılarak ise metnin arka planındaki tematik akış açığa
çıkarılabilmektedir (Chen, 2006). Diğer yandan, bir kelime ya da kelime öbeğinin bir metin içinde tekrar sayısının
yüksek olması her zaman ön plana çıkan anahtar kavramlar ile eşleşmeyip, çeşitli edat ve bağlaçlarda olduğu gibi tek
başlarına anlamlı bir bilgi üretmeyebilmektedir. Buna ilaveten analiz yapılan dile özgü kelime türetme
yöntemlerinden kaynaklanan problemler ortaya çıkabilir. Örneğin, Türkçe gibi sondan eklemeli bir dilde yapılan içerik
analizinde, çekim ekleri almış kelimeler ile kelimelerin kök halleri ayrı olarak sayılıp analiz sonucunda elde edilen
sonuçları etkileyebilir. Çalışma kapsamında içerik analizi sürecinde bu kısıtlar akılda tutulmuş, bilgisayar ortamında
yapılan analizlere ilaveten ön plana çıkan kelime ve kelime öbeği aşamasında elle (manuel) müdahalelerde ihtiyaç
duyulmuştur.
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme |
Terzi, Şemsi Barış. Alaçam, Sema. Güzelci, Orkan Zeynel. Güzelci, Handan
MSTAS 2021 İTÜ Dayanıklılık / Dirençlilik / Esneklik 74
İçerik analizi yöntemine ek olarak, verilen bir içeriğin çözümlenmesine ve içerikten yeni bilgi üretimine önemli katkısı
olan başka bir hesaplamalı alan doğal dil işleme araştırmalarıdır. Liddy’nin (2001) ifadesiyle doğal dil işleme “bir veya
daha fazla görev için insan benzeri dil işlemeyi başarmak amacıyla bir veya birden çok dilbilimsel düzeyde doğal
olarak oluşan metinleri analiz ve temsil etmek için motive edilmiş bir dizi hesaplama tekniğidir.” Yazım yanlışlarının
düzeltilmesi, bul-değiştir, basılı bir metni okuma ve yanlışlarını düzeltme, metin özeti çıkarma, metnin içerdiği bilgiyi
çıkarma, metni anlama, bilgisayarla sesli etkileşim ve konuşma anlama, yabancı dilde okuma yazma gibi alanlar doğal
dil işlemenin alanına girmektedir (Adalı, 2012). Son yıllarda artan işlem güçleri, büyük veri tabanları ve derin öğrenme
yöntemlerindeki teknik ilerlemeler doğal dil işleme alanına da fayda sağlamıştır (Nilsson, 2011). Vaswani ve diğ.
(2017) tarafından geliştirilen, derin öğrenmede üretme işlemi öncesi yeniden öğrenme işlemini ortadan kaldıran ve
diğer derin öğrenme yöntemlerine göre daha hızlı eğitilebilen algoritmalar, derin öğrenmenin dil işleme yeteneğini
büyük oranda arttırmıştır. Bu yetenekli derin öğrenme algoritması için Radford ve diğ., (2019) tarafından 1.5 milyar
parametreli ön eğitimli model gibi dil modelleri geliştirilmektedir. Bu dil modelleri referans alınarak farklı dillerde
modeller geliştirilebilmektedir. Bu yerel modellerden yararlanılarak üretilen doğal dil işleme algoritmaları ile sentetik
metin üretimi de mümkündür.
Mimari tasarımda bilişim bağlamında gelindiğinde, Oxman’ın (2005) dijital mimarlık alanında zamanla ağırlık kazanan
kavramların ortaya çıkışları ve ilişkilerini dışsallaştırmak amacıyla “kavramsal içerik analizi” yönteminden yararlandığı
görülmektedir. Oxman (2005) kavramsal içerik analizi yöntemi için “ICF” olarak adlandırdığı “Issues, Concepts, Form”
eksenlerinden oluşan bir çerçeve önerisi sunmuştur. ICF çerçevesinde kavramların belirmesi, bir disiplinden başka bir
disipline göçü ve kristalize olması niteliklerini tespit etmiştir (Oxman, 2005). Oxman (2005) veri kaynağı olarak
döneminde iz bırakmış ünlü müze yapıları hakkında yazılan yazıları kullanmış, zaman aralığı olarak 1990-2005 yılları
arasına odaklanmıştır. Chiu ve diğ., (2002) ise, “Bilgisayar Destekli Mimari Tasarımda Alanında Araştırmaları Yeniden
Araştırmak” başlıklı çalışmalarında CAADRIA konferansında 1996-2001 yılları arasında yayınlanmış bildirileri
inceleyerek, 13 tematik kümelenme örüntüsü tespit etmiştir. Chiu ve diğ., (2002) çalışmalarında veri madenciliği
tekniğini kullanırken, veri setini denetimli öğrenme ve denetimsiz öğrenme olarak iki ayrı biçimde
gruplandırmışlardır. Chiu ve diğ., (2002) her ne kadar 6 yıl gibi kısa bir aralıktaki kısıtlı veri ile çalışmış olsa da anlam
ve yeni bilgi üretmiş, içerik analizi yönteminde insan-makine perspektiflerini karşılaştırdıkları bir değerlendirme
sunmuşlardır. Koutamanis (2005) göreceli olarak daha geniş bir zaman aralığına, 1960-2000 arasındaki 10’ar yıllık
dilimlerde, hesaplamalı tasarım kavramlarının evrimini incelemiştir. Celani ve Veloso (2015) bilgisayar destekli mimari
tasarım konferanslarının arkeolojisi olarak adlandırdıkları bir araştırmalarında, 1980’li yıllardan itibaren düzenli
biçimde düzenlenen ACADIA, eCAADe, CAADFutures, CAADRIA, SIGraDi, ASCAAD gibi kardeş organizasyonlarının
çıktılarına ek olarak CUMINCAD veritabanındaki diğer konferans bildirilerinden ve makalelerden yararlanarak bir
değerlendirme sunmuşlardır. Sperling ve diğ., (2019) ise benzer bir içerik analizini SIGraDi ve eCAADe
konferanslarının karşılaştırılmasında kullanmıştır. Veri veritabanı olarak CUMINCAD’i temel alarak 2003-2018 tarihleri
arasındaki yayınları karşılaştırmalı olarak incelemiştir (Sperling ve diğ., 2019).
Yukarıda sıralanan kaynaklarda görüleceği gibi, mimarlıkta hesaplamalı tasarım alanında konferans bildirileri,
makaleler ya da diğer yazılı kaynaklardan yararlanarak uluslararası platformda içerik analizi yönteminden
yararlanarak alana yeni tartışmalar sunan pek çok araştırma bulunmaktadır. Ancak ulusal ölçekte mimarlıkta
hesaplamalı tasarım alanında yapılan yayınların içerik analizi yöntemiyle değerlendirildiği benzer çalışmalar kısıtlıdır.
Yazar ve Uysal (2017) çalışmalarında düzenlenen ilk 10 Mimarlıkta Sayısal Tasarım Sempozyumları’nda kullanılan
anahtar kelimelerin ilişkilerini iki aşamalı bir çizge (graf) tekniğiyle sunmuştur. Diğer yandan içerik analizi yönteminin
kendi içinde kısıtları bulunmaktadır. Veri kaynağının kısıtlı olması çalışmanın sonuçlarını da etkileyebilmektedir. Salt
kelime verisine dayalı bir bağlamdan anlam üretilmesinin, neden-sonuç ilişkileri çıkarımı yapılmasının kısıtlarına işaret
eden de Sola Pool’un (1959) hatırlatmalarını da bir soru işareti göz önünde bulundurarak, bu çalışma Türkiye’de son
15 yılda sayısal tasarım alanında yapılan çalışmaların bir ara kesitine odaklanmaktadır.
3. Analiz ve Üretim
Bu bölümde çalışma kapsamında toplanan veri, içerik analizi süreçleri, uygulanan yapay öğrenme algoritmaları,
üretilen sentetik içerikler detaylı olarak açıklanmaktadır.
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme |
Terzi, Şemsi Barış. Alaçam, Sema. Güzelci, Orkan Zeynel. Güzelci, Handan
MSTAS 2021 İTÜ Dayanıklılık / Dirençlilik / Esneklik 75
3.1. Veri Setinin Oluşturulması
Çalışma kapsamında gerçek veri olarak tanımlanan birbirinden bağımsız iki veri seti oluşturulmuştur. Bu veri
setlerinden birincisi MSTAS’da bugüne kadar Türkçe olarak yayınlanan tüm bildiri özetlerini içermektedir. Çalışmanın
ikinci veri seti ise 2006-2021 yılları arasında İTÜ MBL’de tamamlanmış olan yüksek lisans ve doktora tezlerinin Türkçe
özetlerinden oluşmaktadır. Birinci veri setini oluşturulurken MSTAS 2012 bildiri kitabının dijital kopyasına
ulaşılamadığından, ayrıca MSTAS 2013 bildiri kitabında ise bildiri özetlerinin yer almamasından dolayı 2012 ve 2013
yıllarında düzenlenen sempozyumların içerikleri veri setine dahil edilememiştir. Ayrıca sempozyum kitabından hem
Türkçe hem de İngilizce özetlerin yer aldığı fakat bu durumunda tüm yıllar için süreklilik taşımadığı görülmüştür.
Sonuç olarak birinci veri setinin sadece Türkçe olan 173 bildiri özetlerinden oluşmasına karar verilmiştir. İkinci veri
setini oluşturmak için İTÜ MBL’de sonuçlandırılan tüm tezler YÖK Ulusal Tez Merkezi (Yükseköğretim Kurulu
Başkanlığı, 2021) üzerinden filtrelenmiş ve toplamda 127 yüksek lisans ve 21 doktora olmak üzere toplamda 158
tezin özetlerine ulaşılmıştır. İki veri seti arasında karşılaştırmalı bir analiz yapılacağından, Türkçe tez özetlerinin
çalışma kapsamında kullanılması uygun bulunmuştur (Şekil 2).
Şekil 2: MSTAS bildiri ve İTÜ MBL tez sayıları
3.2. Gerçek Veri Üzerinden İçerik Analizi
Çalışmada ilk olarak sempozyumlar ve tezler üzerinden tematik analiz yapılacağından öncelikle en fazla kullanılan
kelimeler üzerinden bir analiz yapılmıştır. Yazarlar tarafından Jupyter Notebook üzerinden Python programlama
diliyle oluşturulan betik kullanılarak her iki veri seti içerisinde en sık tekrar eden kelimeler ve kelime öbekleri
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme |
Terzi, Şemsi Barış. Alaçam, Sema. Güzelci, Orkan Zeynel. Güzelci, Handan
MSTAS 2021 İTÜ Dayanıklılık / Dirençlilik / Esneklik 76
bulunmuştur. Veri setlerinde çok defa tekrar eden “ve”, “bir”, “bu”, ile”, “olarak” gibi sözcükler kelime sayımında
ihmal edilerek en sık görülen 25 kelimenin dökümü yapılmıştır. Veri setlerinin çok geniş olmaması nedeniyle kısa
sürede bu işlemler yapılmış ve sonrasında bir rafinasyon işlemi gerçekleştirilmiştir.
Bu aşamada veri setlerinde en sık görülen 25 kelimeden biri olmasına rağmen diğer veri setinde karşılığı bulunmayan
kelimeler listeden çıkarılmıştır. Bu durumda MSTAS veri setinde 17 defa tekrar eden ancak İTÜ MBL veri setinde
bulunmayan “biyodijital” kelimesi ve İTÜ MBL veri setinde 37 defa tekrar eden ancak MSTAS veri setinde
bulunmayan “etmen” kelimesi yerine her iki sette de tekrar eden “akıllı” ve “konvansiyonel” kavramları eklenmiştir.
Daha sonra benzer bir görülme sıklığı analizi, analizin ilk aşamasında seçilen 25 kelimeden türeyen iki ve üç
kelimeden oluşan kelime öbekleri için tekrar edilmiştir (Tablo 1).
Tablo 1: Veri setleri için kelime ve kelime öbeklerinin analizi
MSTAS Bildiri Özetleri
İTÜ MBL Tez Özetleri
Akıllı
5
Akıllı
73
Akıllı Konut
9
Akıllı Tasarım
6
Art(t)ırılmış
18
Art(t)ırılmış
20
Art(t)ırılmış Gerçeklik
15
Art(t)ırılmış Gerçeklik
13
Biçim-i/leri/in/lenme
197
Biçim-i/leri/in/lenme
32
2
Biçim Grameri
24
Biçim Grameri
17
Bilgisayar
79
Bilgisayar
17
4
Bilgisayar Deste-kli/ği
30
Bilgisayar Deste-kli/ği
38
Bilgisayar Destekli Tasarım
21
Bilgisayar Destekli Tasarım
19
Bilgisayar Destekli Üretim
4
Bilgisayar Destekli Üretim
3
Bilgisayar Ortamı-/nda
10
Bilgisayar Ortamı-/nda
31
Bilgisayar Oyunu/ları
5
Bilgisayar Oyunu/ları
15
Bilgisayar Teknolojileri
7
Bilgisayar Teknolojileri
18
Dijital
139
Dijital
21
0
Dijital Araçlar
13
Dijital Araçlar
13
Dijital Fabrikasyon
16
Dijital Fabrikasyon
2
Dijital Model
13
Dijital Ortam
17
Dijital Ortam
33
Dijital Tasarım
13
Dijital Tasarım
8
Dijital Teknoloji
5
Dijital Teknoloji
11
Dijital Üretim
16
Doğadan
16
Doğadan
9
Doğadan esin-li/lenen
8
Doğadan esin-li/lenen
6
Geleneksel
38
Geleneksel
86
Geleneksel Tasarım/Mimari
10
Geleneksel Tasarım/Mimari
11
Geometrik
33
Geometrik
70
Geometrik Desen
14
Geometrik Örüntü
5
Görsel
80
Görsel
24
1
Görselleştir-me/ilir/ilmesi
24
Görselleştir-me/ilir/ilmesi
43
Görsel Hesaplama
11
Hesaplama -/lı /nın
123
Hesaplama -/lı /nın
16
3
Hesaplama Süreci
11
Hesaplamalı Tasarım
48
Hesaplamalı Tasarım
58
Hesaplamalı Tasarım Araçları
5
Hesaplamalı Tasarım Araçları
15
Hesaplamalı Tasarım Pratiği
5
Hesaplamalı Tasarım
Yaklaşımı
6
Hesaplamalı Tasarım Yaklaşımı
7
Hesaplamalı Tasarım
Yöntemleri
7
Kavramsal
20
Kavramsal
60
Kavramsal Eskiz
15
Kavramsal Maket
6
Kavramsal Tasarım
5
Kavramsal Tasarım
10
Kentsel
30
Kentsel
16
4
Kentsel Dönüşüm
12
Kentsel Mekan
11
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme |
Terzi, Şemsi Barış. Alaçam, Sema. Güzelci, Orkan Zeynel. Güzelci, Handan
MSTAS 2021 İTÜ Dayanıklılık / Dirençlilik / Esneklik 77
Kentsel Tasarım
4
Kentsel Tasarım
29
Konvansiyonel
18
Konvansiyonel
5
Konvansiyonel Tasarım
6
Kullanıcı
116
Kullanıcı
34
5
Kullanıcı Deneyimi
8
Kullanıcı Hareketleri
22
Kullanıcı Hareketleri
22
Mimar-i/lık
466
Mimar-i/lık
91
0
Mimarlık Alanında
20
Mimarlık Alanında
26
Mimarlık Disiplini
9
Mimarlık Disiplini
9
Mimarlık Eğitimi-/nde
28
Mimarlık Eğitimi-/nde
11
Mimarlık Öğrencisi/leri
12
Mimarlık Öğrencisi/leri
13
Mimari Tasarım
56
Mimari Tasarım
13
7
Mimari Tasarım Süreci-/nde
17
Mimari Tasarım Süreci-/nde
25
Mimari Tasarım Stüdyosu/ları
5
Mimari Tasarım Stüdyosu/ları
12
Oyun
51
Oyun
23
6
Oyun Motoru
11
Parametrik
151
Parametrik
31
Parametrik Model-/leme
15
Parametrik Tasarım
35
Parametrik Tasarım
12
Parametrik Tasarım Aracı
10
Sanal
30
Sanal
16
6
Sanal Gerçeklik
7
Sanal Gerçeklik
20
Sanal Ortam
7
Sanal Ortam
34
Sayısal-/laştırma
126
Sayısal -/laştırma
15
5
Sayısal Model-/leme
5
Sayısal Model-/leme
5
Sayısal Ortam
6
Sayısal Ortam
46
Sayısal Tasarım
49
Sayısal Tasarım
30
Sayısal Tasarım Araçları
11
Sayısal Tasarım Araçları
11
Sayısal Üretim
5
Tasarım
967
Tasarım
19
44
Tasarım Ara-cı/çları
54
Tasarım Ara-cı/çları
84
Tasarım Eğitimi
25
Tasarım Eğitimi
23
Tasarım Evresi
6
Tasarım Evresi
9
Tasarımın İlk/Erken Aşama-sı/ları
7
Tasarımın İlk/Erken Aşama-sı/ları
31
Tasarım Parametre/leri
7
Tasarım Problem-i/leri
28
Tasarım Problem-i/leri
56
Tasarım Süre-ci/çleri
145
Tasarım Süre-ci/çleri
25
7
Tasarım Yaklaşım-ı/ları
24
Tasarım Yaklaşım-ı/ları
32
Tasarım Yöntem-i/leri
28
Tasarım Yöntem-i/leri
29
Temel Tasarım
9
Temel Tasarım
22
Üretim
146
Üretim
33
7
Üretim Ara-cı/çları
11
Üretim Ar-cı/çları
5
Üretim Sürec-i/leri
25
Üretim Sürec-i/leri
35
Üretken
25
Üretken
68
Üretken Sistem-/ler
8
Üretken Sistem-/ler
12
Veri
218
Veri
70
4
Büyük Veri
12
Yerel Veri
24
Veri Tabanı
6
Veri Tabanı
12
Veri Seti/Kümesi
24
Yapay
7
Yapay
41
Yapay Zeka
2
Yapay Zeka
24
Yapı
467
Yapı
16
0
Yapı Bilgi Modelleme
44
Yapı Bilgi Modelleme
90
Bir sonraki aşamada ise her iki veri seti için en sık görülen 25 kelimelerin yıllara göre dağılımı görselleştirilmiştir.
Görselleştirme yapılırken, kelimenin yıldaki tekrar sayısını temsil etmek için ısı haritası (heat map) tekniğinden
yararlanılmıştır (Tablo 2).
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme |
Terzi, Şemsi Barış. Alaçam, Sema. Güzelci, Orkan Zeynel. Güzelci, Handan
MSTAS 2021 İTÜ Dayanıklılık / Dirençlilik / Esneklik 78
3.3. Yapay Öğrenme ile Sentetik İçerik Üretimi
Bu çalışma kapsamında sentetik içerik olarak nitelendirilen bildiri veya tez özetlerini üretebilmek için bulut tabanlı
entegre geliştirme ortamı olan Google Colab’da Python kodlama dili ile bir algoritma kurgulanmıştır. Kurgulanan
yapay öğrenme algoritması Transformers (Wolf ve diğ., 2020), gpt2-small-turkish (Goknar, 2021) ve PyTorch (Paszke
ve diğ., 2019) kütüphanelerini (bileşenlerini) içermektedir. Bu kütüphanelerden birincisi olan “Transformers”, doğal
dil işlemede evrişimli (convolutional) ve tekrarlayan (recurrent) sinir ağlarını (neural networks) geride bırakarak
baskın bir yer edinmiştir. Wolf ve diğ. (2020) tarafından geliştirilen Transformers, performanslı platformlarda yüksek
boyutlu veri setleri ile ön eğitimli modellerin eğitilebilmesini sağlayan bir dil işleme modelidir. Transformers özellikle
dil anlama, metin üretimi, metin sınıflandırması, özetleme, eşgönderge çözümlemesi (coreference resolution) ve
makine çevirisi (machine translation) için elverişlidir. Bu çalışmada kullanılan ikinci bileşen ise “gpt2-small-turkish”
modelidir. Transformers altyapısını kullanan ve Görkem Göknar (Url-2) tarafından geliştirilen “gpt2-small-turkish” ön
eğitimli modeli Vikipedi Türkiye verileri ile eğitilmiştir ve Türkçe dilinin gramer yapısını bilmektedir. Algoritmanın
üçüncü bileşeni ise modelin eğitimi, hata ayıklaması ve eğitim sürecinde grafik kartı kullanımını sağlayan PyTorch
(Paszke ve diğ., 2019) yapay öğrenme kütüphanesidir.
Tablo 2: Seçilen kelimelerin yıllara göre tekrar sayıları ve ısı haritası ile temsili
Kurgulanan yapay öğrenme modeli daha önce detayları anlatılan her iki veri setiyle 100 devir (epoch) yapacak şekilde
eğitilmiştir. Bir başka deyişle ön eğitimli “gpt2-small-turkish” modeli kendi altyapısı sabit kalacak şekilde üzerine ek
bir eğitim daha yapılmıştır. Sonrasında, eğitilmiş model kullanılarak ve bir tetikleyici kelime veya kelime öbeği
tanımlayarak 200-300 ile 300-500 kelime arasında sentetik içerikler (özetler) üretilmiştir. Bu tetikleyici kelime ve
kelime öbeklerinin seçimi için kelimelerin ve kelime öbeklerinin analiz sonuçlarında çıkan karakterlerine bakılmıştır.
Birinci karakteristik; veri setlerinde tekrar sayısı oldukça fazla olan, yaygın anlamı kavranmış ve yeni kelime öbekleri
türetme becerisi olan kelimelerdir. Bu çalışma kapsamında dijital” ve “hesaplama” kavramları birinci karaktere
karşılık gelmeleri nedeniyle sentetik içerik üretimi için seçilmiştir. İkinci karakteristik özellik ise kelime öbeği olması
olmasına rağmen artık kalıplaşmış olan kavram, yöntem veya yaklaşımlar arasından seçilmiştir. Bu bağlamda seçilen
kelime öbekleri “biçim grameri” ve “yapı bilgi modelleme” olmuştur. Üçüncü özellik ise veri setlerinde henüz tekrar
sayısına bakıldığında üst sıralarda yer almayan ancak son yıllarda kullanılmaya ve yeni kavramlar türetmeye başlayan
kavramlardır. Bu nedenle sentetik içerik üretimi için “veri” ve “yapay” kelimeleri seçilmiştir.
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme |
Terzi, Şemsi Barış. Alaçam, Sema. Güzelci, Orkan Zeynel. Güzelci, Handan
MSTAS 2021 İTÜ Dayanıklılık / Dirençlilik / Esneklik 79
4. Değerlendirme
Gelişen veritabanının karakteristiğinin değerlendirilmesi bağlamında hem MSTAS hem de İTÜ MBL verilerinin
“sıfırdan” başlayan bir grafik sergilediği, nicel olarak birebir örtüşme olmamasına karşın belirli dönemlerde artış ve
azalış eğrilerinde göreceli olarak uyumluluk sergiledikleri ve her iki veri tabanının da gelişimde süreklilik taşıdığı ifade
edilebilir (Şekil 2). 2020 yılında pandemi koşullarında devam eden tezlere ek süre verilmesi, laboratuvar ve deney
ortamlarına erişimdeki problemler nedeniyle tamamlanmış olan yüksek lisans ve doktora tezlerinin sayıca azalmasına
karşın, MSTAS bir önceki yılın üretim yoğunluğunu korunmuştur. İki veri tabanı arasında belirgin bir şekilde farklılaşan
diğer bir yılın 2013 olduğu görülmektedir. Bu karşılaştırmada, yıllar içinde artan öğrenci ve öğretim üyesi sayıları göz
ardı edilmiş, yalnızca Şekil 2 temel alınmıştır.
Her iki veri setindeki kelime ve kelime öbekleri ilişkisinin karşılaştırılmasında, büyük ölçüde örtüşme görülmektedir
(Tablo 1). Farklı nitelik sergileyen kelimelerin başlıcaları “akıllı”, “geometrik”, ”oyun”, ”kavramsal”,”kentsel”, “veri”
ve “yapay”’dır. Bu kelimelerden “akıllı”, “oyun”, “kavramsal”, “kentsel” ve “veri”, İTÜ MBL tez özetlerinde daha fazla
tekrarlamakla kalmamış ayı zamanda kendileri ile ilişkili “akıllı kent”, “akıllı konut”, “oyun motoru”, “kavramsal
eskiz”, “kavramsal maket”, “kentsel dönüşüm”, “kentsel mekan”, “büyük veri”, “yerel veri”, “veri seti”, “veri kümesi”
gibi MSTAS özetlerinde geçmeyen kelime öbeklerinin kullanımına katkı sunmuştur. “Geometrik” kelimesi ise İTÜ MBL
tez özetlerinde “geometrik desen”, MSTAS bildiri özetlerinde “geometrik örüntü” kelime grubu ile kullanılmıştır.
“Görsel hesaplama” kelime öbeği ise MSTAS bildiri özetlerinde kullanılmış olmasına karşın İTÜ MBL tez özetlerinde
yer almamıştır.
Yıllara göre kelimelerin dağılımları göz önünde bulundurulduğunda (Tablo 2) karşımıza üç farklı örüntü çıkmaktadır:
Yıllara göre artış ve/veya azalışında her iki veri setinde uyumluluk gösteren kelimeler, bir veri setinde yer alıp
diğerinde yer almayan kelimeler ile artış/azalış/tekrarında asenkronize (birkaç yıl arayla) benzerlik gösteren
kelimeler. “Biçim”, “üretim” ve “yapı” kelimelerinin her iki veri setinde de benzer bir değişim eğilimi sergilediği
görülmektedir. “Biçim” kavramının kullanımı İTÜ MBL tez özetlerinde 2014’ten itibaren birbirine yakın bir aralıkta
tekrarlarken, benzer şekilde MSTAS bildiri özetlerinde de süreklilik teşkil edecek şekilde geçmekte olduğu
görülmektedir. “Üretim” ve “yapı” kelimeleri de her iki veri setinde sürekli-artan bir eğilim göstermektedir.
“Doğadan” kavramın ise her iki veri setinde de azalan bir grafik sergilemekte ve/veya hiç kullanılmadığı yıllar
bulunmaktadır. İki veri seti arasında görülme sıklığı farklılaşan kelimelerin başlıcaları “oyun”, “kentsel” ve “veri” dir.
Özellikle 2018 yılından itibaren İTÜ MBL tezlerinde artan bir ivme sergileyen bu üç kavramın, takip eden yıllarda
MSTAS’a yansımaları olacağını öne sürmek mümkündür. “Parametrik” ise MSTAS’ta artarak devam etmesine karşın,
İTÜ MBL tez özetlerinde azalma eğilimi taşımaktadır.
Çalışmanın ana çerçevesinin diğer önemli bir parça ise yapay öğrenme algoritmasıyla sentetik içerik üretilmesi ve bu
içeriklerin değerlendirilmesidir. Üretilen içerikler ve içeriklerin değerlendirilmesi aşağıda paylaşılmıştır.
“Biçim grameri ile yapılan karşılaştırmalar, bilgisayar destekli tasarım ortamlarında sergilenen tasarımların
bilgi akışında hızlı ve kolay ulaşılabilir olması ile tasarımların üretken modelleri ile çoğaltılmıştır. Bu tezin
bulguları, tasarımcıların yeni ve bilinmeyen yöntemlerle doğayı analiz etmelerine ve bu süreçlerde görülen
karmaşık tasarım problemlerine çözümleyebilmek için karşılaştırmalı bir sınıflandırma sistemi olarak
çalışılabilmektedir. Bu sistemi anlamda, tasarımcıların birçok stratejide yararlanma ile doğayı geometrik
desen tasarımlarını özgürce tasarım yapmak için bir model ortaya koymayı amaçlamaktadır.”
İTÜ MBL tez özetleri ile eğitilmiş yapay öğrenme algoritmasının “biçim grameri” girdisi ile ürettiği içerikte (300-500
kelimelik), algoritmanın biçim gramerleri konusunu doğayı analiz etme ile ilişkilendirdiği, karmaşık problemleri
çözümlemeye değindiği ve geometrik desen ile tasarım yapmayı dahil ettiği görülmektedir. Bu anlamda yapay
öğrenme algoritmasının bağlam ve biçimsel anlamda tutarlı bir sentetik içerik oluşturduğu ifade edilebilir. Ancak aynı
anahtar kelime MSTAS bildiri özetleri ile eğitilmiş algoritmaya verildiğinde, benzer bir tutarlılık saptanmamıştır.
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme |
Terzi, Şemsi Barış. Alaçam, Sema. Güzelci, Orkan Zeynel. Güzelci, Handan
MSTAS 2021 İTÜ Dayanıklılık / Dirençlilik / Esneklik 80
“Yapı bilgi modelleme ve tasarlama süreçlerinde kullanılan aktörler ile bu süreç içinde son ürünün üretilmesi
sürecinde bir köprü ya da arayüz kurulması gerekliliği ile mimarlığın bilgi modelleme paradigması arasındaki
ilişki sorgulanabilir. “
“Yapı bilgi modelleme” anahtar kelimeleri MSTAS özetleri ile eğitilmiş modele girdi olarak verildiğinde üretilen
sentetik özetin (200-300 kelimelik) yapı bilgi modelleme kavramını çok disiplinli bir bağlamda ele aldığı ve disiplinler
arasında bir köprü oluşturarak sonuç ürünün üretilmesine etki ettiği vurgusu yaptığı görülmektedir.
“Dijital tasarım ve üretim birlikteliğini aktarabilmek için bu disiplinler arası çalışma dijital fabrikasyon ortamı
olarak sunulmakta ve disiplinler arası bir çalışma gerektirir. Dijital teknolojilerinin mimari tasarım eğitimine
entegrasyonu, tasarım sürecini şeffaflaştıran ve sayısal tasarım çözümlerinin mimari tasarım stüdyo
eğitiminde bütünleşik olarak sunulmakta ve olanakların nasıl olacağı düşünülmektedir.”
MSTAS bildiri özetleri ile eğitilen yapay öğrenme algoritması ile “dijital” anahtar kelimesi ile üretilen sentetik içerik
(200-300 kelime), “dijital” kelimesini doğrudan dijital tasarım olarak ele alıp onu da dijital tasarım ve üretim
(fabrikasyonla) ilişkilendirmektedir. Daha sonra bu iki konuyu, tasarım stüdyolarına entegre etme eğilimi
göstermektedir.
“Hesaplamalı tasarım araçları, mimarideki gelişmelerin ani ve ivmeli süreçler ile gelişen araçların ve
otomasyon araçlarının tasarım sürecinde yaygın olarak kullanılmaktadır. Bu değişimler, günümüz tasarım
dokusunun kısıtlı olmasından ve bilgisayar destekli tasarım ortamları ile büyüyen yerel yazılımlarının
kullanımının önüne geçmek ve alternatif tasarım yaklaşımlarına olanak sağlamaktadır. Bu durum, yerel
yazılımlarının ve donanımlarının tasarım süreçlerinin daha derinleşmesi ve yaygınlaşmasından
kaynaklanmaktadır. Bu çalışmada, kütle tasarım araçları ve dijital tasarım ortamları, mevcut uygulamalara
göre kodlamaya aktarmakta ve alternatif tasarım yaklaşımlarının geliştirilmesine yol açmaktadır.”
İTÜ MBL tez özetleri ile eğitilmiş olan algoritmada “hesaplamalı” kelimesi ile oluşturulan sentetik içerikte ise (300-
500 kelime), “hesaplamalı” kavramının hesaplamalı tasarım araçları olarak ele alındığı, kütle tasarım aracı ve dijital
tasarım ortamı gibi tartışmalarla ilişkilendirildiği görülmektedir.
5. Sonuçlar
Bu çalışmada Türkiye’de son 15 yıllık bir süreçte mimarlıkta bilişim alanında yapılan bilimsel çalışmalar, içerik analizi
ve yapay öğrenme yöntemlerinden yararlanarak mercek altına alınmıştır. Veri kaynağı olarak ise Mimarlıkta Sayısal
Tasarım (MSTAS) sempozyum dizisi bildiri özetleri ile, İTÜ Bilişim Anabilim Dalı, Mimari Tasarımda Bilişim Lisansüstü
Programı yüksek lisans ve doktora tez özetleri kullanılmıştır. İki ayrı veri seti olarak ele alınan özet metinlerde en çok
tekrar eden kelime ve kelime öbekleri listelenmiştir. Elde edilen bu kelimeler ile öncelikle 15 yıllık süreç için genel bir
değerlendirme sonrasında ise yıl bazında bir değerlendirme yapılmıştır. Bu sayede sempozyum ve tezlerde
odaklanılan konuların ve temaların izi sürülmüştür. Ayrıca sempozyum ve tezler arasında yıllar açısından tematik bir
senkronizasyon veya asenkronizasyon olup olmadığı sorusuna cevap aranmıştır.
Sempozyum bildiri özetleri ve tez özetlerinden elde edilmiş verilerle ayrı ayrı eğitilmiş yapay öğrenme modelleri
kullanılarak sentetik özet üretimi yapılmıştır. Sentetik özet üretiminde, içerik analizi aşamasında elde edilen
kelimelerden ve kelime öbeklerinden yararlanılmıştır. Üretilen özetler nitelik açısından yazarlar tarafından incelenmiş
ve yapay öğrenme modellerinin Türkçe dilinde sentetik veri (özet) becerileri değerlendirilmiştir. Sentetik özetler 200-
300 kelime ve 300-500 kelime aralığında iki ölçekte denenmiştir. Genel olarak İTÜ MBL tez özetleri ile eğitilen yapay
öğrenme algoritması çıktılarından 300-500 kelimelik içerikler daha iyiyken, MSTAS bildiri özetleri ile eğitilen yapay
öğrenme algoritması çıktıları 200-300 kelimelik üretimde daha tutarlı ve anlamlı sonuçlar üretmiştir.
Çalışma çok kısıtlı bir veri seti üzerinden yürütülmüştür. Toplamda 208 adet MSTAS bildiri özeti, 158 İTÜ MBL tez
özetinden yararlanılmıştır. YÖK Tez veritabanından veri seti genişletilerek daha fazla sayıda tez incelendiğinde ya da
veri setine bildiri özetleri dışında makale özetleri ve/veya tam metin araştırmalar dahil edildiği durumda, elde edilen
Türkiye’de Sayısal Tasarımın Son 15 Yılı: Yapay Öğrenme ve İçerik Analizi Perspektifinden Bir Değerlendirme |
Terzi, Şemsi Barış. Alaçam, Sema. Güzelci, Orkan Zeynel. Güzelci, Handan
MSTAS 2021 İTÜ Dayanıklılık / Dirençlilik / Esneklik 81
bulguların farklılaşabileceği göz önünde bulundurulmaktadır. Diğer yandan, literatürde zaman aralığı ve incelenen
örnek sayısı bakımından kısıtlı veri seti ile içerik analizi yapan çalışmaların bulunması (Chiu ve diğ., 2002; Celani ve
Veloso, 2015; Oxman 2005; Sperling ve diğ., 2019) çalışmanın güncelliği ve kullanılan araştırma yönteminin geçerliliği
bağlamında olumlu bir göstergelerdir. Ancak veri setinin kısıtlı oluşu ile ön eğitilimli yapay öğrenme algoritmasının
Türkçe dilindeki becerisinin kısıtlı oluşu, sentetik özet üretimlerini olumsuz yönde etkilemiştir. Yine de yapay
öğrenme algoritması her çalıştırıldığında farklı içerikler üretilmiş, üretilen içerik ile eğitim materyali (özetler) arasında
birebir örtüşmeye rastlanmamıştır. Başka bir ifadeyle, sentetik olarak üretilen metinlerde yapay öğrenme algoritması
yeni bağlamlar ve ilişkiler kurabilmekte, tamamı anlamlı olmasa da özgün kısa özetler üretebilmektedir.
KAYNAKLAR
Adalı, E (2016). Doğal dil işleme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 5(2)
https://dergipark.org.tr/en/pub/tbbmd/issue/22245/238797
Brandon, P. & Betts, M. (1997). Veni - Vidi - Vici. Pre-Proceedings of the International Meeting Global Construction, IT Futures
1997, (pp. 86-89).
Celani, G. & Veloso, P. (2015). CAAD conferences: A brief history. Proceedings of CAAD Futures 2015, (pp. 47-58).
Chen, C. (2006). CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature. Journal of
the American Society for information Science and Technology, 57(3), 359-377. https://doi.org/10.1002/asi.20317
Chiu, M. L., Lin, C. J., Jeng, T. S., & Lee, C. H. (2002). Re-searching the research problems with CAAD: Datamining in i-CAADRIA.
Proceedings of CAADRIA 2002, (pp. 31-38).
de Sola Pool, I. (1959). Trends in content analysis. University of Illinois Press.
Goknar, G. (2021). gorkemgoknar/gpt2-small-turkish. Retrieved June 1, 2021, from https://huggingface.co/gorkemgoknar/gpt2-
small-turkish
Krippendorff, K. (1980). Content analysis: An introduction to its methodology. SAGE Publications.
Koutamanis, A. (2005). A biased history of CAAD. Proceedings of 23rd eCAADe Conference, (pp. 629-637).
Liddy, E. D. (2001). Natural language processing for information retrieval. In J. D. McDonald & M. Levine-Clark (Eds.),
Encyclopedia of Library and Information Science (4th Edition). CRC Press. https://doi.org/10.1081/E-ELIS4
Loper, E. & Bird, S. (2002). NLTK: The Natural Language Toolkit. arXiv:cs/0205028v1
Nilsson, N. J. (2011). Yapay zeka: Geçmişi ve geleceği. Boğaziçi Üniversitesi Yayınevi.
Oxman, R. (2005). The conceptual content of digital architecture: A content analysis in design. Electronic Journal of
Arquiteturarevista, 1(1). https://www.researchgate.net/publication/51022943
Paszke, A., Gross, S., Massa, F., Lerer, A., Bradbury, J., Chanan, G., ... & Chintala, S. (2019). Pytorch: An imperative style, high-
performance deep learning library. arXiv:1912.01703.
Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language models are unsupervised multitask learners.
OpenAI blog, 1(8), 9.
Sperling, D., Vizioli, S. H. T., Botasso, G. B., Tiberti, M. S., Santana, E. F. Z., & Sígolo, B. D. O. O. (2019). Crossing Timelines-Main
research topics in the histories of eCAADe and SIGraDi. Proceedings of the 37th eCAADe and 23rd SIGraDi Conference -
Volume 1, (pp. 407-416).
Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., & Polosukhin, I. (2017). Attention is all you
need. arXiv:1706.03762
Vaswani, A., Bengio, S., Brevdo, E., Chollet, F., Gomez, A. N., Gouws, S., Jones, L., Kaiser, L., Kalchbrenner, N., Parman, N.,
Sepassi, R., Shazeer, N., & Uszkoreit, J. (2018). Tensor2tensor for neural machine translation. arXiv:1803.07416.
Wolf, T., Debut, L., Sahn, V., Chaumond, J., Delangue, C., Moi, A., Cistac, P., Rault, T., Louf, R., Funtowicz, M., Davison, J., Shleifer,
S., von Platen, P., Ma, C., Jernite, Y., Plu, J., Xu, C., Le Scao, T, Gugger, S., Drame, M, Lhoest, Q., & Rust, A. (2020).
Transformers: State-of-the-art natural language processing. Proceedings of the 2020 Conference on Empirical Methods
in Natural Language Processing: System Demonstrations, (pp. 38-45).
Yazar, T. & Uysal, S. (2017). Mimarlıkta sayısal tasarım kavramları üzerine bir çalışma. Mimarlıkta Sayısal Tasarım Sempozyumu
2017, (pp. 126-134).
Yükseköğretim Kurulu Başkanlığı (2021). Tez Merkezi. Retrieved June 1, 2021, from https://tez.yok.gov.tr/UlusalTezMerkezi/.
ResearchGate has not been able to resolve any citations for this publication.
Conference Paper
Full-text available
Conference Paper
Full-text available
Being in tune with the joint eCAADe and SIGraDi conference, this paper systematizes and analyzes data related to the set of papers presented in the history of the conferences of both societies. Which paths traced from eCAADe and SIGraDi brought us to the ``architecture in the age of the fourth industrial revolution''? This paper describes a bibliometric study focused on eCCADe and SIGraDi papers from 2003 to 2018 retrieved from CumInCad by using an open-source software developed by the team for this research. The most used keywords and most cited authors, cross-citations between societies and time series about this data were synthesized, recovering part of the histories of these societies. Some similarities and differences between them are pointed out allowing to understand their past for better drawing their future.
Article
Full-text available
Computational models, Theory and education of the project, Conceptual mapping.
Article
Full-text available
This article describes the latest development of a generic approach to detecting and visualizing emerging trends and transient patterns in scientific literature. The work makes substantial theoretical and methodological contributions to progressive knowledge domain visualization. A specialty is conceptualized and visualized as a time-variant duality between two fundamental concepts in information science – research fronts and intellectual bases. A research front is defined as an emergent and transient grouping of concepts and underlying research issues. The intellectual base of a research front is its citation and co-citation footprint in scientific literature – an evolving network of scientific publications cited by research front concepts. Kleinberg’s burst detection algorithm is adapted to identify emergent research front concepts. Freeman’s betweenness centrality metric is used to highlight potential pivotal points of paradigm shift over time. Two complementary visualization views are designed and implemented: cluster views and time-zone views. The contributions of the approach are: 1) the nature of an intellectual base is algorithmically and temporally identified by emergent research-front terms, 2) the value of a co-citation cluster is explicitly interpreted in terms of research front concepts and 3) visually prominent and algorithmically detected pivotal points substantially reduce the complexity of a visualized network. The modeling and visualization process is implemented in CiteSpace II, a Java application, and applied to the analysis of two research fields: mass extinction (1981-2004) and terrorism (1990-2003). Prominent trends and pivotal points in visualized networks were verified in collaboration with domain experts, who are the authors of pivotal-point articles. Practical implications of the work are discussed. A number of challenges and opportunities for future studies are identified. Dimensions ID: pub.1001131784
Conference Paper
Bilimsel yayınların temas ettikleri bütün bilim alanlarıyla ilgi kurması beklenir. Bunun için bilimsel yayın, ilişkili olduğu düşünülen birkaç anahtar sözcükle ilişkilendirilir. Literatür araştırmalarında bilimsel yayınlara isabetli erişim için anahtar sözcük tayini en az yayının başlığı kadar önemlidir. Bu çalışma sayısal tasarım araştırmaları alanına ilişkin kavramların ülkemizdeki kullanım biçimlerini anahtar sözcük çözümleme yoluyla haritalamayı hedeflemiştir. Araştırmayı motive eden sorular, hangi kavramlar üzerinde daha sık durulduğu, kapsayıcı nitelikteki kavramların neler olduğu, kavramların yabancı dillerden çevrilirken hangi aşamalardan geçtikleri gibi noktalar üzerine yoğunlaşmıştır. Mimarlığın düşünce, eğitim ve uygulama alanları ile doğrudan ilişkilendirilebilen pek çok kavramı barındıran bir bilgi bütünü olan sayısal tasarımın ülkemiz akademik ortamında nasıl ele alındığını, bu alandaki araştırmaların hangi yönlere doğru açılım gösterdiğini daha iyi anlamamıza yardımcı olacaktır. Bunun için Mimarlıkta Sayısal Tasarım Sempozyumlarındaki anahtar sözcüklerin dökümü çıkarılmıştır. Bu sözcükler iki aşamalı olarak birleştirilmiştir ve bir yönsüz graf üstünde görselleştirilmiştir. İlk aşamada yalnızca eş anlamlı sözcükler birleştirilmiş, ikinci aşamada ise haritanın gövdesinden kopuk sözcük grupları gövdede yakın bir kavrama yönlendirilerek birleştirilmiştir. Veri yeniden görselleştirildiğinde bütün yayınlar birbirleriyle ilişkilendirilmiş durumdadır.
Article
Natural Language Processing (NLP) is a powerful technology for the vital tasks of information retrieval (IR) and knowledge discovery (KD) which, in turn, feed the visualization systems of the present and future and enable knowledge workers to focus more of their time on the vital tasks of analysis and prediction. NATURAL LANGUAGE PROCESSING First, a definition of NLP. Natural language processing is a set of computational techniques for analyzing and representing naturally oc-curring texts at one or more levels of linguistic analysis for the purpose of achieving human-like language processing for a range of tasks or applica-tions. The goal of researchers and developers of NLP is to produce systems that process text of any type, the same way which we, as humans, do-systems that take written or spoken text and extract what is meant at dif-ferent levels at which meaning is conveyed in language. NLP is used for a wide range of tasks or applications. This discussion will focus on two par-ticular tasks, namely information retrieval (IR) and knowledge discovery (KD) . Figure l shows the levels of language processing at which cognitive linguists hypothesize that humans understand or extract meaning. An interesting point to note is that, while meaning is frequently thought to be conveyed at the level of language represented as "semantics," the fo l-lowing explanation will clarify how meaning is in fact conveyed and how we, as humans, extract meaning at every level of language, not just at the semantic level.
Article
A collection of 6 papers reporting theoretical treatment and practical application of modern content analysis to: the study of German wartime propaganda (Alexander George), Goebbels' diary and psychotherapy protocols (Charles Osgood), correlating speech disturbances with anxiety (George Mahl), statistical contingency between symbols in folklore (Sol Saporta and Thomas Sebeok), classification of objectives in folk stories (Robert Armstrong), and the resolution of biographical and historical interpretations (John Garraty). Pool summarizes the work of the other contributors and the current trends. (PsycINFO Database Record (c) 2012 APA, all rights reserved)
Doğal dil işleme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi
  • E Adalı
Adalı, E (2016). Doğal dil işleme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 5(2) https://dergipark.org.tr/en/pub/tbbmd/issue/22245/238797