Content uploaded by Teodora Vukovic
Author content
All content in this area was uploaded by Teodora Vukovic on Oct 30, 2017
Content may be subject to copyright.
Biljana Sikimić
Teodora Vuković
Digitalna zaštita bunjevačkih govora
Apstrakt: Prilog se zasniva na građi dobijenoj timskim terenskim antropološko-
lingvističkim istraživanjima Balkanološkog instituta SANU i Filozofskog fakuleta u Novom
Sadu obavljenim 2009. godine, kao i na građi koju je kasnije (2011–2014) prikupio tim
Balkanološkog instituta u bunjevačkim naseljima u okolini Subotice i u samom gradu Subotici.
Polazeći od postavki savremene dokumentacione lingvistike, na tako reprezentativnom korpusu
snimljene građe (oko 75 sati) moguće je uspostaviti multimedijalnu bazu bunjevačkih govora.
Transkripcija dela ove terenske građe (2009) omogućila je izradu bunjevačkog jezičkog korpusa,
autora Teodore Vuković (2015), kao i onlajn rečnika bunjevačkog govora
(http://balksrv2012.sanu.ac.rs/webdict/recnik/), autora Teodore Vuković i Bratislava Vukojčića.
U ovom prilogu se dalje predlaže model zaštite bunjevačkih govora: ona podrazumeva
onlajn postavljanje multimedijalne baze podataka sa audio i video snimcima, zatim fotografijama
i već postojećim transkriptima snimaka. Bazu je moguće pretraživati po naseljima i temama
razgovora. Drugi nivo zaštite čini elektronski korpus koji se sastoji od transkripata snimaka
govora i nekoliko slojeva različitih lingvističkih opisa. Ovakvi korpusi se u savremenoj
lingvistici koriste za napredna jezička istraživanja, a imaju i raznovrsnu primenu u nastavi.
Ključne reči: Bunjevci, terenska istraživanja, digitalni rečnici, jezički korpus, ugroženi
govori, dokumentaciona lingvistika
1. Terenska istraživanja
U organizaciji i na inicijativu Nacionalnog saveta bunjevačke nacionalne manjine u
periodu od 5. do 7. juna 2009. obavljeno je terensko istraživanje bunjevačkog govora u Subotici i
okolnim naseljima. Na terenu su radila dva tima sa različitim terenskim iskustvom i metodama:
antropološko-lingvistički usmeren istraživački tim Balkanološkog instituta SANU, Beograd
(Biljana Sikimić, Marija Mandić, Marija Vučković, Mirjana Mirić i Smiljana Đorđević), i tim u
čijem su sastavu bili klasični dijalektolozi, profesori Filozofskog fakulteta u Novom Sadu, Žarko
Bošnjaković i Ljiljana Nedeljkov, sa saradnicima. Istraživači su imali priliku da prate nastavu
izbornog predmeta „Bunjevački govor sa elementima nacionalne kulture“ u osnovnim školama
„Jovan Mikić“ (Subotica), „Miloš Crnjanski“ (Subotica) i „Matija Gubec“ (Tavankut).
Razgovori su vođeni sa ukupno 45 sagovornika u naseljima Donji Tavankut, Gornji Tavankut,
Čikerija, Bajmok, Ljutovo, Stari Žednik, Klisa, Aleksandrovo, Đurđin, Mala Bosna i Subotica.
Snimljena terenska građa (audio i video materijali u trajanju od oko 44 sata, kao i brojne
terenske fotografije koje je prikupio tim Balkanološkog instituta) danas je arhivirana u
Digitalnom arhivu Balkanološkog instituta SANU (DABI) i postavljena na internu mrežu SANU.
Time je građa u celini postala dostupna istraživačima svih instituta Srpske akademije nauka i
umetnosti, ali i drugim zainteresovanim licima koji je mogu koristiti pod određenim uslovima. U
formi u kojoj je trenutno deponovana, građa je pogodna kako za različite lingvističke analize
(dijalektološke, sociolingvističke, diskurs analize), tako i za istraživanja u okviru humanističkih
disciplina koje primenjuju kvalitativnu analizu, a sadrži i podatke značajne za klasičnu
etnografiju i usmenu istoriju.
Kompatibilna terenska istraživanja Bunjevaca nastavljena su 2011. (u timu su radile
Marija Mandić, Biljana Sikimić i Chloe Dubois iz Grenobla, koja je tom prilikom prikupljala
građu za svoju doktorsku tezu o sociolingvističkoj situaciji bunjevačkih govora). Razgovori su
vođeni u gradu Subotici u periodu od 18. do 20. jula, a snimljeno je 16 sati audio građe i brojne
fotografije. Tokom 2012. godine Marija Mandić i Bojan Belić ponovo su pratili nastavu
bunjevačkog govora u školama u okolini Subotice (i tom prilikom snimljena je značajna terenska
građa), a prilikom kraćih boravaka u Subotici i Bajmoku tokom 2014. godine ponovo je vođeno i
dokumentovano nekoliko razgovora sa Bunjevcima iz Bačke i Mađarske (istraživači Teodora
Vuković, Biljana Sikimić i Gleb Pilipenko iz Instituta za slavistiku RAN).
Imajući u vidu reprezentativni obim i dostupnost bunjevačke terenske građe, čini se da
do sada relativno malo korišćena u radovima samih istraživača koji su je dokumentovali.
Dominirali su sociolingvistički uvidi: Marija Mandić (Ilić) i Bojan Belić predstavili su svoja
sociolingvistička istraživanja Bunjevaca na jednom naučnom skupu u SAD, ali je njihova
koautorska studija objavljena na nemačkom jeziku (Ilić/Belić 2014). Bojan Belić je i samostalno
objavio jednu sociolingvističku studiju o bunjevačkom govoru/jeziku (Belić 2014). Kloe Diboa
(Chloe Dubois) je doktorirala 2016. godine na Univerzitetu u Grenoblu sa tezom o
sociolingvističkoj situaciji Bunjevaca. Sociolingvistička perspektiva odlikuje i koautorsku
studiju Žarka Bošnjakovića i Ivana Knjižara o promenama o govoru Bajmoka i Tavankuta
(Бошњаковић/Књижар 2012). Antropološko-lingvistički pristup imala je Biljana Sikimić koja
je analizirala delove razgovora koji se odnose na običaj klanja svinja (Сикимић 2014, 2016).
Za potrebe monografije Bošnjaković/Sikimić 2013 bila je urađena etnolingvistička
transkripcija odabranih snimaka sa terenskih istraživanja 2009. godine i oblikovana u formi
konverzacionih narativa (autor Biljana Sikimić). U istoj monografiji objavljena su i dva
dijalektološka transkripta, oblikovana u skladu sa dijalektološkim pravilima uobičajenim u
srpskoj dijalektologiji (grafičkim razdvajanjem intervencija istraživača i sagovornika,
akcentovan je samo sagovornikov govor), autora Žarka Bošnjakovića uz tehničku pomoć Danke
Urošević, Marine Šafer i Ivana Knjižara.
2. Bunjevački rečnik
Online rečnik bunjevačkog govora je multimedijalni rečnik nestandardnog govora koji za
cilj ima predstavljanje leksike bunjevačkog govora u realnim govornim situacijama. Ovo je prvi
takav rečnik u Srbiji, zbog čega je naročito značajan. Za njegovu izradu korišćeni su audio
snimci intervjua sa Bunjevcima iz arhiva Balkanološkog instituta (građa iz 2009. godine).
Proces izrade rečnika se odvijao u nekoliko koraka. U snimcima je nalažena specifična
bunjevačka leksika. Ukoliko na snimku određena leksema postoji u osnovnom obliku, taj deo
snimka je izdvajan kako bi se ilustrovao izgovor reči. Zatim bi se utvrdio neposredni kontekst
datih reči koji je neophodan za ilustrovanje njihovog značenja i ovi delovi snimaka su se potom
ekstrahovali pomoću programa za obradu zvuka Audacity. Kod nekih leksema, kao što su nazivi
starih igara ili neki opisi tradicijske kulture, ponekad je bio izdvojen duži deo snimka na kom je
sagovrnik tumačio širi kontekst. To je pokazano u primeru za leksemu cinovanje [primer 1a].
Za druge lekseme opštijeg značenja izdvojeni su primeri onoliko opšti koliko je potrebno
za određenje pojma i prikaz njegove upotrebe u rečenici [primer 1b]. Kada je neka reč
upotrebljena za objašnjavanje nekog elementa kulture, i taj opis je oključen u primer, kao što je
to slučaj sa rečju ćitnuti u primeru [1c]. U nekim slučajevima je adržaj snimaka bio
ograničavajući faktor, jer je bilo teže pronaći adekvatan ili dovoljno opširan primer upotrebe
reči, te su ti primeri ili kratki ili nedovoljno ilustrativni. Međutim, i takvi primeri su sačuvani u
nedostatku boljih.
1a 1. To sam teo kasti, to se ovako jedan velik krug, otpril’ke jedno dva metra u
prečniku i onda se vako veliko drvo stavi na sredinu, i onda isto sa batinama
udaraš, i onda ga izbaciš iz one, kruga, znači pobedio si. – A kako ste tu igru
zvali?. – Cinovanje.
1b 1. Ja pamtim da me tata svega jedanput plenio.
1c 1. I na Lucu se, eto, ništa nije davalo iz kuće, eto zbog, zbog pilića. – Za
vrata . – Da. I ćutne se, da, na Svetu Lucu, kad se ustane onda se ćutne za
vrata, eto, da bude kvočaka, šta li, da.
(Webdict. Online rečnik bunjevačkog govora)
Drugi problem u selektovanju zvučnih isečaka predstavljao je kvalitet snimka. Kako
intervjui nisu uvek vođeni u zatvorenim prostorijama bez eksterne buke, na snimcima se ponekad
čuje šuštanje vetra, buka saobraćaja, žamor ljudi ili životinja i slično. Takođe, nekada u
razgovoru učestvuje više ljudi istovremeno, pa je teško razaznati ko šta govori, a u nekim
slučajevima je teško protumačiti sadržaj razgovora uopšte. Kod takvih poteškoća nije
ustanovljeno opšte pravilo, već je odluka donošena za svaki primer posebno, u zavisnosti od
procene njegovog kvaliteta i razumljivosti
Značenja leksema su preuzimana iz Rečnika bačkih Bunjevaca (Peić/Bačlija 1990). Pored
lekseme i njenog značenja, u rečniku postoji informacija o vrsti reči, a beležene su i njene
govorne varijante ili sinonimi.
Potpuna rečnička odrednica sadrži nekoliko elemenata, koji su predstavljeni na slici [1]:
samu leksemu, odnosno osnovni oblik reči, vrstu reči i njeno značenje, njene fonetske varijacije
ili sinonime. Zatim, audio zapis osnovnog oblika reči i sliku, ukoliko je pojam moguće vizuelno
predstaviti i ukoliko je slika dostupna autoru. Na kraju dolazi jedan ili više primera iz građe
Slika 1. Primer odrednice u rečniku.
Online rečnik bunjevačkog govora je slobodno dostupan na internet stranici Timskih
terenskih istraživanja Balkanološkog instituta SANU. Njegova izrada je još uvek u toku.
Koncipiran je tako da se konstantno dopunjuje, a njegova struktura se po potrebi može menjati i
prilagođavati novim materijalima i potrebama.
Ovakav resurs može se koristiti za lingvistička istraživanja, jer pruža informacije o
značenju i upotrebi reči, a sami primeri se mogu koristiti kao tekst koji se može zasebno
analizirati zavisno od rečničkih leksema. Pored toga, budući da su u primerima opisane
bunjevačka usmena istorija i tradicijska kultura, rečnik je koristan i za antropološka, etnografska
i istorijska istraživanja. Upravo onlajn dostupnost rečnika olakšava njegovu upotrebu mlađim
korisnicima, a posebno učenicima i nastavnicima predmeta „Bunjevački jezik i nacionalna
kultura“.
3. Bunjevački korpus
Korpus je skup tekstova u elektronskoj formi koji služi da se na što bolji način predstavi
neki jezik ili jezički varijetet u vidu izvora podataka za lingvistička istraživanja (Sinclair 2004).
Model korpusa bunjevačkog govora je master projekat Teodore Vukovć (Vuković 2015). Kreiran
je kao korpus manjeg obima čija je svrha razvijanje metodologije izrade konačne verzije korpusa
bunjevačkog govora, ali i drugih dijalekatskih korpusa srpskog jezika. To je korpus govornog
nestandardnog varijeteta, što iziskuje posebne korake u njegovoj izradi. U tom procesu je
korišćeno postojeće znanje iz ove oblasti u kojima su opisani malobrojni korpusi dijalekata
drugih jezika. Korpus bunjevačkog govora dizajniran je tako da omogući različita lingvistička
istraživanja, prevashodno iz domena morfologije. Ovakav korpus može se koristiti i za različita
antropološka istraživanja, ali može imati primenu i u nastavi bunjevačkog govora sa elementima
nacionalne kulture, kao što je pokazano u radu Teodore Vuković i Maje Miličević
(Vuković/Miličević 2015).
Izrada korpusa zavisi od prirode građe koja u njega ulazi. Korpusi govornog jezika i
dijalekata se od korpusa standardnog jezika u pisanoj formi razlikuju u više aspekata. Usmenu
jezičku produkciju karakterišu izostavljanje glasova ili reči, kao i rečenična struktura koja se ne
mora podudarati sa pisanim književnim jezikom. Pored toga, sami dijalekti poseduju fonološke,
morfološke, sintaksičke i druge karakteristike koje ih razlikuju od književnog jezika.
Transkripcija, kao prvi korak u izradi jednog ovakvog korpusa, za cilj ima da verno odslika
posebnosti govornog jezika i dijalekta. Pri tome se mora voditi računa da svi transkripti koriste
jedinstveni sistem označavanja, ali da ne budu previše komplikovani, kako bi bili mašinski
čitljivi. Sledeći korak u izradi je normalizacija na neki književni jezik (u našem slučaju – na
srpski). To podrazumeva ’prevođenje’ onih reči koje se razlikuju na fonološkoj, morfološkoj,
sintaksičkoj ili leksičkoj osnovi u odnosu na srpski standard, a za potrebe primene automatskih
alatki za obradu jezika. Ovo je bio neophodan korak, budući da u trenutku izrade korpusa nisu
bili dostupni kompjuterski alati koji su se mogli primeniti na originalne transkripte. Pomoću
postojećih alata svakoj reči u korpusu dodata je informacija o vrsti reči kao i njen osnovni
gramatički oblik, odnosno lema. Za morfološku anotaciju i lematizaciju korišćen je BTagger sa
setom pravila i oznaka za standardni srpski jezik (Gesmundo/Samardžić 2012). Gotov korpus
sadrži šest slojeva podataka koji su povezani na nivou reči. Prvi sloj čine originalni transkripti, u
drugom su normalizovane morfo-fonološke karakteristike, u trećem sintaksičke odlike, kao i
lekseme koje imaju svoj ekvivalent u standardnom srpskom jeziku, dok su u četvrtom sloju
označene lekseme koje su neprevodive na književni srpski jezik. U dodatna dva sloja sadržane su
informacije o vrstama reči i leme.
Ovakva struktura korpusa omogućava različite pretrage, a njegova glavna prednost je to
što u pretrazi daje samo željene rezultate, to jest količinu neželjenih informacija u rezultatima
pretrage svodi na minimum, ili ih potpuno eliminiše. Pretraga se u ovom prilogu ilustruje samo
sa nekoliko ilustratvinih primera. Primer [2a] predstavlja pretragu originalnih transkripta za
rečima koje se završavaju na -aje u želji da se pronađu glagoli koji u trećem licu množine
prezenta imaju taj nastavak. Među rezultatima će se naći i reči poput jaje, snaje, traje, koje nisu
cilj pretrage. Primer [2b], sa druge strane, u potrazi za istim glagolskim oblikom, pretražuje u
korpusu sve reči koje se u originalnom transkriptu završavaju na -aje, a u normalizovanom tekstu
na -aju. Na taj način se dobijaju oblici poput bacaje i slikaje koji u književnom srpskom jeziku
glase: bacaju i slikaju.
2a 183: e druženje , imamo svoje <običaje> , ne ? Bilo je . Sad ve
2085: se metne , samo morčije <jaje> se četiri nedilje . Zat
4303: e načme . Tad je mekan . <Traje> on Nije se nediljno misi
4338: onda po četri . Onda to <traje> . Ali , mislim , kad se
4725: a , ja . Ranko siče . On <daje> . On daje . On daje i on
4737: . On daje i on siče . On <daje> i on vadi ilo . On je va
4907: sinovi , dva , tri sina i <snaje> , to je bilo . Svi bili
4934: ije udata , puno i bilo . <Snaje> , jetrove , zaove . Ni s
4941: je , jetrove , zaove . Ni <snaje> nisu sve sidle z astalom
5026: kopaju oni . Kerovi , oni <zakopaje> da imaju za posle ako ni
5477: ro . Tamo isto iđe jedno <jaje> , krumpir izgnječen , i
6633: ko . Pa da . Eto njega su <snaje> zvale Ranko . Jeste . Im
6699: su zvale snaje . Njegove <snaje> su ga zvale Ranko , on j
8052: kupim jaja . Pa zato što <imaje> , te savremeno onda . (
8409: Donesemo , onda eto , dok <traje> , za Božić se donese .
2b 5026: kopaju oni . Kerovi , oni <zakopaje> da imaju za posle ako ni
8052: kupim jaja . Pa zato što <imaje> , te savremeno onda . (
10410: čka bila , a sada je to , <baliraje> i sitne je , pa nije , p
16070: isam cigurna . I ond , to <bacaje> ljudi na dob snopljo- ,
18240: sa zemlje , ne , to meni <bacaje> sa kola , a ja bacam gor
21513: Mala Baja , od tog di se <razdvajaje> tri kilometera mi , naš
23854: . Al onda sve ga i glavu <prigledaje> i sve . Otiđem ujutru ,
23870: ći uveče . Dok sve to ne <prigledaje> i rezultate treba dobit
26294: ) Tako sam ga molla da ga <slikaje> , i nisu tili slikat . P
31583: tovo . I , a sad i pelene <peglaje> . Dok se ne krsti , dotl
33373: majka do e , da , eto , <probaje> ići , ima na Čikeriji
36129: stomak ne radi njim , ne <priživaje> . Sad , ima ko kaže da
36700: l , e onda se kosti bolje <otvaraje> . E , barem tako su star
37271: ča . Et to je , ovako se <smotaje> , vidiš , ovako se smot
Pored pretrage različitih oblika reči, moguće je pretraživati i nizove reči, bilo po njihovim
konkretnim oblicima po njihovim morfološkim oznakama ili njihovom kombinacijom, kao na
primer: TO + SE + KAZALO ili GLAGOL+ PREDLOG + IMENICA ili GLAGOL + ZA +
IMENICA. Pored toga u korpusu se mogu tražiti ključne reči koje bi generisale rezultate koje se
tiču tradicijske kulture ili drugih tema, što je prikazano u primerima [3a] i [3b].
3a 4567: Di je bilo svetenje , u Tavankutu , kad ja nisam tela ić . Jako šteta lani niste
bili kod nas , ali neka , ali možemo vas pozvati , u Tavankut na <dužijancu> , tamo
se svi običaji bunjevački vide , to je vraćeno unazad skroz , i nošnja , i mi smo
prošle godine imali i baš smo i nošnju , i sve baš , tu je , mislim bila sam tu među
organizatorima . To je pravo bunjevački stvarno .
3b 37298: . ) Evo vidiš , to je suknena pregača . Et to je , ovako se smotaje , vidiš ,
ovako se smota , to je nova , još ni niko nije , a ona tak metla doli , to se ovako
priko <bebe> metne , vidiš , kad oćeš digod ić . Al to mamina pregača koju koristi ,
razumiš , suknena , to je , to je vuna , vako , priko bebe se metne , priko dunjice .
Takođe je moguće dobiti rezultate o značenju reči i njihovoj upotrebi u kontekstu, kao u
sledećim primerima.
4a 65: To/To s/se kazala/zvala <parasnička/seljačka> peć/peć se/se zvala/zvala ./.
4b 72: Ložila/Ložila se/se <kuružna/kukuruzovina> u/u nju/nju i/i onda/onda
pečemo/pečemo kruv/kruh i/i eto/eto ./.
4c 83: Kiselili/Kiselili <kiseline/jogurt> ./.
4d 8997: Opere/Opere se/se i/i on/on pusti/pusti svoju/svoju ,/, on/on je/je pun/pun
<kiseline/kiseline> ,/, to/to je/je u/u stvari/stvari želudac/želudac ,/, ne/ne ,/,
gde/gde se/se zadržava/zadržava hrana/hrana
Osim u lingvističkim istraživanjima, korpusi imaju primeru i u nastavi jezika i kulture.
Ovakav korpus bi se mogao koristiti za potrebe predmeta „Bunjevački jezik sa nacionalnom
kulturom“. Nastavnici pomoću tekstova iz korpusa mogu sastavljati vežbanja iz gramatike i
vokabulara, pripremati tekstove o bunjevačkoj tradicijskoj kulturi i istoriji ili nalaziti primere
upotrebe reči bunjevačkog govora kako bi ih predstavili i približili učenicima. Primeri [1–3]
ilustruju i tu primenu korpusa. Pored toga, i sami učenici mogu na času ili kod kuće koristiti
korpus da se upoznaju sa bunjevačkim rečima, njihovim značenjem i upotrebom u realnom
govoru, kao i sa bunjevačkom kulturom u celini.
Na osnovu predstavljenog modela korpusa moguće je napraviti konačnu verziju korpusa,
koristeći materijale deponovane u Digitalnom arhivu Balkanološkog instituta SANU. Procena je
da bi konačni korpus imao oko 750.000 reči, ukoliko bi celokupna bunjevačka građa (2009–
2014) bila transkribovana. Veći korpus bi bio višestruko korisniji za lingvistička i druga
istraživanja zbog većeg inventara jezičkih jedinica, naročito sintaksičkih, što bi omogućilo
napredne kvantitativne studije na svim jezičkim i drugim nivoima.
4. Sajt bunjevačkih govora
U centralnom delu monografije Bošnjaković/Sikimić 2013 („Bunjevci o sebi“) objavljeni
su samo delovi razgovora vođenih tokom timskog terenskog istraživanja jula 2009. i to samo od
strane istraživača sa Filozofskog fakulteta u Novom Sadu (Ljiljana Nedeljkov i Žarko
Bošnjaković) i tima Balkanološkog institiuta SANU (Marija Vučković, Smiljana Đorđević,
Marija Ilić i Biljana Sikimić). Želja priređivača je bila da tako dobijeni bunjevački korpus bude
homogen: razgovore su u kratkom vremenskom periodu, od samo tri dana, vodili lingvistički
obrazovani istraživači, koji sami govore standardni srpski jezik, što se kasnije pokazalo kao
otežavajuća okolnost jer su uticali na sagovornikovo sponatno jezičko približavanje i
prilagođavanje govoru istraživača.
Zajedničku nit svih etnodijalekatskih tekstova priređenih u formi konverzacionih narativa
predstavlja činjenica da su iz celokupnog korpusa odabrani samo razgovori vođeni u ruralnim
bunjevačkim zajednicama: Bikovo Klisa, Đurđin, Mala Bosna, Stari Žednik i Tavankut.
Razgovori vođeni u Subotici nisu uključeni u zbirku tekstova, jer se preliminarnim radom na
prikupljenom zvučnom materijalu ispostavilo da bi urbani Bunjevci i njihov govor mogli i morali
biti tema posebne studije.
Način na koji je transkribovana građa objavljena u monografiji Bošnjaković/Sikimić
2013 omogućava njeno direktno postavljanje na sajt uz odgovarajući video/audio snimak. U
novije vreme je u Srbiji razvijeno nekoliko modela onlajn predstavljanja jezičke terenske građe,1
ipak čini se da je za postojeću bunjevačku građu najpogodniji model („Živi folklor Srbije“)
razvijen na sajtu Udruženja folklorista Srbije (2016)2 na koji su već postavljeni neki bunjevački
elementi arhivirani u DABI.
Svi konverzacioni narativi podeljeni su u tri velike celine, od kojih je prva celina
podeljena u pet većih tema sa podtemama:
1. Tradicijska kultura
1 http://balksrv2012.sanu.ac.rs/webdict/timok/index; http://projekti.filfak.ni.ac.rs/stiutz/
2 http://folklorsrbije.ufs.rs/
1.1. Kalendar
1.2. Životni ciklus (Rođenje, Svadba, Smrt)
1.3. Običajno pravo (Deca, Nevestinska imena, Nasleđivanje, Arenda, Časna reč)
1.4. Svakodnevni život (Salaš, Kuća, Poslovi, Domaće životinje, Odeća, Hrana,
Lečenje, Zabave, Svakodnevni život nekad i sad)
1.5. Folklorna građa
2. Usmena istorija (Kamate, Otkup i zadruge, Radne akcije, Sezonski radnici, Stočarske
migracije)
3. Privatni život (Religioznost, Biografske priče)
Upravo ista ova struktura mogla bi da bude osnovica sajta u koji bi se, preko padajućeg
menija, smestili već transkribovani narativi zajedno sa odgovarajućim montiranim audiozapisom.
Drugi deo sajta bi bio usko lingvistički, tu bi se postavili dijalektološki već potpuno
obrađeni transkripti (koji postoje u monografiji Bošnjaković/Sikimić 2013) zajedno sa
integralnim snimcima razgovora, kao i montirani delovi razgovora sa Bunjevcima koji
izražavanju njihove sociolingvističke stavove (a koji nisu bili uključeni u monografiju). U
lingvistički deo bi ulazili već navedeni i bunjevački onlajn rečnik i korpus bunjevačkog govora.
Sajt bi mogao da bude otvoren za naknadna dopunjavanja budući da je za izradu
monografije iskorišćen samo deo postojeće građe iz 2009, a uz koje bi se dodali rezultati kasnijih
istraživanja (2011–214).
Završna razmatranja
Dokumentovanje ugroženih jezika danas je postalo mejnstrim u svetskoj lingvistici. Početak
dokumentacione lingvistike se vezuje uz radove Nikolausa Himelmana (Himmelmann1998) o
međusobnom odnosu dokumentacione i deskriptivne lingvistike. Sledile su brojne studije drugih
autora, zbornici radova pa i specijalizovani časopisi posvećeni ovoj novoj lingvističkoj disciplini.
Za razliku od deskriptivne lingvistike, pojava dokumentacione lingvistike na samom kraju
dvadesetog veka omogućila je i nastanak novih vrsta jezičkih korpusa. Digitalni audio snimak
omogućio je nastanak „govornih korpusa“ jer se uz elemente karakteristične za „pisane“ korpuse
sada mogu dodavati i zvučni ili video snimci. Usmeni korpus nastaje na osnovu rada na
prikupljanju građe (audio i video snimanjem), slede transkripcija, markiranje sa anotacijom i
otvaranje pristupa.
Ilustraciju doprinosa dokumentacionoj lingvistici u Srbiji daje upravo dosadašnji rad na
bunjevačkoj jezičkoj građi razvijen u okviru Balkanološkog instituta SANU: ova građa je
prikupljena terenskim radom, zatim je komentarisana i arhivirana. Komentarisanje bunjevačke
jezičke građe podrazumevalo je njenu transkripciju, lingvističku diskusiju, smeštanje u situacioni
kontekst i ’informisanu saglasnost’ za dalje ustupanje drugim korisnicima i/ili postavljanje na
internet. Sledila je njena obrada u okvirima kompjuterske lingvistike: digitalni rečnik i korpus.
Sledeći korak bi mogla biti popularizacija bunjevačke terenske građe na posebnom sajtu i
posebno, na široko korišećnom i popularnom Jutjubu, sa koga bi se snimci preuzimali na
posebno oblikovan sajt. Time se postiže veća upotrebna vrednost postojeće građe uz istovremenu
popularizaciju nauke i ohrabrivanje ljubitelja, a ne samo profesionalaca, za rad na jezičkoj
dokumentaciji a time i na očuvanju lokalnih govora.
Literatura
Бошњаковић, Жарко, Иван Књижар (2012): Социолингвистички приступ
морфофонолошким променама у гoвору Буњеваца Бајмока и Таванкута, Српски
језик 17, Београд, 503–521.
Сикимић, Биљана (2014). Истраживач је присутан: храна као тема и повод за разговор и
размишљање, Обреgна пракса – речима о храни. На материјалу из српских говора
Војвоgине (Софија Милорадовић, ур.), Нови Сад: Матица српска, 2014, 97–111.
Сикимић, Биљана (2016). Обреднa јела у Војводини и Поморишју приликом клања свиња.
Сaвремена теренска истраживања, Slavische Geisteskultur: Ethnolinguistische und
philologische Forschungen. Teil 1, (Alekseev, Anatolij A. etc. Hrsg.), Philologica slavica
vindobonensia 2: Frankfurt am Main [u.a.], 2016, 157–180.
Belić, Bojan (2014). Bunyev(s): a linguistic frontier to be, Linguodidactics 44, 603–618.
Bošnjaković, Žarko, Biljana Sikimić (2013). Bunjevci. Etnodijalektološka istraživanja 2009,
Novi Sad: Matica srpska – Subotica: Nacionalni savet bunjevačke nacionalne manjine.
Ilić, Marija, Belić Bojan (2014). Eine neue Sprache ensteht: Bunyewakische ’Sprache’ oder
’Sparchmund’ in die Grundschule. Babel Balkan? Politische und soziokulturelle
Kontexte von Sprache in Südosteuropa (Dahmen, W., Voss, Ch. eds), München, Berlin,
(= Südosteuropa-Jahrbuch 40), 93–114.
Gesmundo, A., T. Samardžić (2012). Lemmatisation as a Tagging Task. Proceedings of the 50th
Annual Meeting of the Association for Computational Linguistics (Volume 2: Short
Papers), Jeju Island, Korea, 368–372.
Himmelmann, Nikolaus (1998)
Peić, Marko, Bačlija, Grgo (1990). Rečnik bačkih Bunjevaca. Novi Sad: Matica srpska.
Sinclair, John. (2004). Corpus and Text – Basic Principles. Developing Linguistic Corpora: a
Guide to Good Practice (Wynne, Martin ed). Oxford: Oxbow Books. Dostupno na
internet adresi: http: //ahds. ac. uk/linguistic-corpora/ (27.1.2015.).
Vuković, Teodora (2015). Izrada modela korpusa bunjevačkog govora. (neobjavljena master
teza). Beograd: Univerzitet u Beogradu
Vuković, Teodora, Miličević, Maja (2015). Izrada elektronskog korpusa bunjevačkog govora i
neke ideje za negovu primenu u nastavi. Zbornik radova sa 15. Internacionalne
konferencije o manjinskim jezicima u Beogradu. (u štampi)
Vuković, Teodora, Vukojičić, Bratislav. Webdict. Online rečnik bunjevačkog govora. Beograd:
Balkanološki institut. (http://balksrv2012.sanu.ac.rs/webdict/recnik/index, preuzeto
14.02.2017.)