Delovni sklop 2: Kolokacije

Cilji

  • razvoj metodologije za opis kolokativnosti v sodobni standardni slovenščini
  • opis tipov besednozveznih vzorcev za slovenščino z upoštevanjem izbranega nabora slovničnih kategorialnih lastnosti
  • strojna analiza kolokacij in koligacij v sodobni standardni slovenščini ter evalvacija rezultatov

Rezultati

Metodologija za opis kolokativnosti v sodobni standardni slovenščini

V projektu smo na podlagi predhodnih evalvacij metodo avtomatskega luščenja kolokacij, ki je temeljila na uporabi orodja Sketch Engine, nadgradili z možnostjo luščenja kolokacijskih podatkov iz skladenjsko razčlenjenega korpusa. Temeljna prednost te metodologije je, da poleg strukturnih podatkov o kolokacijah pri luščenju upošteva tudi skladenjska razmerja znotraj kolokacijskih struktur na podlagi označenih odvisnostnih povezav v korpusu Gigafida 2.1 ter morfosintaktične lastnosti pojavnic znotraj struktur na izvoru ter cilju. Metodologijo je mogoče uporabiti za nadaljnja luščenja kolokacij iz večnivojsko označenih korpusov, s čimer je omogočeno konstantno spremljanje jezikovnih sprememb in njihova vključitev v jezikovne vire.

 

Računalniška baza s kolokacijskimi in koligacijskimi podatki

S pomočjo omenjene metodologije je bil izdelan Frekvenčni seznam kolokacij na podlagi korpusa Gigafida 2.1. Seznam vsebuje kolokacije z absolutno frekvenco 10 in več, razdeljene v datoteke, ki ustrezajo 81 vnaprej določenim skladenjskim strukturam. V nabor podatkov je vključen tudi formalni opis skladenjskih struktur z informacijami o omejitvah in tipičnih reprezentacijah na ravni morfosintaktičnih oznak in skladenjskih povezav v korpusu. Zbirka ponuja bogat nabor kolokacijskih podatkov o sodobni slovenščini in predstavlja dobra izhodišča za slovnične analize na besednozvezni ravni, hkrati pa omogoča tudi njihovo strojno procesiranje in uporabo v jezikovnotehnoloških nalogah.

  • Krek, Simon; Kosem, Iztok; Gantar, Polona; Arhar Holdt, Špela; Robnik Šikonja, Marko; Klemenc, Bojan; Dobrovoljc, Kaja; Čibej, Jaka; Laskovski, Cyprian; Krsnik, Luka; Gorjanc, Vojko (2021). Frequency lists of collocations from the Gigafida 2.1 corpus, Slovenian language resource repository CLARIN.SI, http://hdl.handle.net/11356/1415.
  • Kosem, Iztok; Gantar, Polona; Krek, Simon; Arhar Holdt, Špela; Čibej, Jaka; Laskowski, Cyprian; Pori, Eva; Klemenc, Bojan; Dobrovoljc, Kaja; Gorjanc, Vojko; Ljubešić, Nikola (2019). Collocations Dictionary of Modern Slovene KSSS 1.0, Slovenian language resource repository CLARIN.SI, http://hdl.handle.net/11356/1250.

 

Analiza kolokativnosti v sodobni standardni slovenščini

Izdelana računalniška baza nam je služila za kvantitativno in kvalitativno jezikoslovno analizo kolokativnosti v sodobnem slovenskem jeziku, znotraj katere smo identificirali najproduktivnejše kolokacijske strukture ter analizirali distribucijo leksikalnih elementov v najbolj pogostih kolokacijah glede na tip skladenjske povezave, glede na način izražanja razmerij z oblikoskladenjskimi sredstvi in glede na kategorialne slovnične lastnosti elementov kolokacije. Rezultati analize slovničnih vidikov kolokativnosti so omogočili tudi identifikacijo novih standardizacijskih trendov v sodobni slovenščini hkrati pa so bili uporabljeni tudi pri analizi specializiranega besedišča iz korpusov računalniško posredovane komunikacije in šolskega pisanja.

TOP