srpner-2022-16-108-romana-2022-09-05-full.zip
Disponiblezip arhiva korpusa anotiranih tekstova
- Tip
- Glavna datoteka
- MIME tip
- application/zip
- sha1
- 828649dbe3ce410f85c03e36b34e579e6dbbeb82
- Kreirano
- 11. februar 2025
- Promenjeno
- 11. februar 2025
— Јавни подаци Osveženo 11. februar 2025
Друштво за језичке ресурсе и технологије је невладино и непрофитно удружење, основано на неодређено време ради остваривања циљева у области промоције, популаризације и унапређивања свих грана језичких технологија на научном, стручном и практичном нивоу. Циљеви Друштва су: 1) Креирање и реализације…
SrpELTeC korpus koji se sastoji od 108 romana, obeležen vrstama reči, lemama i imenovanim entitetima u takozvanom "level-2" TEI formatu kao srpski deo ELTeC kolekcije (European Literary Text Collection) proizveden u okviru COST akcije CA16204.
Obeleženo je 7 kategorija imenovanih entiteta PERS, ORG, LOC, DEMO, WORK, EVENT, ROLE. Više o nastansku SrpELTeC kolekcije može se videti u specijalnom broju Infoteke https://infoteka.bg.ac.rs/ojs/index.php/Infoteka/issue/view/21. Ovaj korpus ima više svojih izdanja, ovo je samo jedno od njih koje je pripremljeno u formatu za alat TXM otvorenog koda, a može se čitati i nezavisno, korišćenjem bilo kod programskog jezika.
zip arhiva korpusa anotiranih tekstova
Imate ste obimniju bazu podataka od ovih ovde prikazanih? Sada je vreme da ih podelite!
Istražite primere upotrebe ovog seta podataka.
Da li ste koristili ove podatke? Referencirajte vaš rad i povećajte svoju vidlјivost.
Dodajte primer upotrebeDiskusija između organizacije i zajednice oko ovog skupa podataka.