Srpska podkolekcija ELTeC korpusa - TXM izdanje (108 NER) SrpELTeC

— Јавни подаци Osveženo 11. februar 2025

Ovaj skup podataka je objavlјen inicijativom i pod odgovornosti od Ранка Станковић
Objavlјeno 11. februar 2025 i promenjeno 11. februar 2025

Ранка Станковић

1 skupova podataka

Informacije

Temporalnost

Geografske dimenzije

Integracija

Permalink

Opis

SrpELTeC korpus koji se sastoji od 108 romana, obeležen vrstama reči, lemama i imenovanim entitetima u takozvanom "level-2" TEI formatu kao srpski deo ELTeC kolekcije (European Literary Text Collection) proizveden u okviru COST akcije CA16204.
Obeleženo je 7 kategorija imenovanih entiteta PERS, ORG, LOC, DEMO, WORK, EVENT, ROLE. Više o nastansku SrpELTeC kolekcije može se videti u specijalnom broju Infoteke https://infoteka.bg.ac.rs/ojs/index.php/Infoteka/issue/view/21. Ovaj korpus ima više svojih izdanja, ovo je samo jedno od njih koje je pripremljeno u formatu za alat TXM otvorenog koda, a može se čitati i nezavisno, korišćenjem bilo kod programskog jezika.

Resursi 1

Videti takođe: resursi zajednice
0 preuzimanja

srpner-2022-16-108-romana-2022-09-05-full.zip

Disponible
zip (451.5Mo)

zip arhiva korpusa anotiranih tekstova

Tip
Glavna datoteka
MIME tip
application/zip
sha1
828649dbe3ce410f85c03e36b34e579e6dbbeb82
Kreirano
11. februar 2025
Promenjeno
11. februar 2025

Resursi zajednice 0

Imate ste obimniju bazu podataka od ovih ovde prikazanih? Sada je vreme da ih podelite!

Primeri upotrebe 0

Istražite primere upotrebe ovog seta podataka.

Da li ste koristili ove podatke? Referencirajte vaš rad i povećajte svoju vidlјivost.

Dodajte primer upotrebe

Diskusija između vlasnika i zajednice oko ovog skupa podataka.