Srpska podkolekcija ELTeC korpusa - TXM izdanje (108 NER) (SrpELTeC) SrpELTeC korpus koji se sastoji od 108 romana, obeležen vrstama reči, lemama i imenovanim entitetima u takozvanom "level-2" TEI formatu kao srpski deo ELTeC kolekcije (European Literary Text Collection) proizveden u okviru COST akcije CA16204. Obeleženo je 7 kategorija imenovanih entiteta PERS,… 1 ресурса 0 примера употребе 0 омиљени
SrpELTeC-gold - корпус за обучавање модела за препознавања именованих ентитета (SrpELTeC-gold) SrpELTeC-gold је корпус за обучавање модела за препознавања именованих ентитета, настао као поткорпус књижевног корпуса српског језика који садржи 11 романа у пуном тексту и исечке 15 романа написаних пре више од једног века. У првој фази припреме је обележен системом SrpNER, након чега су етикете… 1 ресурса 0 примера употребе 0 омиљени
SrpKor4Tagging - корпус за обучавање модела за обележавање врста речи (SrpKor4Tagging ) SrpKor4Tagging – Корпус је формиран комбинацијом књижевних (⅓) и административних (⅔) текстова на српском језику. Обележен је са два скупа ознака за врсте речи: Universal POS и SrpLemKor (скуп креиран на основу традиционалне, дескриптивне граматике српског језика) и лематован. Скуп садржи 342,803… 1 ресурса 0 примера употребе 0 омиљени