SrpELTeC-gold - корпус за обучавање модела за препознавања именованих ентитета SrpELTeC-gold

— Јавни подаци Osveženo 5. marec 2025

Друштво за језичке ресурсе и технологије

Друштво за језичке ресурсе и технологије је невладино и непрофитно удружење, основано на неодређено време ради остваривања циљева у области промоције, популаризације и унапређивања свих грана језичких технологија на научном, стручном и практичном нивоу. Циљеви Друштва су: 1) Креирање и реализације…

3 skupova podataka

Informacije

Temporalnost

Geografske dimenzije

Integracija

Permalink

Opis

SrpELTeC-gold је корпус за обучавање модела за препознавања именованих ентитета, настао као поткорпус књижевног корпуса српског језика који садржи 11 романа у пуном тексту и исечке 15 романа написаних пре више од једног века. У првој фази припреме је обележен системом SrpNER, након чега су етикете ручно кориговане. Садржи 330.119 токена, 7 класа: особе, организације, локације, догађаји, дела, демоними, улоге (професије), лиценца CC-BY-NC-SA-4.0. Цитирати: Branislava Šandrih Todorović, Cvetana Krstev, Ranka Stanković, Milica Ikonić Nešić, “Serbian NER& Beyond: The Archaic and the Modern Intertwinned”, in Proceedings of the International Conference Recent Advances in Natural Language Processing - RANLP 2021, 1-3 September 2021 (virtual), eds. Galia Angelova, Maria Kunilovskaya, Ruslan Mitkov, Ivelina Nikolova-Koleva, pp. 1252-1260, 2021. DOI: 10.26615/978-954-452-072-4_141

Resursi 1

Videti takođe: resursi zajednice
0 preuzimanja

srpeltec-gold.zip

Disponible
zip (1.9Mo)

садржи 242 текстуалне датотеке (.txt) и исто толико пратећих фајлова са анотацијама (.ann)

Tip
Glavna datoteka
MIME tip
application/zip
sha1
36ea31634ab5c07b3f66dc3b5e33a5eadd3a91a9
Kreirano
5. marec 2025
Promenjeno
5. marec 2025

Resursi zajednice 0

Imate ste obimniju bazu podataka od ovih ovde prikazanih? Sada je vreme da ih podelite!

Primeri upotrebe 0

Istražite primere upotrebe ovog seta podataka.

Da li ste koristili ove podatke? Referencirajte vaš rad i povećajte svoju vidlјivost.

Dodajte primer upotrebe

Diskusija između organizacije i zajednice oko ovog skupa podataka.