SrpKor4Tagging - корпус за обучавање модела за обележавање врста речи SrpKor4Tagging

— Јавни подаци Osveženo 5. marec 2025

Друштво за језичке ресурсе и технологије

Друштво за језичке ресурсе и технологије је невладино и непрофитно удружење, основано на неодређено време ради остваривања циљева у области промоције, популаризације и унапређивања свих грана језичких технологија на научном, стручном и практичном нивоу. Циљеви Друштва су: 1) Креирање и реализације…

3 skupova podataka

Informacije

Temporalnost

Geografske dimenzije

Integracija

Permalink

Opis

SrpKor4Tagging – Корпус је формиран комбинацијом књижевних (⅓) и административних (⅔) текстова на српском језику. Обележен је са два скупа ознака за врсте речи: Universal POS и SrpLemKor (скуп креиран на основу традиционалне, дескриптивне граматике српског језика) и лематован.
Скуп садржи 342,803 токена, лиценца је CC-BY-4.0. Више детаља у раду: https://aclanthology.org/2020.lrec-1.487/ Цитирати:
Ranka Stankovic, Branislava Šandrih, Cvetana Krstev, Miloš Utvić, and Mihailo Skoric. 2020. Machine Learning and Deep Neural Network-Based Lemmatization and Morphosyntactic Tagging for Serbian. In Proceedings of the Twelfth Language Resources and Evaluation Conference, pages 3954–3962, Marseille, France. European Language Resources Association.

Resursi 1

Videti takođe: resursi zajednice
0 preuzimanja

srpkor4tagging.zip

Disponible
zip (1.4Mo)

вертикализовани текст у ком је сваком токену (речи или интерпункцијском знаку) придружена врста речи о то у два скупа етикета

Tip
Glavna datoteka
MIME tip
application/zip
sha1
7e09c5212f3e74796608b0053c73c71afeb857e9
Kreirano
5. marec 2025
Promenjeno
5. marec 2025

Resursi zajednice 0

Imate ste obimniju bazu podataka od ovih ovde prikazanih? Sada je vreme da ih podelite!

Primeri upotrebe 0

Istražite primere upotrebe ovog seta podataka.

Da li ste koristili ove podatke? Referencirajte vaš rad i povećajte svoju vidlјivost.

Dodajte primer upotrebe

Diskusija između organizacije i zajednice oko ovog skupa podataka.