SrpKor4Tagging - корпус за обучавање модела за обележавање врста речи SrpKor4Tagging

Name: SrpKor4Tagging - корпус за обучавање модела за обележавање врста речи
Creator: Друштво за језичке ресурсе и технологије
Keywords: korpus-za-obuchavanje-tagera,pos-tagging,tagiranje

— Јавни подаци Osveženo 5. marec 2025

Друштво за језичке ресурсе и технологије

Друштво за језичке ресурсе и технологије је невладино и непрофитно удружење, основано на неодређено време ради остваривања циљева у области промоције, популаризације и унапређивања свих грана језичких технологија на научном, стручном и практичном нивоу. Циљеви Друштва су: 1) Креирање и реализације…

3 skupova podataka

Informacije

Licenca: Јавни подаци
ID: 67c8dc1a4ba9f6abb3c8d763

Temporalnost

Učestalost: Nepravilan
Datum kreiranja: 5. marec 2025
Poslednja promena resursa: 5. marec 2025

Geografske dimenzije

Prostorna granularnost: Zemlјa

Integracija

<div data-udata-dataset="67c8dc1a4ba9f6abb3c8d763"></div><script  src="https://data.gov.rs/static/oembed.js" async defer></script>

Permalink

Dodajte primer upotrebe Kontakt

Opis

SrpKor4Tagging – Корпус је формиран комбинацијом књижевних (⅓) и административних (⅔) текстова на српском језику. Обележен је са два скупа ознака за врсте речи: Universal POS и SrpLemKor (скуп креиран на основу традиционалне, дескриптивне граматике српског језика) и лематован.
Скуп садржи 342,803 токена, лиценца је CC-BY-4.0. Више детаља у раду: https://aclanthology.org/2020.lrec-1.487/ Цитирати:
Ranka Stankovic, Branislava Šandrih, Cvetana Krstev, Miloš Utvić, and Mihailo Skoric. 2020. Machine Learning and Deep Neural Network-Based Lemmatization and Morphosyntactic Tagging for Serbian. In Proceedings of the Twelfth Language Resources and Evaluation Conference, pages 3954–3962, Marseille, France. European Language Resources Association.

Resursi ¹

Videti takođe: resursi zajednice

0 preuzimanja

srpkor4tagging.zip

Disponible

zip (1.4Mo)

вертикализовани текст у ком је сваком токену (речи или интерпункцијском знаку) придружена врста речи о то у два скупа етикета

URL: https://data.gov.rs/s/resources/srpkor4tagging-korpus-za-obuchavanje-modela-za-obelezhavanje-vrsta-rechi/20250305-232001/srpkor4tagging.zip
Permalink: https://data.gov.rs/sl/datasets/r/51b3f6e9-ea8a-411a-a40f-026e264fc84f
Tip: Glavna datoteka
MIME tip: application/zip
sha1: 7e09c5212f3e74796608b0053c73c71afeb857e9
Kreirano: 5. marec 2025
Promenjeno: 5. marec 2025

Resursi zajednice ⁰

Imate ste obimniju bazu podataka od ovih ovde prikazanih? Sada je vreme da ih podelite!

Dodajte zajednički resurs

Primeri upotrebe ⁰

Istražite primere upotrebe ovog seta podataka.

Da li ste koristili ove podatke? Referencirajte vaš rad i povećajte svoju vidlјivost.

Dodajte primer upotrebe

Diskusija između organizacije i zajednice oko ovog skupa podataka.