SrpELTeC-gold је корпус за обучавање модела за препознавања именованих ентитета, настао као поткорпус књижевног корпуса српског језика који садржи 11 романа у пуном тексту и исечке 15 романа написаних пре више од једног века. У првој фази припреме је обележен системом SrpNER, након чега су етикете ручно кориговане. Садржи 330.119 токена, 7 класа: особе, организације, локације, догађаји, дела, демоними, улоге (професије), лиценца CC-BY-NC-SA-4.0. Цитирати: Branislava Šandrih Todorović, Cvetana Krstev, Ranka Stanković, Milica Ikonić Nešić, “Serbian NER& Beyond: The Archaic and the Modern Intertwinned”, in Proceedings of the International Conference Recent Advances in Natural Language Processing - RANLP 2021, 1-3 September 2021 (virtual), eds. Galia Angelova, Maria Kunilovskaya, Ruslan Mitkov, Ivelina Nikolova-Koleva, pp. 1252-1260, 2021. DOI: 10.26615/978-954-452-072-4_141