Објављено 14. мај 2019.

Кратко и једноставно решење проблема ћириличних слова у csv (Comma-separated values) формату

Све објаве

До сада најчешће коришћени и објављивани формат на Порталу отворених података је .csv формат. Како је врло једноставно креирати овај отворени машински читљив формат из Microsoft Excel програма и лако проверити његову исправност и валидност у потпуности је разумљива његова широка употреба. Овај формат је у потпуности прихваћен као отворени формат, за разлику од друга два најчешће коришћена формата .xls и .xlsx. Ова два формата су присутна укупно у истом броју као и .csv формат самостално.

Препознат је један чест проблем са .csv форматом који спречава његову још ширу употребу на Порталу отворених података. Приликом креирања овог формата уочен је проблем чувања ћириличних слова. Ни једно ћирилично слово или латинично ч, ћ, ђ, ш, ж, џ не може бити сачувано у csv формату већ се најчешће прикажу као знак ? или неки други знак. Овај проблем о Microsoft Excel програму је широко познат, не само везано за ћирилично писмо, већ и за сва остала не-латинична писма. Како највећи број државних институција чува и објављује податке у ћириличном писму док Microsoft Excel не реши овај проблем глобално дајемо предлог једноставног заобилазног решења.

Креирање исправног формата у два једноставна корака:

  1. Када је табела са подацима попуњена у Microsoft Excel-у изабрати опцију Save As и затим из падајућег менија Save as type изабрати понуђени тип Unicode Text (*.txt). Након клика на дугме Save појавиће се порука упозорења због промене формата где треба потврдити извршену акцију (кликнути дугме Yes). Сада смо креирали текстуални фајл који је задржао структуру табеле и одговарајући encoding за ћирилична слова која су исправно сачувана без губитака.

  2. Како бисмо сада добили жељени csv формат преостао је још један корак. Потребно је ручно изменити назив креираног текстуалног фајла. У називу је потребно изменити само екстензију txt и уписати csv. Поново ће се појавити порука упозорења због промене формата на коју треба одговорити потврдно (кликнути дугме Yes).

На овај начин креиран је у потпуности исправан csv формат са ћириличним словима који можете објавити на Порталу отворених података као нови ресурс Ваше организације.