redakce

Úřední desky jsou datový poklad. Když je umíte vytěžit

Města chytřerozhovor 7 a více min čtení

V Česku je asi 6500 obcí a každá z nich má vlastní úřední desku. Připočtěte k tomu desítky úředních desek ministerstev a krajů. V obrovském objemu denně zveřejňovaných dat je možné najít velice zajímavé informace o prodeji nebo pronájmu obecního majetku, o stavbách a chystaných výběrových řízeních. Většinu z nich najdete na serveru eDesky, který data automaticky sbírá a zdarma zpřístupňuje.

Líbí se vám článek? Sdílejte ho:

V Česku je asi 6500 obcí a každá z nich má vlastní úřední desku. Připočtěte k tomu desítky úředních desek ministerstev a krajů. V obrovském objemu denně zveřejňovaných dat je možné najít velice zajímavé informace o prodeji nebo pronájmu obecního majetku, o stavbách a chystaných výběrových řízeních. Většinu z nich najdete na serveru eDesky, který data automaticky sbírá a zdarma zpřístupňuje.

Na konci minulého roku do projektu vstoupila soukromá firma ADOL monitor, jejíž zástupce o novinkách v něm mluvil na letošní konferenci Open Data Expo. O důvodech vstupu, ale i o tom, proč si lidé někdy myslí, že se s úředními deskami manipuluje a kdo by data na nich měl vlastně hlídat, jsme se ptali Pavla Tomka, ředitele firmy.

Jak jste se k eDeskám dostali?

Marek Aufart, který v roce 2014 celý projekt rozjel, udělal ohromný kus práce. Postavil celý projekt a zajistil monitoring asi 1 200 desek obcí, krajů a ministerstev. Stojí i za výbornými nástroji pro stahování dat.

Už jen orientace v tom, které obce úřední desky vedou a za které je vede nadřízená obec, kde je deska na stránce umístěna a jaká je její struktura, je velice obtížné. Pomocí open dat se dá vyřešit, jak přesně se obce jmenují, jak napárovat jejich úřední desky a jméno. Využíváte přitom databázi datových schránek, orgánů veřejné moci, to všechno musí přesně sedět. Tak zjistíte, jaké webové stránky patří jaké obci, jaké mají adresy… To byla nutná podmínka pro vznik takového projektu.

Myslel jsem si, že na ministerstvu vnitra musí existovat databáze všech obcí.

Ona existuje, ale… Z jiných projektů vím, že když máte data, která by si měla odpovídat, často zjistíte, že mezi nimi není úplně přesná shoda, nemůžete je automaticky spárovat. Některé obce třeba vůbec nemají úřední desky. Opravdu malá obec může říct, že úřední desku nevede, protože dokumenty zveřejňují na desce města XY. A tím podle nich dostatečně splňují informační povinnost.

Jak pak projekt pokračoval?

Mezi roky 2014 a 2017 Marka oslovilo několik investorů, ale on chtěl zůstat programátorem. Nechtěl rozjíždět projekt jako startup, protože se nechtěl starat o obchod, marketing a vše, co s tím souvisí. Investice pro něj z pohledu rozvoje projektu nic neřešila, takže se projekt moc nerozvíjel. Dozvěděl jsem se o něm koncem roku 2017.

Proč jste o eDesky měli zájem?

Na eDeskách je unikátní, že stahují veškeré dokumenty, čtou je pomocí OCR a na základě jejich obsahu se štítkují. Když to je dražební vyhláška, označím ji Dražba, když to je územní rozhodnutí, dostane štítek Územní rozhodnutí nebo Stavební zakázky…. Najdete tam i nabídky práce, prodeje majetku, plánované pronájmy, silniční uzavírky atd.

Jako fyzická osoba se nejspíš zajímáte o konkrétní obec. Ale také můžete být firma, která například dodává okna nebo opravuje silnice. Nebo banka, která nabízí úvěry. A ta potřebuje vědět, kdy nějaká obec zveřejní nějaký záměr, analýzu vlivu na životní prostředí nebo územní plán. Obec chce něco dělat a provádí přípravné kroky. A je spousta dodavatelů, které tato data zajímají. Takové projekty jsou sice teprve ve formě záměru, ale s obcemi se často pracuje delší dobu.

A co se od vašeho vstupu změnilo?

Marek s námi spolupracuje jako programátor, my jsme do projektu dodali lidi a peníze. Za uplynulé čtyři měsíce jsme se z 1 200 desek a sledování obcí se sedmi a půl miliony obyvatel dostali na 4 000 desek a více než deset milionů obyvatel. Monitorujeme všechny obce nad 200 obyvatel. Abychom pokryli zbývajících půl milionu obyvatel, musíme začít monitorovat ještě dalších 2 500 úředních desek.

Takže jste vlastně lehce za polovinou.

Ano. I když monitorujeme 90 procent území, jsme v polovině. Trvá pět až deset minut, než novou desku zavedeme, pět až deset minut, než ji zkontrolujeme.

Každá deska má jinou strukturu. Některé obce dávají na úřední desku všechno, i oznámení typu našla se kočka, ztratil se pes. Jiné obce dávají jen základní dokumenty: rozpočet a informaci o tom, kde a kdy proběhne zastupitelstvo. Tyto informace dají do sekce Novinky. A když se podíváte na třetí obec za sebou, vidíte vlevo v liště záložky Rozpočty, Opatření, Zastupitelstva, což vypadá nadějně, ale pak někde úplně jinde najdete Archiv dokumentů, a ten je ještě rozdělený do podsložek. Jen základní orientace na takovém webu je záležitost na deset minut. Celou desku pak musíte v našem systému správně otagovat a zkontrolovat. A počítat musíte i s tím, že občas nějaká deska změní strukturu.

Těch jen několik minut na přidání mi ale přijde velmi efektivní. Vzhledem k tomu, že nikde není daná pevná struktura úředních desek, čekal jsem to pracnější.

Základní nástroj pro přidávání je dobře udělaný, tudíž v našem uživatelském rozhraní se deska přidává už celkem jednoduše. Kdyby ale měly desky pevně danou strukturu, bylo by to daleko jednodušší.

A jde jen o strukturu desky jako takové?

Kreativita je i v přílohách. Velká většina, tak osmdesát procent dokumentů, jsou formáty PDF, které jsou exportované z Wordu. Ale pak někdo udělá zápis z jednání, někdy třeba i na psacím stroji, vyfotí ho telefonem a ve formátu JPG o objemu 100 kilobajtů ho dá na úřední desku.

Co s tím děláte?

Nic. Dokument stáhneme, a jak je, zobrazíme ho lidem. Jenže rozpoznávání textů selhává, takže naše služba nikdy nebude fungovat na sto procent. To by mohl udělat jen stát, který by obcím nakázal, aby data zveřejňovaly v určitém konkrétním formátu.

Je to největší problém?

Nejhorší je, že není určené, jak má obec dokument z úřední desky sejmout. Obec dá 1. dubna na desku dokument, který 15. dubna stáhne. K tomu může být řada zákonných důvodů. Některé obce to dělají dobře. Dokument vytvoří na samostatné adrese a dají k němu dvě data – vyvěšeno a sejmuto. Dva týdny tam dokument ve formátu PDF, poté zmizí. To je v pořádku, protože vždy dohledáte adresu, název a dobu, kdy byl dokument vyvěšen. Mně osobně by se ještě líbilo, kdyby dokumenty měly nějakou ucelenou číselnou řadu, podobně jako faktury, aby se se s nimi nedalo manipulovat.

Ale jsou obce, které dokument sejmou tak, že dokument a jeho URL adresa přestane existovat. Takže nevíte, jestli vůbec taková adresa existovala, co na ní bylo, jak dlouho existovala… To je nešvar, který může vést ke spekulacím, jestli tam daný dokument vůbec byl. Najdete odkaz, který je historicky zaindexovaný v Google, ale ten nikam nevede. A běžný uživatel ani netuší, že takový odkaz vůbec někdy na stránkách byl.

Píšou nám uživatelé, že jsou schopni dokázat, že obec nabízela prodej obecního pozemku, výběrové řízení bylo uzavřeno dnes a oznámení mělo viset dva týdny. Posílají nám printscreen úřední desky, kde vlevo je Seznam s datem před deseti dny a vpravo Úřední deska, kde dokument o prodeji není.

A co s tím děláte?

Zatím nic. Přemýšlíme, jak k tomu naši službu využít. Není nic horšího než napadnout někoho, kdo má věci v pořádku. Museli bychom na to mít člověka, což ale není naše mise. Nechceme se stavět do role hlídače. To by mělo řešit ministerstvo vnitra. Navíc někdy to v malé obci nemusí být ani záměr, může to být jen technický problém s uveřejněním – starosta je na půl úvazku, asistentka dochází dva krát v týdnu na pár hodin…

Související článek

Jak to řešíte v systému? Zobrazujete dokumenty, které už na úředních deskách nejsou?

Skrýváme je. Už se k nim nedostanete. Ale informujeme o tom, že daný dokument je skrytý.

Kontrolujete data, která vytěžíte? Nebo říkáte – tady je to, co jsme vytěžili a tady je originál, zkontrolujte si to sami?

Zatím to necháváme na strojích. Soustředíme se na to, abychom dokázali zpracovávat data ze všech obcí. Dnes OCR používáme jen pro štítkování. U generovaných PDF dosahuje účinnosti někde kolem 95 až 97 procent, u rozpoznávání nafocených dokumentů to je 70 až 80 procent. Nepřečtete čarový kód v dokumentu, nerozpoznáte spisové značky v hlavičce. Ale na správné rozpoznání smyslu dokumentu – jestli se v něm píše o výběrovém řízení, nebo o nabídce práce – OCR stačí.

Data nefiltrujeme. Například zastupitelstvo se usnese na prodeji pozemku. Na eDeskách je k dispozici zápis, kde to je uvedené. Ale to ještě není samotná nabídka prodeje – ta může přijít až po několika týdnech.

Takže data neinterpretujete?

Zatím se je snažíme neinterpretovat, jen pomocí klíčových slov usnadňujeme prohledávání. Denně stahujeme asi dva tisíce dokumentů. Představu ruční kontroly, kterou jsme kdysi měli, jsme rychle opustili. Ruční kontrolou se možná zaměříme jen na vybrané typy dokumentů. Například se nebudeme věnovat územnímu rozhodnutí o rekonstrukci hlavního silničního tahu, které se týká stovek pozemků. To nebudeme schopni ručně kontrolovat a opravovat.

Ale předpokládám, že největší zájem jednotlivců se bude soustředit na jednorázové záležitosti typu prodej a pronájem nemovitosti. To jsou jen desítky dokumentů denně, které dokážeme nejen ručně zkontrolovat, ale přidat k nim i data z katastru, ortofotomapu, kde pozemek vyšrafujeme, StreetView… To je věc, kterou obec nikdy dělat nebude.

U úředních desek vám Open Data moc nepomůžou…

… tam je spíš sami vytváříme …

U napojení na katastr je využíváte intenzivně. Jsou další oblasti, kde s otevřenými daty pracujete?

Uvažujeme o tom, že bychom na eDesky doplnili jednoduchou prezentaci dané obce. Jednali jsme s realitním serverem, který by o základní informace měl zájem. Lidi zajímá, kde budou bydlet. Jde o informace typu jaký má obec rozpočet, jak hospodaří, kolik je v ní obyvatel, průměrné srážky, počasí z ČHMÚ, dostupnost podle jízdních řádů je taková… Impulsy tak chodí spíš ze soukromého sektoru.

Související článek

Obecní rozpočet na internetu zadarmo a na pár kliknutí!

Rozbité chodníky a málo peněz na podporu kulturních akcí nebo sportovních týmů. Realita v mnoha obcích. A když se občan zeptá, kde je problém, dozví se, že není dost peněz. Přitom vedení města si nedávno pořídilo nového služebního superba. Tak kde ty peníze jsou? A kam skutečně mizí? Stačí pohled do rozklikávacího rozpočtu. Často je to ale nepřehledná změť odkazů a záložek. Platforma CityVizor dokazuje, že to jde i jinak.

Kolik máte uživatelů?

Zatím to jsou řády tisíců, přestože se do marketingu neinvestovala ani koruna. Zejména na menších městech mohou být  eDesky.cz způsob, jak se lidi dostanou k důležitým informacím. Řadu lidí by ani nenapadlo číst si úřední desku na nástěnce. Ale když informace dostávají pravidelně, začínají se o dění v obci zajímat. Komentují růst počtu obyvatel, sledují osudy opuštěných domů. A to mi přijde jako dobrá věc.

Chystáme kampaň, ale než ji spustíme, potřebujeme přidat další desky a doladit technické záležitosti. Představte si, že odebíráte data z okresu Prostějov. My v tomto okrese přidáme novou obec, která má stovky historických dokumentů – a musíme vyřešit to, že vám nepošleme stovky upozornění na novinky. To by se vám asi nelíbilo. A takových situací může nastat více.

Zatím jsou eDesky zdarma, jaké máte další plány?

Věřím, že se data podaří monetizovat. Projekt musí být samofinancovatelný. Chtěl bych dosáhnout modelu, kdy dáte data lidem pro nekomerční použití zadarmo a zaplatí to pár stovek firem, které data používají pro své podnikání. Tyto společnosti by takový projekt nikdy nepostavily, ale za pár tisíc korun měsíčně mohou sledovat dění v celé republice, které zajímá právě jen je.

 

 

Líbí se vám článek? Sdílejte ho:
link odkaz
Reklama