foto: iStockphoto.com

Kateřina Mahdalová: Dat ohledně covidu je málo, jejich utajování škodí

Stát chytřerozhovor 7 a více min čtení

Proč v našich krajích panuje kolem dat týkajících se koronavirové nákazy takový zmatek? Kdo za to může a jak by se to dalo napravit? A můžeme vůbec na základě dostupných dat vytvářet nějaké rozumné plány, jak se epidemii dál bránit? K tomu má rozhodně co říci Kateřina Mahdalová, datová expertka a zakladatelka portálu Datová žurnalistika.cz, jejíž služby využívá třeba Wall Street Journal.

Líbí se vám článek? Sdílejte ho:

Proč v našich krajích panuje kolem dat týkajících se koronavirové nákazy takový zmatek? Kdo za to může a jak by se to dalo napravit? A můžeme vůbec na základě dostupných dat vytvářet nějaké rozumné plány, jak se epidemii dál bránit? K tomu má rozhodně co říci Kateřina Mahdalová, datová expertka a zakladatelka portálu Datová žurnalistika.cz, jejíž služby využívá třeba Wall Street Journal.

Související článek

Matematické modely předpověděly šíření viru lépe než vláda

Co se stane, když si v počítači vytvoříte model okresního města a do něj pak pustíte náhodné návštěvníky s koronavirem? Vypadá to trochu jako nějaká speciální verze hry SimCity, ale ve skutečnosti to může mít velký dopad na život v následujících týdnech a měsících. Právě takhle vypadá zkoumání pandemie pomocí matematických modelů.

S prací Kateřiny Mahdalové se u nás od začátku pandemie setkal téměř každý – právě ona je autorkou populárních interaktivních map, které vycházely do léta na Novinkách.cz a nedávno se přesunuly na Seznam zprávy. Jako jedna z prvních zmapovala ústup nemoci z Čech a její razantní nástup na severní Moravě, k němuž došlo koncem června, a již na přelomu července a srpna vysílala ve svých článcích varovné zprávy o tom, že nákaza začíná sílit po celé zemi – v době, kdy se ještě oficiální místa tvářila, že se neděje prakticky nic. Opírá se o poznatky analytiků kolem Jana Kulveita z Oxfordské univerzity i skupiny Anticovid, působící na institutu CERGE-EI při UK. V minulosti vedla datové projekty pro ČTK, v zahraničí její práci využívá například prestižní list Wall Street Journal nebo rakouská televize ORF. Známe se dlouho, takže si při rozhovoru tykáme.

Základní otázka: Jak si v současnosti Česko stojí, co se dat ohledně covidu týče? Máme jich dost? Jsou spolehlivá?

Dost jich není ani náhodou, naopak jich je obrovský nedostatek. Od okamžiku, kdy se pandemie dostala na území Česka, o ně probíhá tvrdý boj. Jejich důležitá část je prakticky nedostupná – ta data, která poskytuje Ústav pro zdravotnické informace a statistiku řízený panem profesorem Duškem, jsou jednak neúplná a za druhé se některá z nich k veřejnosti dostávají až s týdenním zpožděním, což je v téhle situaci opravdu neúnosné. Od začátku března jsme se pokoušeli sledovat regionální ohniska, jenže to bylo na základě dat z ÚZIS prakticky nemožné. Byli jsme tak odkázáni v zásadě na to, co publikovaly hygienické stanice.

Data z hygieny se ovšem od dat oficiálních ministerských dat často liší, což zjistíme i po zběžném prozkoumání základního informačního webu Ministerstva zdravotnictví. Čím to je, nemělo by jít o jedna a tatáž čísla?

Ona to jsou stejná data, ovšem publikovaná v různých časech. Hygienické stanice zanášejí statistiky o nakažených oficiálně až ve chvíli, kdy danou osobu osloví. V tu chvíli jde o validovaný údaj. Jenže pořád existuje spousta lidí, a v poslední době jejich počet nebezpečně roste, kteří jsou pozitivní, jejich výsledek z laboratoře je známý, ale hygiena je ještě nekontaktovala. A právě tohle tvoří ten rozdíl.

Odtud pochází tvé nedávné tvrzení, že hygieny nezvládají vytrasovat až třetinu nakažených lidí? To na sociálních sítích vzbudilo slušný rozruch…

Související článek

Nová eRouška skončila se sběrem dat. Velký bratr už nehrozí

Od včerejška je pro Android i iOS k dispozici druhá verze aplikace eRouška, která by měla tvořit důležitou součást systému chytré karantény. Proč je dobré ji mít a v čem je lepší než její předchůdkyně?

Přesně tak. Na tom není nic složitého – napsala jsem to v den, kdy podle oficiálních ministerských statistik bylo aktuálně zhruba 24 tisíc nakažených, ovšem hygienické stanice uváděly pouze 16 tisíc. Rozdíl činil 8 tisíc, tedy přesně třetinu. Při nízkých číslech by se v zásadě nic tak zlého nedělo. Pokud ale zcela uniká kontrole takhle obrovské číslo, je to vážný průšvih.

To znám z vlastní zkušenosti – pozitivní test jsem měl na začátku září, ovšem hygiena se mi vůbec neozvala. Teď už je jasné, že ani neozve.

Ano, tím pádem jsi jedním z těch osmi tisíc, a v tvém případě už vážně nejspíš k žádné náhradě nedojde. A rozhodně nejsi sám.

Samozřejmě chápu to znepokojení, když si člověk uvědomí, co ten rozdíl ve skutečnosti znamená – tedy že hygiena zoufale nestíhá. Ale proč je to problém čistě z hlediska statistiky? Nestačí data z ministerského webu, tedy z laboratoří? Ta jsou podle všeho přesná…

Jsou přesnější, jistě – do nich se dostane každý pozitivní. Ale zato jsou zoufale neúplná, protože se uvádějí jen plošně, respektive na úrovni krajů. Pokud chceš ale vytvářet nějaké modely nebo predikce nebo prostě jen co nejpřesněji zachytit aktuální stav, nutně potřebuješ data přinejmenším z okresů, a ta se z ministerského webu nedozvíš. K tomu jsou zapotřebí údaje z hygienických stanic. A v dnešní situaci samozřejmě nelze čekat, že se přetížené hygieny budou chovat zvlášť vstřícně a posílat nám nějaká čísla nad rámec svých povinností, takže nezbývá než využívat oficiální údaje a každý den si je zapisovat do tabulek.

Znamená to, že data z hygienických stanic jsou momentálně v podstatě bezcenná?

Pokud bychom je měli využívat jako základní informaci o současném stavu nákazy, pak ano, skutečně bezcenná jsou. Velkou hodnotu mají ovšem jako svědectví o tom, že se nemoc vymyká kontrole. Až budou stejná jako data z ÚZIS, budeme si moci oddechnout, že se epidemii zase podařilo zkrotit.

Kdo může za to, že je relevantních dat pro veřejnost takový nedostatek?

Začnu u profesora Duška, který ta data všechna k dispozici má, poskytuje je politikům a vybraným lidem s přístupem do systému chytré karantény, ale hrozně se brání tomu poskytovat je veřejnosti. Odvolává se na to, že on je pouhým správcem dat, která fakticky vlastní ministerstvo zdravotnictví. To je přes opakované žádosti nevydalo. Kolegové, datoví novináři v Českého rozhlasu, narazili, když si podle zákona 106/1999 Sb. vyžádali anonymizovaná data ke koronaviru, a byli ministerstvem odmítnuti. Resort žádosti o informace zamítá s odvoláním větu obsaženou v zákoně o zdravotnických službách, kterou do něj zhruba před dvěma lety prosadil lékař, člen sněmovního výboru pro zdravotnictví a poslanec Jiří Běhounek.

Ten výjimku tehdy v důvodové zprávě vysvětlil tak, že kdyby se lidé dostali ke svým zdravotnickým záznamům od zdravotnických statistiků, mohlo by to vést – cituji – k zavádějícím informacím o zdravotním stavu a vyvolávat u laického občana zbytečné obavy. Zkrátka jde o politické rozhodnutí – a podle mě je úplně špatné.

Čím je takové politické rozhodnutí motivované? Proč člověk disponující tak důležitými daty dospěje k názoru, že je nedá k dispozici lidem, kteří s nimi umějí pracovat?

Samozřejmě nemůžu mluvit za ministerstvo nebo profesora Duška, ale můj pocit je, že ti zodpovědní jedinci vůbec nepochopili, k čemu tahle data mají a mohou sloužit. Podle vlastních slov mají obavy z dezinterpretace informací, tvrdí, že nechtějí strašit veřejnost, že jejich úkolem je naopak lidi uklidňovat. Jenže ono to má opačný efekt – když se data rozcházejí nebo nejsou dostupná, vede to k různým spekulacím nebo dokonce ke vzniku konspiračních teorií. A v důsledku nakonec k nedůvěře v celý systém.

Související článek

Superpočítače z Ostravy pomáhají najít evropský lék proti koronaviru

Nejvýkonnější počítače v Česku začaly bojovat s druhou vlnou koronaviru. Národní superpočítačové centrum IT4Innovations VŠB-TUO se jako jediný český zástupce zapojuje do prestižního evropského programu Exscalate4COV, který má hledat způsoby, jak porazit COVID-19, ale i další možné budoucí hrozby.

No jistě, pak už spousta lidí nevěří ničemu a na Facebooku se vzájemně utvrzují v nejrůznějších bizarnostech…

Mně připadá alarmující, že dnes – kromě oblíbených a vytrvalých řečí, že covid je chřipečka a podobně – ožívají i opravdu divoké konspirační bludy, které se vyrojily v počátcích pandemie a pak naštěstí zapadly. Teorie o tom, že covid vymyslel Bill Gates, že se přenáší pomocí 5G a tak. To je podle mě hodně nebezpečná zpráva o tom, do jakého stavu se nálada v části společnosti dostala – a vinu na tom mají ti, kteří ta data mají a nepustí je ven.

Co říkáš na nedávné zprávy o tom, že ÚZIS odmítl poskytnout data o obsazenosti lůžek a volných kapacitách intenzivní péře v nemocnicích? (Bližší informace třeba zde, pozn. redakce).

Oficiální vysvětlení znělo, že jde o ochranu osobních údajů, ovšem zároveň zazněla i oblíbená argumentace o uklidňování veřejnosti, což, jak už jsem říkala, má podle všech dostupných informací kontraproduktivní účinek. Podle mě je to jedním slovem katastrofa – pro veřejnost, pro budoucí pacienty, pro zdravotnický personál, pro všechny. Já vůbec nechápu, čemu ÚZIS nerozumí na prosté skutečnosti, že tato data mají být k dispozici volně. Opět jde o politické rozhodnutí – u nás se politici rozhodli, že budou občanům data filtrovat podle svého uvážení.

Což je velký rozdíl třeba oproti Německu, kde se stejná data zveřejňují běžně

No samozřejmě. Politici jsou za informování veřejnosti zodpovědní, jenže zástupce občanů zvolený ve volbách není automaticky odborník na data nebo statistik, to je úplně jiná odbornost. Politika je služba veřejnosti a kvalitní služba znamená, mimo jiné, kvalitní informace. Pokud by je zveřejnili včas, ještě pořád se dá něco pro zlepšení situace dělat. Ale takhle možná míříme k opravdovým problémům.

Informovanější část veřejnosti a také samosprávy už dlouho volá po realistických, na datech založených plánech další akce – při jakém počtu nakažených nebo hospitalizovaných je dobré zavřít hospody nebo omezit akce, případně naopak, co takové opatření udělá s dalším vývojem epidemie a zda je lepší rušit koncerty nebo fotbalové zápasy. Existují dnes vůbec datové modely, které by se k tomu daly úspěšně použít?

Jistěže ano, v zahraničí jich vzniklo dost a jsou úspěšné, takže tu rozhodně nemusíme vymýšlet kolo a objevovat Ameriku, stačí je upravit na zdejší specifické prostředí. Pracují na tom třeba Jakub Steiner a další kolegové z institutu CERGE-EI, hodně aktivní je v tom třeba Daniel Münich, ostatně bývalý člen vládního poradního výboru, odkud ho vyhodil z titulu své tehdejší funkce profesor Prymula. A další spoustu práce v tom odvedl se svým týmem Jan Kulveit z Oxfordu. Změny v chování lidí pak zkoumá třeba sociolog Daniel Prokop. Problém je v tom, že vláda jejich modely dlouhou dobu nebrala vážně. Třeba se to teď změní, nevím. Každopádně lidé, co pracují s koronavirovými modely, se shodují v tom, jak moc je to drahé. Ekonomika se totiž uzavírá sama i bez vládních zásahů. A pak jsou tu kapacity nemocnic – jejich zahlcení je extrémně drahé a péči nemusí dostat ani lidé s jinými diagnózami, velmi vážnými. A další věc je zdraví nemocničního personálu. Můžeme mít volná lůžka, ale když nebude mít kdo léčit, protože zdravotnický personál skončí v karanténě, pacientům se pomoc opět nedostane.

Dobře, takže na jedné straně máme funkční datový model, na druhé nějaká dostupná data, byť nedostatečná. Dokážou nezávislí datoví analytici dát tyhle dvě části dohromady a udělat z nich nějakou prognózu nebo návrh, validní v současné době pro Česko?

To zatím přesně nevím, ale záhy by v tom mělo být jasno. Donedávna totiž ministerstvo nepouštělo data vůbec, ale teď – je to tak dva tři týdny – mají nezávislé organizace možnost požádat o data pro potřeby modelování. Musí vysvětlit, co jsou zač a proč ta data chtějí, ale ta možnost už tu konečně je. My o ten přístup usilovali a konečně jsme ho dostali, ale já ta data ještě neviděla, takže nevím, co všechno úřady zpřístupnily a co všechno se z těch dat dá vytvořit. Ale doufám, že použitelná jsou, a tudíž se veřejnost brzy dočká nějakých výstupů od expertů.

Související článek

Optické sítě se v Česku daří rozšiřovat i v době pandemie

Navzdory komplikovaným podmínkám v letošním roce pokračuje operátor T-Mobile s rozšiřováním otické sítě v Česku. Za první tři čtvrtletí roku 2020 operátor rozšířil pokrytí o dalších téměř 40 000 domácností. Do konce roku by mělo přibýt dalších více než 30 000, takže se celkové číslo bude blížit až k hranici 200 000 domácností, připojených k vysokorychlostnímu internetu T-Mobile.

Ale na ministerském webu jsou přece otevřená data ke stažení od začátku, sám profesor Dušek tím vždy argumentoval…

Jenže zatím ta čísla nebyla moc použitelná. Za prvé byla v průměru osm dní stará, což je při modelování a prognózování velký handicap, za druhé se do nich často zasahuje zpětně. Zkrátka bezcenné údaje, jak už jsem říkala. Ta nová data na vyžádání budou doufejme lepší.

Na závěr úplně prakticky: jak z hlediska datové analýzy vypadá současná situace v Česku? Ministr Prymula v pátek 25. září tvrdil, že je důvod k opatrnému mírnému optimismu, že se snad daří vyhnout exponenciální křivce. Má podle tebe pravdu?

Pokud bych vycházela z čísel na ministerském webu, pak asi ano, ten nárůst se od minulého týdne opravdu exponenciálně nezvedal. Jenže tady je jedno veliké ale: kapacita testování sice narostla, ale v podstatě je vyčerpaná a my nevíme, kolik nakažených uniklo podchycení. To je alarmující zejména v situaci, kdy různí praktičtí doktoři lidi od testování odrazují, i když mají třeba lehké příznaky. Takže já bych v tomhle směru byla velmi, velmi obezřetná.

Líbí se vám článek? Sdílejte ho:
link odkaz
Reklama