Je Česká republika vege friendly?

Klarafeifer
7 min readMay 28, 2023

Autorky projektu: Klára Feiferová, Veronika Feltová
Mentoři: Lenka Hankovcová, Petr Holík, Filip Lavacca (Billigence)

O autorkách

Ahoj! Jsme Klára a Verča, obě jsme rodilé Pražačky a Prahu milujeme, rády cestujeme, ale co nás opravdu spojilo, byl náš zájem o dobré jídlo, především to vege. Na začátku kurzu jsme měly pouze minimální zkušenosti s IT, ale i přesto, že jsme nedávno po škole, cítily jsme, že bychom se chtěly ještě dále vzdělávat.

Cíle projektu

Naším hlavním cílem bylo zjistit, nakolik je Česká republika vege friendly, tedy jak přívětivá je k veganům a vegetariánům. Jako hlavní faktory jsme považovaly například počty veganských a vegetariánských restaurací v ČR, jejich geografické rozložení nebo srovnání hodnocení a cen. Dále jsme se chtěly zaměřit na stereotypní názor, že jíst rostlinně je moc drahé, a tudíž pro mnoho lidí nedostupné. Je tomu opravdu tak?

Naším posledním cílem pak bylo zjistit, jak vypadá typický veganský či vegetariánský konzument v České republice a zda je v jednotlivých krajích větší nabídka rostlinných a bezmasých restaurací, nebo poptávka po nich.

Naše cesta…

Přes některé nesouhlasné názory jsme se rozhodly nepřistupovat k projektu pouze na základě dostupných dat. Pro nás bylo prioritou zvolit téma, které nás obě zajímá a baví. Dostupnost a kvalitu dat jsme řešily až následně.

Výběr tématu a hledání dat

Během exkurze v Apify si Verča vyscrapovala dataset o veganských restauracích v Praze, a tak nás později napadlo, že by se z toho mohlo stát téma našeho projektu. Spojovalo se v něm totiž vše, co máme obě rády: vege jídlo a Praha. Ve výběru tématu nás následně utvrdil i náš budoucí mentorský tým, který naše nápady podpořil.

Původní veganský dataset jsme ale později vyměnily za dataset se všemi restauracemi, abychom mohly porovnat klasické oproti těm veganským a vegetariánským. Kvůli malému množství dat jsme pak ještě Prahu rozšířily na celou Českou republiku.

Protože jsme chtěly analyzovat i počty veganských a vegetariánských strávníků a nepodařilo se nám získat data z ČSÚ, využily jsme již vyplněné anonymní dotazníky z internetu, které se zaměřovaly na životní styl a stravování respondentů.

Následně napadlo naše mentory rozšířit analýzu o informaci, zda jsou jednotlivé podniky součástí Gastromapy Lukáše Hejlíka. Ten však na naši prosbu o poskytnutí dat neodpověděl, a tak jsme nakonec s pomocí koučů potřebná data vyscrapovaly samy v Pythonu.

Náš hlavní dataset jsme získaly vyscrapováním dat o restauracích v ČR z Google Maps, s čímž nám pomohlo Apify. Dotazníky o českých konzumentech jsme pak získaly stažením csv souborů z webové stránky vyplnto.cz. Po otevření všech souborů jsme ale zjistily, že ta pravá zábava teprve začíná, a tak začalo čištění dat.

Čištění dat

Čištění dat pro nás bylo poměrně obsáhlou a časově náročnou kapitolou. Dataset se totiž nacházel v horším stavu, než jsme zpočátku předpokládaly.

Hlavní tabulkou se stala ta se všemi restauracemi, dále jsme vytvořily dimenzní tabulky s typy restaurací (klasické, vegetariánské a veganské), geografickými údaji (kraj, obec, okres, PSČ) a počty obyvatel po krajích. Dalšími doplňujícími tabulkami pak byla tabulka s dotazníky a tabulka s restauracemi z Hejlíkovy Gastromapy.

Pro počáteční úpravy datasetu jsme použily Python. S jeho pomocí jsme zkrátily příliš dlouhé názvy některých sloupců a odstranily přebytečné sloupce. Tyto úpravy jsme provedly na základě následujícího kódu:

Odstranění příliš dlouhých názvů sloupců
Odstranění nadbytečných sloupců

Většinu dat jsme vyčistily s pomocí SQL. Nejdříve jsme potřebovaly rozhodnout, které informace se nám budou hodit a které naopak ne. Vytvořily jsme naši hlavní tabulku s restauracemi a i všechny potřebné dimenzní tabulky. Odstranily jsme z datasetu podniky, které neměly s restauracemi nic společného, stanovily čtyři cenové kategorie, na základě příkazu alter table přidaly sloupec pro vyhledávání nonstopů a odstranily veškeré duplicity. Dále jsme například pročistily formát poštovních směrovacích čísel a přes left join na ně napojily i ostatní geografické údaje jako názvy krajů, okresů a obcí.

Ukázka vybraných scriptů:

Vytvoření hlavní tabulky restaurací
Čištění PSČ

Naším hlavním problémem u dotazníků bylo, že se v každém z nich vyskytovaly trochu jiné informace. Navíc jsme nemohly ovlivnit ani to, kolik respondentů daný dotazník vyplnilo, což nám zabránilo v získání rovnoměrného vzorku pro všechny kategorie respondentů. Nakonec jsme ve všech sesbíraných dotaznících ponechaly pouze ty sloupce, které byly pro všechny soubory společné. Jejich obsah jsme opět pročistily v SQL a výsledný soubor pak napojily do Tableau.

K čemu jsme došly

Ještě než se pustíme do popisování našich výsledků, rády bychom poukázaly na fakt, že naše data bohužel nemají stoprocentní vypovídací hodnotu. Nejsme si jisté, zda je to tím, že se nám nepodařilo vyscrapovat všechno, a nebo že na Google Maps nelze nalézt zcela všechny české restaurace s aktualizovanými informacemi. Na základě získaných dat jsme však došly k následujícím výsledkům.

1. dashboard — Přehled

Náš první dashboard jsme věnovaly obecnému přehledu toho, jak si veganské a vegetariánské restaurace stojí oproti restauracím klasickým. Zde bychom také rády podotknuly, že jako veganské a vegetariánské restaurace jsme braly ty, které nabízejí veganské a vegetariánské možnosti, ale nejsou čistě vegetariánské nebo veganské.

Klasických restaurací je v ČR většina, tedy 91 % (celkem 20 742 restaurací). Naopak vege restaurací máme dle našeho datasetu pouhých 9 % (2 054 restaurací). Jako typický vege konzument se pak ukázaly být ženy ve věku 21–25 let.

Dále jsme se podívaly na rozdělení restaurací po krajích. Jak jsme předpokládaly, na prvním místě se umístila Praha, ve které se dle Google nachází 252 veganských a vegetariánských restaurací (22,2 %). Na druhém místě se umístil Středočeský kraj, ve kterém je sice celkově restaurací více (312), ale těch s bezmasými možnostmi je pouhých 10,2 %. Třetí místo pak obsadil Královéhradecký kraj s 9,5 % vege restaurací.

K zajímavějším výsledkům jsme pak došly při přepočtu vege restaurací na 100 tisíc obyvatel. K tomu jsme v Tableau vytvořily kalkulované pole, aby bylo možné mezi sebou velikostně rozdílné kraje porovnávat. Jako nejvíc vege přívětivý kraj se překvapivě neukázala být Praha, ale Karlovarský kraj s necelými 27 vege restauracemi na 100 tisíc obyvatel. V závěsu se pak umístil kraj Královéhradecký a Liberecký.

Poslední graf ukazuje Top 5 restaurací dle hodnocení, kde jsme braly v úvahu pouze podniky, které mají nad 1000 hodnocení. Ultimátně nejvíce a nejlépe hodnocenou restaurací v Česku je podle našich dat Hostinec Vystřelený Vočko v Klatovech.

2. dashboard — Cena & hodnocení

Na druhém dashboardu jsme se zaměřily na cenu a hodnocení restaurací. Zjistily jsme, že i když je průměrná cena veganských a vegetariánských restaurací o trochu vyšší, nejedná se o nijak dramatický rozdíl. Poměrně populární názor, že jíst zdravě (a rostlinně) je moc drahé, se nám tedy podařilo úspěšně vyvrátit.

Co se pak týče průměrného hodnocení, i zde si veganské a vegetariánské restaurace vedly dobře. Data ukázala, že tyto podniky hodnotí jejich návštěvníci lépe, než restaurace klasické.

Nakonec jsme se zaměřily na poměr “cena výkon”. Nejlevnější a nejlépe hodnoceným vege podnikem se stala Haťská kavárna v Opavě a dále GÁBL bistro v Pelhřimově.

3. dashboard — Nadji si svou restauraci

Náš třetí dashboard jsme pojaly interaktivně: Najdi si svou restauraci! Zde je možné si vyfiltrovat restaurace podle jejich typu a geografického umístění, zda mají otevřeno nonstop či jestli jsou ověřené Lukášem Hejlíkem. Pokud si tedy chcete najít restaurace v místě svého bydliště, vydat se po stopách gastro gurmána Lukáše Hejlíka, nebo dokonce dostanete chuť na sójový párek ve tři hodiny ráno, go for it!

U Hejlíkových restaurací se nám bohužel k našemu datasetu nepodařilo napojit kompletně všechny jeho restaurace. Největším úskalím se staly hlavně rozdílné názvy restaurací v Gastromapě oproti Google Maps a tedy chybějící primární klíč. Nakonec jsme oba datasety napojily přes webové adresy.

Závěr

Vegetariánství a veganství může pro některé lidi představovat poměrně kontroverzní či citlivé téma. A i když není vždy jednoduché se o něm bavit, myslíme si, že je to vzhledem k výrazně se zhoršující klimatické situaci důležité.

Podle výzkumné agentury Ipsos je v České republice asi 10 % vegetariánů a 4 % populace se stravují vegansky. Naše data navíc ukázala, že vege restaurací je v Česku pouze zhruba 9 %. Je tedy zřejmé, že zájem o vege jídlo v naší zemi je, a díky větší poptávce se zde naskýtá prostor pro současné i budoucí podnikatele k otevírání nových vege podniků.

Rozdělení práce

Na všech částech projektu jsme pracovaly společně. Práci jsme si dělily spíše na základě tématického okruhu než toho technického. Verča strávila více času s dotazníky a otevíracími hodinami, Klára naopak s hlavní tabulkou a geografickými údaji.

Kromě získání spousty technických dovedností si myslíme, že jsme se během projektu naučily hlavně to, jak pracovat s chybami a nejrůznějšími errory. Naučily jsme se také to, že nemůžeme vědět všechno, a že je v pořádku říct si o pomoc. Akademie nás celkově dost zocelila a změnila náš dosavadní mindset.

Poděkování

Chtěly bychom moc poděkovat našim mentorům z Billigence: Lence Hankovcové, Petru Holíkovi a Filipu Lavaccovi za jejich čas a trpělivost, všechny konstruktivní komentáře a celkově moc příjemné vedení projektu. Dále bychom rády poděkovaly všem koučům a mentorům a Terce Szkatulové za organizaci.

Na závěr bychom také chtěly poděkovat samy sobě a i jedna druhé.

Zdroje:

https://www.czso.cz/csu/czso/pocet-obyvatel-v-obcich-k-112022

https://www.vyplnto.cz/

https://www.csvv.cz/

https://www.ipsos.com/cs-cz/desetina-cechu-preferuje-stravu-s-vyloucenim-ci-omezenim-masa

https://www.ceskaposta.cz/ke-stazeni/zakaznicke-vystupy

--

--