Big data – co to je?

Vyhodnocení správné funkce složitých systémů zasahujících více oborů, jakým je např. doprava, lze možné jen strojovým zpracováním velkého množství údajů z různých zdrojů. Využití těchto podkladů je perspektivní způsob budoucího správného i politického rozhodování.

city:one 21.4.2019 20:14 David Bárta Big data

Vycházím z předpokladu, že většina z Vás, čtenářů, je aktivními řidiči. Proto jsem si pro názorné vysvětlení termínu big data dovolil využít článku Andrewa Tolva, pravidelného přispěvatele Telematics update. Pojednává o velkých objemech dat v automobilovém průmyslu. Pokud si představíme, že namísto o vozidle se mluví o městě, vyplynou nám jednoznačné závěry: big data představují nástroj, díky němuž můžeme lépe porozumět reálným potřebám města, jeho občanů i systémů a efektivněji na ně reagovat. Velká data slouží jako objektivní statistický nástroj k vyhodnocování četnosti výskytu problémů i potřeb, s jejichž znalostí lze adekvátně, tedy úsporně a cíleně a včasně reagovat na změny v potřebách našich měst. O potenciálním rozvoji nových služeb pro občany a nových obchodních příležitostech ani nemluvě.

Průměrné vozidlo na dnešních silnicích generuje obrovské množství dat. Vozidlové senzory sledují vše od tlaku v pneumatikách přes otáčky motoru a teplotu oleje až po rychlost; vozidla tak mohou vyrábět kdekoli 5-250 GB dat za hodinu.

Pokročilé koncepty vozidel jdou ještě dál. Autonomní vozidla, například od Google, vytváří asi 1 GB dat každou sekundu. To je ekvivalent zasílání 200 000 textových zpráv či emailů nebo nahrání 100 digitálních fotografií ve vysokém rozlišení.

Drtivá většina těchto dat je používána v reálném čase pro kontrolu a podávání zpráv o funkcích vozidla a nemá žádnou reálnou dlouhodobou hodnotu. Přijetí tisíce zpráv od snímače, že „Tlak v pneumatikách normální!“ nepřináší žádný další prospěch, proto se automobilky neobtěžují ukládat tato data do paměti v autě nebo na server.

Nicméně některé údaje jsou cenné. A pokud lze takové informace sbírat od podstatné části z miliard dnes provozovaných automobilů, nepotřebujeme vyšší než základní znalost aritmetiky, abychom pochopili, proč velká data big data přitahují tolik pozornosti právě v automobilovém sektoru.

„Když se podíváte na ta čísla, není žádným překvapením, že o sběr velkých dat existuje velký zájem ze strany prodejců autopříslušenství (OEM),“ říká Henry Bzeih, vedoucí oddělení telematiky a infotainmentu v Kia Motors America. „Ale zájem projevují také společnosti, které nemají nic společného s výrobou a dodávkou OEM. Jde o firmy, které nabízejí řešení okolního ekosystému“.

A přesto, i přes množství dostupných dat a různých zainteresovaných stran (nemluvě o značném rozruchu v zahraničních médiích – u nás mrtvý klid, pozn. red.), se o velkých datech více hovoří, než se s nimi pracuje. „Srovnáme-li množství diskusí kolem využití velkých objemů dat, je skutečná míra zpeněžení stále velmi nízká,“ říká Robert Kempf, viceprezident Symphony Teleca, poskytovatele vývojářské platformy oceněného v roce 2013 za technologickou firmu roku od prestižní konzultační firmy Frost and Sullivan.

Jak mohou automobilky využít velká data?

Ponechme nyní stranou technické překážky spojené s analýzou velkých datových objemů a začněme úvahou, jaké využití velkých dat lze očekávat z pohledu automobilek.

Pro ilustraci uveďme příklad standardního modelu vozidla roku 2013 s informačním systémem v palubní desce. A pojďme si představit aplikaci na počasí, která zobrazuje aktuální předpověď. Naše imaginární řidička nastoupí v pondělí do auta, venku je zamračeno a chýlí se k dešti, přesto aplikace ukazuje slunečno, protože přestala fungovat, tzv. zamrzla. 

Ve světě, kde se velká data nepoužívají, lze v případě, že problém přetrvává, restartovat aplikaci skrze rozhraní, což udělá každý uživatel, který má stejný problém. Pokud by byl problém závažnější, kdyby například závada v palubním systému poskytujícím zábavu a informace způsobila nefunkčnost motoru, představovalo by to významnou finanční zátěž pro výrobce OEM a nepříjemnosti a zklamání na straně zákazníka. Velká data nebudou nutně dělat něco pro naši řidičku v pošmourném pondělním ránu. Umožní však lokalizaci problému, tzn. že OEM budou moci zjistit, zda k tomuto problému dochází v určitém regionu, nebo je to běžné ve všech regionech. Dále bude možné zjistit, zda závadě předchází konkrétní sled činností, nebo se jedná o určitý vzor poruch, což by umožnilo zjistit danou poruchu bez vlastní fyzické inspekce a následně efektivně svolávat konkrétní vozidla k odstranění závady. V tomto případě je možné, že naše řidička naladila jiný kanál na aplikaci internetového rádia, odtud pak šla na aplikaci počasí, a interakce těchto dvou aplikací nějak způsobila, že systém zamrzl.

„Velká data a prediktivní analytika umožňují rychlejší preventivní opatření“ říká Kempf „a mohou vést k možnosti řešit problémy pomocí jednoduché aktualizace softwaru automaticky a napřímo (tzv. over-the-air), nebo v rámci drobných oprav v průběhu návštěvy dealera s údržbou vozidla nebo alespoň ke stažení omezeného počtu vozidel, která jsou takto označena systémem.“

„To je něco, co jsme předtím neměli,“ říká Bzeih. „Funguje to v reálném čase a poskytuje to mnohem více a mnohem přesnějších informací, což vede ke zlepšování kvality.“ Nejedná se jen o lepší péči o zákazníka, ale i o snížení nákladů výrobce a lepší záruky.

Preference zákazníků

Velká data otevírají řadu dalších možností. Druhý příklad je využití velkých objemů dat k porozumění tomu, jak zákazníci své výrobky skutečně používají. Ve většině vozů jsou některé funkce přijímány bez povšimnutí, zatímco jiné jsou vysoce ceněny. „Prostřednictvím velkých objemů dat má OEM možnost dozvědět se mnohem více o tom, jak zákazníci vozidlo využívají a jaké jsou jejich preference,“ říká Kempf. „Prostřednictvím analýzy velkých dat mohou být získané údaje využity při plánování a vývoji dalších funkcí.“

„Právě sledování návyků konkrétní skupiny zákazníků, počtu jejich krátkých jízd v jeden den či dlouhých jízd o víkendech, nebo četnosti jízd v náročných zimních podmínkách, je pro automobilku užitečné, neboť může lépe cílit na konkrétní potřeby koncových zákazníků,“ říká Scott Mc Cormick, prezident Connected Vehicle Trade Association (CVTA) a poradce amerického ministra dopravy pro oblast technologického průmyslu.

Služby s přidanou hodnotou

Kromě toho se mohou výrobci začít věnovat dalšímu segmentu služeb pro své zákazníky. Jedná se o služby s přidanou hodnotou, které mohou cílit na konkrétní demografické skupiny v rámci své zákaznické základny. Tento druh personalizace již prostoupil webové nákupní portály, jako je Amazon.com. Ti, kteří používají službu pravidelně, dostávají doporučení vybraná podle toho, co si prohlíželi či koupili v minulosti, čímž významně mohou šetřit svůj čas. Výrobce vozidel může velká data využít stejně.

Obchodní zástupci cestující sami přes velká území se zcela jistě nebudou zajímat o zvýhodněné ceny nabízených filmů, naopak unavení rodiče jedoucí ke svým rodičům rádi využijí chvilky, kdy se jejich nezbedná dítka v zadních autosedačkách na hodinku uklidní. „V mnoha oblastech tak velká data mohou pomoci najít tu správnou cenu a ten správný cíl,“ říká Kempf.

Pojištění vozidla na bázi velkých dat

ím vytvářet nové zdroje příjmů. Nejznámějším příkladem je zde partnerství s pojistiteli, kteří by chtěli shromáždit konkrétní podmnožinu dat z automobilů – například rychlost, čas jízdy, prudkost brzdění a zatáčení – zjistit, jak řidiči skutečně řídí, spíše než založit svůj výpočet rizika na mnohem méně spolehlivých zdrojích, jako je jejich věk nebo stav kreditu. Pojišťovny v USA i Evropě již přicházejí na trh s náhradními řešeními, která umožňují sběr těchto údajů.

„Stále více a více výrobců vozidel nabízí pojišťovací služby prostřednictvím svých partnerů a je tedy více zájemců o údaje, které jim mohou poskytnout dostatečné podrobnosti k výpočtu rizika,“ říká Kempf.

Profit třetích stran

Dalším příkladem, jak z velkých dat profitovat, je, že výrobci mohou prodávat svá velká data zainteresovaným třetím stranám. Například americká pošta (US Postal Service) vyčíslila cenu za svá velká data a umožňuje organizacím přístup k Národní databázi změn adresy za 175 000 dolarů ročně. Pro výrobce automobilů může takový přístup spíše otevřít problém o ochraně osobních dat, který by asi nechtěli řešit, ale například pro pojišťovny nebo inzerenty budou velká data v automobilovém průmyslu nadále velmi lákavá.

„Má automobilka použít a prodat všechny své informace?“ ptá se McCormick a sám odpovídá. „Ne, ale potřebuje pochopit, o co jde, co že to vlastně mají. A následně je mohou prodat, nebo je mohou používat pro své účely. Mohou porozumět diagnostice, bezpečnosti a kvalitě v takové míře, jako nikdy předtím. Velká data totiž otevírají všechny tyto cesty.

Vyčíslení přínosů

Společnost Cisco nedávno spočítala, že finanční přínos velkých dat se pro výrobce vozidel bude blížit 300 dolarům na vozidlo a rok. Většina z této částky pochází z nižších nákladů na záruční servis a vylepšeného návrhu celého konceptu. V téže analýze se dospělo k závěru, že velká data pomohou řidičům ušetřit částku ve výši 500 dolarů ročně, a to díky lepší navigaci a inteligentnějšímu vedení vozidla.

Tři sta dolarů za vozidlo za rok by mohlo mít značný dopad na výrobní strategii vozidel, a to zejména na současném stagnujícím trhu. A přesto, navzdory těmto slibným číslům, jen několik málo výrobců automobilů využilo příležitosti svoje velká data zpeněžit (stejné rezervy jsou i na straně měst, následující příklad automobilky General Motors jen dokládá, že vědět, že něco nefunguje, například analogicky k oznámením o dopravní zácpě, koncovým uživatelům moc nepomůže).

Společnost General Motors, osvědčený lídr v chytrých vozidlových systémech a majitel jedněch z největších datových sad v průmyslu, používá své datové úložiště OnStar na to, aby se dozvěděl více o svých zákaznících. To samo o sobě zní slibně. Po tomto PR následovalo vyjádření dalšího zástupce GM, který řekl, že velká data jsou velkou prioritou a že hlavním cílem bylo „demystifikovat kontrolní žárovku motoru“ – jinými slovy říkat lidem to, co se vlastně děje, když se kontrolka motoru rozsvítí.

To je nepochybně přínosem pro zákazníka, ale je to také rozhodně případ malých dat (pomáhá zákazníkovi na individuální úrovni) spíše, než velkých dat (kombinace stavů desítky tisíc kontrolek motoru k rychlé identifikaci trendu a reakce na něj).

Cílem příkladu není znectít GM. Jedná se o snahu ukázat rozdíl na průkopníkovi velkých dat mezi tím, co výrobci vozidel o velkých datech říkají, a co s nimi ve skutečnosti vlastně dělají. „Srovnáme-li množství diskusí kolem velkých objemů dat a možnosti, které lze uplatnit, je skutečná míra zpeněžení stále velmi nízká,“ říká Kempf.

Velké výzvy velkých dat

Část problému je i technická. Kvůli shromáždění údajů pro výrobce automobilů je dnes nutné čekat na řidiče, až se svými vozy přijedou do servisu, jehož technici mají přístup k datům prostřednictvím palubního diagnostického systému. Ale ne všichni řidiči nechávají svá auta seřizovat pravidelně, například po 15 000 ujetých kilometrů, což znamená, že analýza dat ze všech provozovaných vozidel neprobíhá kontinuálním a proaktivním způsobem, a dosažení takového způsobu je stále výzvou.

S příchodem vozů připojených do internetové sítě mohou automobilky aktualizací softwaru a konfigurací správy „on-line“ mít plný přístup k datům z vozu kdekoliv a kdykoliv, takže je analýza těchto dat jednodušší a schůdnější. Ale dokud nebudou tyto stále připojené vozy tvořit většinu provozovaných aut, budou velká data spíše malými daty. „A jak to souvisí s výrobci vozidel? První věc, kterou musíme udělat, je představit připojené auto zákazníkům,“ říká Henry Bzeih, vedoucí telematiky a infotainment v Kia Motors America. „To je první krok. Krokem druhým je dosažení kritického množství takto připojených vozů, a pak se můžeme ptát, co můžeme dělat s velkými daty.“ (A totéž platí i pro města, představit dostupné technologie je úkolem tohoto časopisu; následně půjde o schopnost v krátkém čase tyto detekční technologie nasadit v adekvátním měřítku).

„Město/automobilka potřebuje pochopit, o co jde, co že to vlastně mají. Mohou porozumět diagnostice, bezpečnosti a kvalitě v takové míře, jako nikdy předtím. Velká data totiž otevírají všechny tyto cesty.“

Investiční překážky

Potenciální problém spočívá ve značné velikosti investic, jež příprava velkých objemů dat na zpracování vyžaduje, a to dlouho předtím, než přinesou nové zdroje příjmů a úspory.

Další výzvou je skladování dat. Existuje spousta společností poskytujících datové sklady a analýzy dat, pro ilustraci Teradata, IBM a Aster. Ale ony přicházejí s vysokou cenou. „Není jen drahé data skladovat, je až příliš drahé data ukládat,“ říká Alex Varshavsky, zakladatel a ředitel společnosti Talksum.

Automobilky mohou zvolit, ukládat a analyzovat data v datovém domě. Zkušenosti, jak to udělat, se ale velmi liší podle toho, co výrobci v minulosti vybudovali ve svých interních systémech. Proto musí automobilky buď investovat do outsourcingu analýz, správy a skladovacích kapacit, nebo do jejich interního řešení.

Ochrana soukromí a bezpečnost dat

Závěrečná úvaha se týká bezpečnosti a soukromí. „Chcete-li uložit jakákoliv data, budete muset mít nějaký mechanismus, jak je získávat a jak používat,“ říká McCormick. „Jakmile budete mít tento mechanismus, vytvořili jste bránu, kterou mohou ostatní zneužívat.“ To představuje potenciální obavy z konkurence, že data budou „ukradena“. Pokud jste automobilka, nechcete umožnit konkurenci, aby mohla zjistit diagnostické informace mimo fyzický prostor auta a spustit tak srovnávací reklamy,“ říká.

To také vytváří obavy z terorismu nebo hackerských útoků. Například studie z Washingtonské univerzity nebo Kalifornské univerzity v San Diegu, ve kterých vědci popisovali, jak byli schopni proniknout do zpráv zasílaných čidly tlaku v pneumatikách a pozměnit jejich obsah tak, že si řídicí systém vozidla myslel, že jsou vypuštěné. 

„Teoreticky můžete přeprogramovat auto, když je zaparkováno. Pak zahájíte program pomocí vysílače na dálnici,“ uvedl vedoucí výzkumného týmu Tadayoshi Kohno v rozhovoru pro časopis Vanity Fair. „Auta jedoucí kolem „teroristy“ mohou být ovládnuta skrze dálniční vysílač jeho smartphonem, který odešle iniciační kód – a bum! Auto vypne v rychlosti 70 kilometrů za hodinu a havaruje, aniž by se ho terorista vůbec dotknul.“

Cesta vpřed

Počítat s možností těchto hrozeb je základ. Proto je i pochopitelné, proč automobilky zaujímají opatrný postoj vůči masivnímu nasazení systémů velkých dat. Všichni odborníci dotazovaní v tomto článku se ale shodli, že všechny automobilky využijí příležitostí pramenících z velkých dat do roku 2020. Cesta vpřed se tedy zdá být poněkud nejasná.

Jeden z nejlepších způsobů, jak postoupit, je začít jednoduše.“ Při pohledu na všechny ty údaje ve vozidle, je nutné zapomenout na svět dat,“ říká McCormick, „a soustředit se na jednoduché základní potřeby a možnosti, co lze udělat hned, kam můžete až zajít, jakou přidanou hodnotu můžete z dat získat co nejefektivněji. Postupně a jistě, po malých krocích, než začínat s tímto masivním mračnem údajů, jež by Vás nakonec přemohly svou složitostí.“

Dobrým nápadem se jeví také používat služeb třetích stran, které pomáhají definovat klíčové příležitosti pro zlepšení služeb, jako je například optimalizace datového skladu.

Hodnota partnerství

Vhodná forma partnerství je také klíčem k úspěchu. Automobilky si byly v minulosti docela mizernými partnery navzájem, vzhledem k jejich neochotě ukázat své karty, zvláště v něčem tak interním, jako jsou jejich data. Bzeih poukazuje na pravděpodobnost toho, že výrobci automobilů skončí u používání velkých datových sad, které jsou si velmi podobné. „Jaký je rozdíl mezi Fordem nebo Kia z hlediska dat? Pokud se jedná o surová data, jsou skoro stejná. Máme co do činění se standardními sadami zpráv, čtení zpráv mimo sběrnici CAN, sběr najetých kilometrů vozidla atp. To je standard v každém autě.“

Partnerství na obecné úrovni by proto mohlo pomoci urychlit proces pro každého. „Každý říká, „Sejdeme se a budeme diskutovat“, ale zde nevidím nic konkrétního pro skutečnou spolupráci,“ říká Bzeih. „Dalším krokem je tak budování těchto silných partnerství, které umožní zákazníkům těžit z cenných informací získaných na základě analýz a zpracování velkých objemů dat.

Epilog

Analogie automobilového průmyslu je laicky srozumitelná. I našim městům tak doporučujeme hlavně začít. Tedy začít postupně využívat, a tím i poznávat výhody využívání velkých dat pro provoz svých systémů i služeb svým občanům. Kromě vlastního zájmu a iniciativy však pokládám za důležité naposledy zmiňované partnerství. Investice do odborné přípravy se mnohonásobně vrátí, nicméně si žádá odvahu úředníků a politiků stávající mechanismy změnit a dát prostor novým přístupům. Jistě mi dáte za pravdu, že týdenní „ruční“ dopravní průzkum se nemůže vyrovnat sebraným údajům o pohybu vozidel a lidí za půl roku a že analýza mnoha datových sad přinese přesnější a statisticky významnější informace s větším potenciálem využití.

Časopis city:one

Objednejte si doručování našeho časopisu přímo do Vašich rukou

Objednat

Máte chytrý
projekt?

Realizovali jste nebo se podíleli na projektu pro chytrá města? Podělte se s ostatními.

Vložit projekt

Jste odborník na chytrá města?

Umíte pomoct s budováním chytrých měst? Dejte o sobě vědět!

Vytvořit profil

Máte řešení
pro chytrá města?

Ukažte své produkty a služby pro chytrá města.

Vložit řešení