Big Data – enormno skladište informacija

Sustav Big Data može se koristiti za različite ciljeve kompanije poput poboljšanja odnosa prema kupcima, ponude kvalitetnijih, prilagođenijih proizvoda i usluga, poboljšanja prodaje i rasta profita

Svatko tko danas prati trendove u industriji pohranjivanja, obrade i korištenja podataka, vjerojatno je čuo za pojam Big Data. Što je Big Data i čemu služi, pokušat ćemo opisati u ovom članku.

Također ćemo se osvrnuti na mogućnosti korištenja Big Data u sektoru maloprodaje uz primjere kako Big Data koriste neki veliki trgovci u svijetu.

PREPLAVLJENOST PODACIMA
Procjenjuje se da je u 2012. u svijetu kreirano, replicirano i korišteno ukupno 2,84 petabajta digitalnih podataka. Jedan petabajt (eng. Petabyte) sadrži milijun gigabajta podataka.

Za ilustraciju, jedan petabajt pjesama u mp3 formatu bi bez ponavljanja mogli slušati dvije tisuće godina. Također, jedan petabajt podataka je ekvivalent 223 tisuće DVD diskova.

Iduće godine, pak, smatra se kako će se u svijetu kreirati 6,12 petabajta podataka, i to ne računajući već postojeće podatke. Gledamo li ukupnu količinu digitalnih podataka u svijetu, procjena govori o nekih 3 zetabajta podataka (jedan zetabajt sadrži milijun petabajta).

Očito je da smo preplavljeni podacima te da se većina tih podataka ne analizira jer je to nepotrebno i gotovo nemoguće. Prema procjenama agencije IDC, tek je nešto manje od četvrtine svih digitalnih podataka potencijalno korisno za analizu, a stvarno se uspije analizirati tek pola posto podataka. Mnoštvo podataka se ne analizira zbog tri glavna razloga.

Prvi razlog je nedostatak hardverskih i softverskih resursa, odnosno njihova cijena. Ekstreman primjer je Amazon koji za podatke koristi više od 150 tisuća servera. Čuvanje i obrada velike količine podataka zahtijeva i skupu opremu.

Drugi razlog je nedostatak stručnjaka za upravljanje i obradu tako velike količine podataka. Sa sveučilišta tek u posljednje vrijeme dolaze kadrovi koji se educiraju za takve zahtjeve. Za obradu velikih količina podataka potrebni su stručnjaci za skladišta podataka, za datamining, textmining, strojno učenje, neuralne mreže itd.

Na kraju, jedan od problema predstavlja i nedostatak organizacijske strukture koja bi bila u mogućnosti koristiti Big Data analize.

Naime, kod spomenutih se analiza vrlo često radi o analizama koje se odvijaju u realnom (ili gotovo realnom) vremenu i na koje treba promptno reagirati.

3V MODEL
Kad se govori o Big Data, obično se spominje 3V model:
1. Volume – Volumen podataka. Big data je zaista puno podataka. Ne radi se o relacijskim bazama od tisuću – dvije zapisa već o skladištima podataka koja sadrže milijune informacija. Već je i samo pohranjivanje i pristupanje tim podacima problem zbog velike količine.

2. Variety – Raznolikost podataka. Dok su u “klasičnim” bazama podataka podaci obično dobro strukturirani, kod Big Data to ne mora biti slučaj. Big Data obuhvaća i neke postupke obrade i analize tekstualnih podataka (textmining) koji nisu strukturirani. Oko 50% podataka u Big Data sustavima je nestrukturirano. To konkretnije rečeno znači da umjesto uobičajenih unaprijed definiranih podataka, poput transakcijskih podataka o prodaji ili o kupcima, ovdje u sustav ulaze i različiti tekstualni podaci, slike i video zapisi. Podaci koji se koriste mogu biti interni ili iz eksternih izvora, prikupljeni izvan organizacije. Prema istraživanju IBM-a o korištenju Big Data tehnologije objavljenom ove godine, između 30 i 40 posto podataka koje organizacije koriste potječu iz vanjskih izvora.

3. Velocity – Brzina. Podatke se u Big Data paradigmi nastoji prikupljati, analizirati i prikazivati u realnom vremenu.

Uz navedena “3 V“ neki stručnjaci za Big Data navode i dodatnu, četvrtu značajku. Neki od njih navode “Verocity“ – vjerodostojnost, istinitost koja se odnosi i na same podatke i na procese analize podataka. Umjesto “Verocity” karakteristike neki pak stručnjaci navode “Value“ – Vrijednost kao četvrtu “V“ karakteristiku.

No, neovisno o tome čine li tri ili četiri karakteristike najvažnije značajke Big Data, činjenica je da takav sustav predstavlja veliki pomak u tretiranju podataka.

Sumirajući gore navedene karakteristike Big Data se može definirati kao sustav prikupljanja velikih količina različitih podataka pri čemu njihova obrada i analiza u realnom vremenu imaju svrhu ostvarivanja nekog organizacijskog cilja.

Taj organizacijski cilj može biti različito definiran, od poboljšanja odnosa prema kupcima, ponude kvalitetnijih, prilagođenijih proizvoda i usluga, poboljšanja prodaje, rasta profita itd.

ULAGANJE I POVRAT
Big Data prve su počele koristiti visoko tehnološki napredne tvrtke poput Googlea ili Amazona, no ubrzo su i ostale tvrtke u različitim sektorima počele uviđati potencijalnu korist od ulaganja u Big Data tehnologiju.

Agencija ABI Research procjenjuje kako će ove godine u svijetu organizacije u Big Data uložiti više od 30 milijardi američkih dolara, a iznos ulaganja će 2018. godine narasti do 114 milijardi dolara. Prema podacima revizorske i konzultantske tvrtke Deloitte, više od 90 posto od 500 najvećih tvrtki u svijetu koristi ili planira koristiti Big Data.

Prema IBM-ovim podacima, u Big Data najviše ulažu telekomunikacijske tvrtke, pružatelji turističkih usluga i usluga putovanja te financijski sektor, i to u prosjeku između 20 i 25 milijuna američkih dolara po tvrtki u 2012. godini. Maloprodajni sektor je pri dnu što se tiče ulaganja u Big Data s oko 5 milijuna dolara u 2012., tek nešto više od energetskog sektora. Što se tiče povrata investicija (ROI) tvrtke u prosjeku očekuju 45% povrata investicija u godini dana.

Big Data ne koristi samo komercijalni sektor. Potencijal Big Data uočen je i u javnom sektoru. Procjenjuje se kako bi potencijalne uštede efikasnim korištenjem Big Data tehnologija u javnom i državnom sektoru u Velikoj Britaniji mogle iznositi i do 30 milijardi funti.

U ovome području vjerojatno je najpoznatiji Googleov projekt Flu Trends koji u određenim državama u svijetu na temelju pojmova pretraživanja predviđa buduću pojavu žarišta i širenja gripe.

PRIMJERI U MALOPRODAJI
Iako Big Data nije raširen u maloprodaji kao u nekim drugim sektorima, uskoro se može očekivati značajnije širenje i u toj branši.

Dodatni poticaj širenju Big Data tehnologije predstavlja i širenje online kupnje, sve veća upotreba pametnih telefona i tableta, kao i društvenih mreža.

Prema podacima agencije Ipsos Puls svaki treći građanin Hrvatske stariji od 15 godina posjeduje smartfon, a 45% naših sugrađana koristi društvene mreže, najčešće Facebook. Ti postoci iz godine u godinu rastu, što ukazuje na dodatni motiv za uvođenje Big Data korištenja podataka.

Istraživanje koje je ove godine provela konzultantska kuća Brick Meets Click na uzorku stručnjaka u maloprodaji i trgovaca, kao glavne izvore podataka identificiraju podatke iz POS transakcija, podatke iz senzora u trgovinama i skladištima, porukama prikupljenih od kupaca te automatskog prepoznavanja proizvoda.

Jedan od najvećih svjetskih lanaca, američki Walmart jedan je od pionira uvođenja Big Data sustava općenito. Walmart u svojem sustavu kombinira javne podatke s podacima iz društvenih mreža te podatke o transakcijama kupaca.

Walmart je čak preuzeo nekoliko start-up tvrtki koje su se bavile Big Data tehnologijama kako bi razvili posebne softverske alate samo za Walmart. Na primjer, razvili su sustav koji prati aktivnost korisnika na društvenim mrežama i koji automatski identificira potrebe za kupnjom te u skladu s time šalje podatke o akcijama, cijenama i sl.

Neke od čestih primjena Big Data u maloprodaji su:
– Praćenje obrazaca kupnje i sklonosti kupaca određenim proizvodima u realnom vremenu
– Ciljano promoviranje i preporučivanje proizvoda u skladu s potrebama pojedinih kupaca
– Sprečavanje nestanka zaliha ili prekomjernih viškova na skladištima
– Predviđanje fluktuacija na tržištima pojedinih proizvoda
– Segmentiranje kupaca, kontaktiranje kupaca kroz kanal koji preferiraju kad se nalaze na određenoj lokaciji s ponudom koja im je baš tada potrebna ili koju žele.

Ovo su samo neke od mogućih i korištenih uporaba Big Data paradigme. Neke od njih zvuče jako sofisticirano, a donedavno su bile i izgledale nemogućima. Naravno, niti jedan sustav nije savršen pa tako određeni dio primjerice personaliziranih ponuda budu promašaji, no sustav je ipak bolji od slučajnog pogađanja. Osim toga, tehnologija i rješenja se vremenom usavršavaju.

Budućnost je svakako u Big Data usprkos nekima koji tvrde da se radi o prolaznom trendu. Možda će samo postati uobičajen pa se o tome neće puno pričati, ali Big Data stvarno puno obećava, a i uloženo je previše novca da bi završio kao promašaj.

Gordan Beraković
Stariji istraživač

Odgovori

Vaša adresa e-pošte neće biti objavljena. Nužna polja su označena s *