Termín Veľké dáta sa stále viac používa takmer všade na planéte - online a offline. A netýka sa iba počítačov. Je súčasťou priameho pojmu Informačné technológie, ktorý je súčasťou takmer všetkých ostatných technológií a oblastí štúdia a podnikov. Big Data nie je veľký problém. Nálada, ktorá ju obklopuje, je určite dosť veľká vec, ktorá vás zamieňa. Tento článok sa pozrie na to, čo je Big Data. Obsahuje tiež príklad toho, ako spoločnosť NetFlix využívala svoje údaje, alebo skôr Big Data, aby lepšie uspokojila potreby svojich klientov.
Čo je to Big Data
Údaje ležiace na serveroch vašej spoločnosti boli len údaje až do včera - zoradené a podané. Zrazu sa slog Big Data stal populárnym a teraz sú údaje vo vašej spoločnosti Big Data. Termín zahŕňa všetky údaje, ktoré vaša organizácia doteraz uložila. Zahŕňa údaje uložené v oblakoch a dokonca aj adresy URL, ktoré ste označili záložkou. Vaša spoločnosť nemusí digitalizovať všetky údaje. Nemusíte mať už štruktúrované všetky údaje. Ale potom všetky digitálne, papierové, štruktúrované a neštruktúrované údaje s vašou spoločnosťou sú teraz Big Data.
Stručne povedané, všetky dáta - či už sú kategorizované alebo nie - sú prítomné na vašich serveroch, sa nazývajú BIG DATA. Všetky tieto údaje je možné použiť na získanie rôznych výsledkov pomocou rôznych typov analýz. Nie je nutné, aby všetky analýzy používali všetky údaje. Rôzna analýza používa rôzne časti BIG DATA na vytvorenie potrebných výsledkov a predpovedí.
Veľké údaje sú v podstate údaje, ktoré analyzujete pri výsledkoch, ktoré môžete použiť na predpovede a ďalšie použitia. Pri používaní výrazu Big Data zrazu vaša spoločnosť alebo organizácia pracuje s najnovšou informačnou technológiou, aby odvodila rôzne typy výsledkov pomocou tých istých údajov, ktoré ste v priebehu rokov uchovávali úmyselne alebo neúmyselne.
Ako veľké sú veľké údaje
V podstate sú všetky údaje kombinované s Big Data, ale mnohí vedci súhlasia s tým, že Big Data ako taká nemožno manipulovať pomocou bežných tabuliek a bežných nástrojov správy databáz. Potrebujú špeciálne nástroje na analýzu, ako je Hadoop (budeme to skúmať v samostatnom príspevku), aby boli všetky dáta analyzované naraz (môžu zahŕňať iterácie analýzy).
Na rozdiel od vyššie uvedeného, hoci nie som odborníkom na túto tému, povedal by som, že údaje s organizáciou - veľkou alebo malou, organizovanou alebo neorganizovanou - sú pre túto organizáciu veľké údaje a organizácia si môže vybrať vlastné nástroje na analýzu dát.
Za normálnych okolností sa pri analýze údajov používajú ľudia na vytváranie rôznych súborov údajov založených na jednej alebo viacerých bežných poliach, takže analýza sa stáva jednoduchou. V prípade Big Data nie je potrebné vytvárať podmnožiny na analýzu. Teraz máme nástroje, ktoré dokážu analyzovať údaje bez ohľadu na to, aké obrovské sú. Pravdepodobne tieto nástroje sami kategorizujú údaje, aj keď ich analyzujú.
Považujem za dôležité uviesť dve vety z knihy "Big Data" od Jimmyho Gutermana:
“ Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”
-and-
“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”
Takže vidíte, že objem a analýza sú dôležitou súčasťou Big Data.
prečítať: Čo je dolovanie dát?
Veľké koncepty údajov
Toto je ďalší bod, v ktorom väčšina ľudí nesúhlasí. Niektorí odborníci tvrdia, že veľké dátové koncepty sú tri V:
- objem
- rýchlosť
- odroda
Niektorí ďalší pridávajú ešte niekoľko V k tomuto konceptu:
- vizualizácia
- Veracity (Spoľahlivosť)
- Variabilita a
- hodnota
Budem pokrývať pojmy Big Data v samostatnom článku, pretože tento príspevok je už veľký. Podľa môjho názoru sú prvé tri triedy V dostatočné na vysvetlenie pojmu Big Data.
Veľký príklad dát - Ako NetFlix použil na vyriešenie svojich problémov
V roku 2008 došlo k výpadku siete NetFlix, kvôli čomu veľa zákazníkov zostalo v tme. Zatiaľ čo niektorí stále mohli pristupovať k službám streamingu, väčšina z nich nemohla. Niektorí zákazníci sa podarilo získať ich prenajaté disky DVD, zatiaľ čo iné sa nepodarilo. Príspevok na blogu na Wall Street Journal hovorí, že Netflix práve začal on-demand-streaming.
Prerušenie spôsobilo, že manažment premýšľa nad možnými budúcimi problémami, a preto; obrátil sa na Big Data. Analyzovala oblasti s vysokou dopravou, vnímavými bodmi a priepustnosťou siete atď. Pomocou týchto údajov a pracovala na tom, aby znížila prestoje v prípade, že vznikne budúci problém, keď sa to stalo globálnym. Tu je odkaz na blog Wall Street Journal, ak si chcete pozrieť príklady Big Data.
Vyššie uvedené sumarizuje to, čo je Big Data v jazyku laika. Môžete to nazvať veľmi základným úvodom. Mám v pláne napísať ešte niekoľko článkov o súvisiacich faktoroch, ako sú - Koncepty, Analýza, Nástroje a využitie Big Data, Big Data 3 V atď. Medzitým by ste sa chceli pridat k vyššie uvedenému, napíšte komentár a zdieľajte us.