Tutorial Big Data pentru începători: tot ce trebuie să știți

Publicat: 2018-05-22

Big Data, ca concept, a fost evocat în aproape fiecare conversație despre inovațiile digitale, internetul obiectelor (IoT) și cercetarea în știința datelor. Cu toate acestea, există încă o confuzie cu privire la ceea ce înseamnă exact acest termen. În acest tutorial Big Data, ne propunem să clarificăm tot ce trebuie să știți înainte de a începe cu Big Data.

Mai simplu spus, big data reprezintă colectarea, analiza și procesarea unor cantități mari de date variate care apar din mai multe surse. Aceste seturi mari de date pot oferi perspective asupra comportamentului uman și pot informa practicile de afaceri, strategiile, designul de produse, inteligența artificială și multe altele. În acest tutorial Big Data, vă vom prezenta conceptele cheie și terminologiile din jurul cuvântului la modă.

Urmăriți videoclipul de pe youtube

Sperăm că până la sfârșitul acestui tutorial, veți avea suficientă idee pentru a face primii pași în călătoria Big Data. Dar, înainte de a trece la asta, în tutorialul nostru Big Data, să vedem diferența dintre datele mici și Big Data.

Date mici vs. Big Data

Este ușor de înțeles domeniul de aplicare al datelor mari prin comparație cu datele mici. Datele mici sunt informații care pot fi gestionate de o singură mașină sau prin utilizarea metodelor tradiționale de analiză. Sursa și impactul acestor date sunt la o scară mai mică. De exemplu, jurnalele de producție pot fi folosite pentru a elabora rapoarte săptămânale de performanță privind productivitatea unei linii de producție; sau rezultatele sondajului pot fi utilizate într-un raport de marketing despre percepția mărcii.

Pentru a înțelege distincția clară dintre cele două tipuri de date, tot ce trebuie să facem este să ne uităm la unele statistici - până în 2020, fiecare persoană de pe pământ va genera 1,7 MB de date pe secundă, provenite de la peste 50 de miliarde de dispozitive conectate la internet. Un volum atât de mare de date, din aproape tot atâtea surse, poate fi folosit pentru a informa deciziile de afaceri pentru industrii întregi, restructurarea site-urilor de comerț electronic și chiar revoluționarea furnizării de servicii medicale.

Big Data: trebuie să cunoașteți instrumentele și tehnologiile

Acum că aveți o idee aproximativă despre ce este Big Data, să ducem acest tutorial Big Data cu un pas mai departe și să vorbim despre conceptele de bază.

Cuprins

Caracteristicile Big Data

Cum procesați datele eterogene la o scară atât de mare, unde metodele tradiționale de analiză eșuează cu siguranță? Aceasta a fost una dintre cele mai importante provocări pentru oamenii de știință de date mari. Pentru a simplifica răspunsul, Doug Laney, analistul cheie al Gartner, a prezentat cele trei concepte fundamentale de definire a „big data”.

Volum

Acesta este principalul deosebitor atunci când vine vorba de sistemele Big Data. Fiecare dintre noi are o amprentă digitală, iar cantitatea de seturi de date care poate fi adunată de pe fiecare dintre dispozitivele noastre este uluitoare. Luați Facebook, de exemplu, în 2016, pe platforma de rețele sociale erau 2,6 trilioane de postări. Twitter se conectează la 500 de milioane de tweet-uri pe zi. Adăugați acest lucru la toate celelalte dispozitive digitale la care este conectat și este ușor de înțeles cum fiecare om de pe planetă generează în medie 0,77 GB de date, pe zi.

Viteză

90% din datele disponibile în prezent au fost generate numai în ultimii doi ani. În fiecare zi sunt generați 2,5 trilioane de octeți de date, iar aceste date sunt de așteptat să fie procesate în timp real (sau aproape în timp real), pentru a genera informații care nu vor fi redundante într-o lume în continuă schimbare. Acesta este motivul pentru care analiștii de date mari s-au îndepărtat de o abordare tradițională orientată pe loturi și au adoptat analiza în timp real pentru a se asigura că generează informații relevante pentru situația actuală.

varietate

Ceea ce face ca sistemele de date mari să fie atât de relevante pentru companii și comunități este faptul că acestea sunt seturi de date unice, deoarece provin din surse variate și sunt procesate folosind diverse metode. Datele pot fi obținute din fluxuri de rețele sociale, dispozitive fizice precum Fitbit, sisteme de securitate pentru casă, sisteme GPS pentru automobile și multe altele. Datele în sine sunt foarte diverse - ar putea fi rich media (fotografii, videoclipuri, audio) sau jurnale structurate și date nestructurate. USP-ul big data este că consolidează toate aceste informații, indiferent de originea lor, pentru a oferi un set cuprinzător de date pentru fiecare utilizator.

Cele Trei V au fost folosite pentru a distinge datele mari din 2001, dar cele mai recente narațiuni sunt în favoarea adăugării „verității, vizualizarii, variabilității și valorii” la această listă, ceea ce lărgește și mai mult sfera analizei datelor mari.

Acesta a fost despre caracteristicile Big Data, în continuare, în acest tutorial Big Data, să vorbim despre cum să facem aceste date funcționale și să obținem informații din acestea.

Aplicații de date mari în cultura pop

Cum să înțelegem datele mari?

USP-ul Big Data este varietatea de perspective care pot fi extrase. De obicei, acest lucru nu se poate face prin metode tradiționale, deoarece multe dintre perspective, tendințe și modele nu sunt adesea evidente. Mai mult, tehnologiile mici de analiză a datelor nu se pretează la volumul mare și varietatea conținutului generat prin metodele big data.

Pentru a depăși aceste bariere, au fost dezvoltate diverse tehnologii noi - cea mai populară fiind Apache Hadoop. Aceste tehnologii utilizează calculul în cluster pentru a ingera informații într-un sistem de date și pentru a calcula și analiza datele și pentru a vizualiza fluxurile de date.

Big Data și-a găsit un loc ferm în orice domeniu imaginabil și va fi greșit să nu vorbim despre minunile pe care le face acest Big Data.

Big Data: ce este și de ce contează?

Urmăriți videoclipul de pe youtube
Să încheiem acest tutorial Big Data vorbind despre Aplicațiile Big Data:

Aplicații ale Big Data

  • Dezvoltare personală: La un nivel mai individual, datele mari sunt folosite pentru a optimiza sănătatea individuală. Brațurile și ceasurile inteligente folosesc date despre ciclul de somn, consumul de calorii, nivelurile de activitate și multe altele pentru a dezvolta informații despre îmbunătățirea sănătății utilizatorului - care îi transmite utilizatorului individual într-un mod personalizat.
  • Publicitate: Companiile de marketing folosesc o varietate de puncte de date, inclusiv GPS, modele de trafic, urmărirea mișcării ochilor etc. pentru a determina ce reclame sunt mai interesate de oameni, determinând astfel o strategie de marketing mai precisă. Aceasta este o pauză față de strategia tradițională de marketing, în care prețul era „pe impresie” a anunțului.
  • Optimizarea lanțului de aprovizionare: Big data joacă un rol important în optimizarea rutei de livrare (o preocupare imensă pentru companii precum Amazon și eBay), unde datele de trafic în direct, comportamentul șoferului etc. sunt urmărite folosind identificatori de frecvență radio și sisteme GPS, pentru a identifica traseul potrivit de urmat, în funcție de momentul zilei și anului.
  • Prognoza meteo: aplicațiile de pe telefoanele mobile sunt folosite pentru a furniza informații despre tiparele vremii, în timp real. Folosind o combinație de termometre ambientale, barometre și higrometre, aceste aplicații pot genera date precise în timp real pentru modele predictive, care pot îmbunătăți considerabil acuratețea sistemelor de prognoză meteo.
  • Construirea infrastructurii orașului inteligent: orașele pilotează sisteme de analiză a datelor mari pentru a dezvolta infrastructura orașului inteligent. California, afectată de secetă, a folosit analiza de date mari pentru a urmări utilizarea apei de către consumatori, ajutând la reducerea consumului de apă cu 80%. Los Angeles și-a redus congestionarea traficului cu 16% prin monitorizarea semnalelor de trafic din jurul orașului.
Ingineri de date mari: mituri vs. realități

Cu fiecare an care trece, Big Data devine din ce în ce mai mare și își întărește controlul asupra fiecărui domeniu. Sperăm că acest tutorial Big Data a fost capabil să vă ajute să înțelegeți hype-ul din spatele cuvântului „Big Data”. Dacă sunteți interesat să vă scufundați mai adânc, există numeroase tutoriale, cursuri și certificări Big Data care vă vor ajuta să mergeți bine.

Nu mai așteptați, lăsați acest tutorial Big Data să fie scânteia de care aveți nevoie pentru a îmblânzi fiara care este big data.

Dacă sunteți interesat să aflați mai multe despre Big Data, consultați programul nostru PG Diploma în Dezvoltare Software Specializare în Big Data, care este conceput pentru profesioniști care lucrează și oferă peste 7 studii de caz și proiecte, acoperă 14 limbaje și instrumente de programare, practică practică. ateliere de lucru, peste 400 de ore de învățare riguroasă și asistență pentru plasarea unui loc de muncă cu firme de top.

Învață cursuri de dezvoltare software online de la cele mai bune universități din lume. Câștigați programe Executive PG, programe avansate de certificat sau programe de master pentru a vă accelera cariera.

Stăpânește Tehnologia Viitorului - Big Data

Program de certificat avansat în Big Data de la IIIT Bangalore