Samouczek Big Data dla początkujących: wszystko, co musisz wiedzieć

Opublikowany: 2018-05-22

Big Data, jako koncepcja, była przywoływana w prawie każdej rozmowie na temat innowacji cyfrowych, Internetu rzeczy (IoT) i badań nad nauką danych. Jednak nadal istnieje pewne zamieszanie co do tego, co dokładnie oznacza ten termin. W tym samouczku dotyczącym Big Data staramy się wyjaśnić wszystko, co musisz wiedzieć, zanim zaczniesz korzystać z Big Data.

Mówiąc najprościej, big data to gromadzenie, analiza i przetwarzanie dużych ilości różnorodnych danych pochodzących z wielu źródeł. Te duże zbiory danych mogą dostarczać wglądu w ludzkie zachowanie i informować o praktykach biznesowych, strategiach, projektowaniu produktów, sztucznej inteligencji i nie tylko. W tym samouczku dotyczącym Big Data przeprowadzimy Cię przez kluczowe pojęcia i terminologie związane z modnym słowem.

Obejrzyj wideo na youtube

Mamy nadzieję, że pod koniec tego samouczka będziesz miał wystarczający pomysł, aby postawić pierwsze kroki w podróży z Big Data. Ale zanim przejdziemy do tego w naszym samouczku Big Data, zobaczmy różnicę między małymi danymi a Big Data.

Małe dane a duże dane

Łatwo jest zrozumieć zakres big data poprzez porównanie z małymi danymi. Małe dane to informacje, którymi może zarządzać pojedyncza maszyna lub przy użyciu tradycyjnych metod analizy. Źródło i wpływ tych danych mają mniejszą skalę. Na przykład dzienniki produkcyjne mogą służyć do opracowywania cotygodniowych raportów dotyczących wydajności linii produkcyjnej; lub wyniki ankiet można wykorzystać w raporcie marketingowym dotyczącym postrzegania marki.

Aby zrozumieć wyraźne rozróżnienie między tymi dwoma typami danych, wystarczy spojrzeć na pewne statystyki — do 2020 roku każda osoba na Ziemi będzie generować 1,7 MB danych na sekundę, pochodzących z ponad 50 miliardów urządzeń podłączonych do Internetu. Tak duża ilość danych, z niemal tylu źródeł, może posłużyć do podejmowania decyzji biznesowych dla całych branż, restrukturyzacji witryn e-commerce, a nawet zrewolucjonizowania dostaw opieki zdrowotnej.

Big Data: narzędzia i technologie trzeba znać

Teraz, gdy masz już ogólne pojęcie o tym, czym są Big Data, przejdźmy ten samouczek dotyczący Big Data o krok dalej i porozmawiajmy o podstawowych koncepcjach.

Spis treści

Charakterystyka Big Data

Jak przetwarzasz heterogeniczne dane na tak dużą skalę, gdzie tradycyjne metody analityczne zdecydowanie zawodzą? To jedno z najważniejszych wyzwań dla naukowców zajmujących się big data. Aby uprościć odpowiedź, Doug Laney, kluczowy analityk firmy Gartner, przedstawił trzy podstawowe koncepcje definiowania „dużych danych”.

Tom

To główny wyróżnik, jeśli chodzi o systemy Big Data. Każdy z nas ma cyfrowy ślad, a ilość zestawów danych, które można zebrać z każdego z naszych urządzeń, jest oszałamiająca. Weźmy na przykład Facebooka – w 2016 r. na platformie społecznościowej było 2,6 biliona postów. Twitter loguje się za 500 milionów tweetów dziennie. Dodaj to do wszystkich innych urządzeń cyfrowych, do których jest podłączony, a łatwo zrozumieć, w jaki sposób każdy człowiek na planecie generuje średnio 0,77 GB danych dziennie.

Prędkość

90% obecnie dostępnych danych zostało wygenerowanych tylko w ciągu ostatnich dwóch lat. 2,5 trylionów bajtów danych jest generowanych każdego dnia i oczekuje się, że dane te będą przetwarzane w czasie rzeczywistym (lub prawie w czasie rzeczywistym), aby generować wgląd, który nie będzie zbędny w stale zmieniającym się świecie. Dlatego analitycy dużych zbiorów danych odeszli od tradycyjnego podejścia zorientowanego na partie i przyjęli analizę w czasie rzeczywistym, aby zapewnić, że generują informacje istotne dla bieżącej sytuacji.

Różnorodność

To, co sprawia, że ​​systemy big data są tak istotne dla firm i społeczności, to fakt, że są to unikalne zbiory danych, ponieważ pochodzą z różnych źródeł i są przetwarzane przy użyciu różnych metod. Dane mogą pochodzić z kanałów mediów społecznościowych, urządzeń fizycznych, takich jak Fitbit, systemy bezpieczeństwa w domu, samochodowe systemy GPS i nie tylko. Same dane są bardzo zróżnicowane — mogą to być multimedia (zdjęcia, filmy, nagrania audio) lub uporządkowane logi i nieustrukturyzowane dane. USP big data polega na tym, że konsoliduje wszystkie te informacje, niezależnie od ich pochodzenia, aby zapewnić kompleksowy zestaw danych każdego użytkownika.

Trzy V są używane do rozróżniania dużych zbiorów danych od 2001 roku, ale najnowsze narracje opowiadają się za dodaniem do tej listy „prawdziwości, wizualizacji, zmienności i wartości”, co jeszcze bardziej poszerza zakres analizy dużych zbiorów danych.

Chodziło o charakterystykę Big Data, a następnie w tym samouczku Big Data, porozmawiajmy o tym, jak sprawić, by te dane były wykonalne i uzyskać z nich wgląd.

Aplikacje Big Data w popkulturze

Jak nadać sens big data?

USP Big Data to różnorodność spostrzeżeń, które można wyciągnąć. Zwykle nie można tego zrobić tradycyjnymi metodami, ponieważ wiele spostrzeżeń, trendów i wzorców jest często nieoczywistych. Co więcej, małe technologie analizy danych nie nadają się do dużej ilości i różnorodności treści generowanych przez metody big data.

Aby pokonać te bariery, opracowano różne nowe technologie, z których najpopularniejszą jest Apache Hadoop. Technologie te wykorzystują klastrowe przetwarzanie danych do pozyskiwania informacji do systemu danych, obliczania i analizowania danych oraz wizualizacji strumieni danych.

Big Data znalazło mocne miejsce w każdej możliwej do wyobrażenia domenie i błędem byłoby nie mówić o cudach, jakie robi to Big Data.

Big Data: co to jest i dlaczego ma to znaczenie?

Obejrzyj wideo na youtube
Podsumujmy ten samouczek dotyczący Big Data, omawiając zastosowania Big Data:

Zastosowania Big Data

  • Rozwój osobisty: na bardziej indywidualnym poziomie, duże zbiory danych są wykorzystywane do optymalizacji indywidualnego zdrowia. Opaski na ramię i smartwatche wykorzystują dane o cyklu snu, zużyciu kalorii, poziomach aktywności i nie tylko, aby uzyskać wgląd w poprawę stanu zdrowia użytkownika, który jest informowany o indywidualnym użytkowniku w spersonalizowany sposób.
  • Reklama: firmy marketingowe wykorzystują różne punkty danych, w tym GPS, wzorce ruchu, śledzenie ruchu gałek ocznych itp., aby określić, które reklamy są bardziej zainteresowane, a tym samym określić dokładniejszą strategię marketingową. Jest to zerwanie z tradycyjną strategią marketingową, w której cena była ustalana „za wyświetlenie” reklamy.
  • Optymalizacja łańcucha dostaw: Big data odgrywa dużą rolę w optymalizacji tras dostaw (ogromne obawy firm takich jak Amazon i eBay), gdzie dane o ruchu na żywo, zachowanie kierowców itp. są śledzone za pomocą identyfikatorów częstotliwości radiowych i systemów GPS w celu identyfikacji właściwą trasę w zależności od pory dnia i roku.
  • Prognozowanie pogody: Aplikacje na telefony komórkowe są wykorzystywane do zbierania informacji o wzorcach pogodowych w czasie rzeczywistym. Korzystając z kombinacji termometrów otoczenia, barometrów i higrometrów, aplikacje te mogą generować dokładne dane w czasie rzeczywistym dla modeli predykcyjnych, co może znacznie poprawić dokładność systemów prognozowania pogody.
  • Budowanie infrastruktury inteligentnego miasta: Miasta pilotują systemy analizy dużych zbiorów danych w celu rozwijania inteligentnej infrastruktury miejskiej. Pogrążona w suszy Kalifornia wykorzystała analizy big data do śledzenia zużycia wody przez konsumentów, pomagając zmniejszyć zużycie wody o 80%. Los Angeles zmniejszyło zagęszczenie ruchu o 16%, monitorując sygnalizację świetlną wokół miasta.
Inżynierowie Big Data: mity kontra rzeczywistość

Z każdym mijającym rokiem Big Data staje się coraz większe i umacnia swoją kontrolę w każdej dziedzinie. Mamy nadzieję, że ten samouczek dotyczący Big Data był w stanie pomóc w zrozumieniu szumu kryjącego się za słowem „Big Data”. Jeśli interesuje Cię głębsze nurkowanie, istnieje wiele samouczków, kursów i certyfikatów dotyczących Big Data, które pomogą Ci dobrze funkcjonować.

Nie czekaj dłużej, niech ten samouczek Big Data będzie iskrą, której potrzebujesz, aby oswoić bestię, którą jest big data.

Jeśli chcesz dowiedzieć się więcej o Big Data, sprawdź nasz program PG Diploma in Software Development Specialization in Big Data, który jest przeznaczony dla pracujących profesjonalistów i zawiera ponad 7 studiów przypadków i projektów, obejmuje 14 języków programowania i narzędzi, praktyczne praktyczne warsztaty, ponad 400 godzin rygorystycznej pomocy w nauce i pośrednictwie pracy w najlepszych firmach.

Ucz się kursów rozwoju oprogramowania online z najlepszych światowych uniwersytetów. Zdobywaj programy Executive PG, Advanced Certificate Programs lub Masters Programs, aby przyspieszyć swoją karierę.

Opanuj technologię przyszłości — Big Data

Zaawansowany program certyfikacji w Big Data z IIIT Bangalore