Big-Data-Tutorial für Anfänger: Alles, was Sie wissen müssen
Veröffentlicht: 2018-05-22Big Data als Konzept wurde in fast jedem Gespräch über digitale Innovationen, das Internet der Dinge (IoT) und datenwissenschaftliche Forschung erwähnt. Es gibt jedoch immer noch einige Verwirrung darüber, was genau dieser Begriff bedeutet. In diesem Big Data-Tutorial wollen wir alles klären, was Sie wissen müssen, bevor Sie mit Big Data beginnen.
Einfach ausgedrückt ist Big Data das Sammeln, Analysieren und Verarbeiten großer Mengen unterschiedlicher Daten, die aus mehreren Quellen stammen. Diese großen Datensätze können Einblicke in das menschliche Verhalten geben und Geschäftspraktiken, Strategien, Produktdesign, künstliche Intelligenz und mehr informieren. In diesem Big Data-Tutorial führen wir Sie durch die wichtigsten Konzepte und Terminologien rund um das Schlagwort.
YouTube-Video ansehen
Wir hoffen, dass Sie am Ende dieses Tutorials genügend Ideen haben, um Ihre ersten Schritte auf dem Weg zu Big Data zu unternehmen. Aber bevor wir in unserem Big-Data-Tutorial damit fortfahren, sehen wir uns den Unterschied zwischen Small Data und Big Data an.
Kleine Daten vs. Big Data
Der Umfang von Big Data ist durch den Vergleich mit Small Data leicht zu verstehen. Kleine Daten sind Informationen, die von einem einzelnen Computer oder mithilfe herkömmlicher Analysemethoden verwaltet werden können. Die Quelle und Auswirkung dieser Daten sind von kleinerem Umfang. Beispielsweise können Produktionsprotokolle verwendet werden, um wöchentliche Leistungsberichte über die Produktivität einer Fertigungslinie zu entwickeln; oder Umfrageergebnisse können in einem Marketingbericht zur Markenwahrnehmung verwendet werden.

Um die klare Unterscheidung zwischen den beiden Datentypen zu verstehen, müssen wir uns nur einige Statistiken ansehen – bis 2020 wird jeder Mensch auf der Erde 1,7 MB an Daten pro Sekunde erzeugen, die von über 50 Milliarden Geräten stammen, die mit dem Internet verbunden sind. Solch ein großes Datenvolumen aus fast ebenso vielen Quellen kann verwendet werden, um Geschäftsentscheidungen für ganze Branchen zu treffen, E-Commerce-Websites umzustrukturieren und sogar die Gesundheitsversorgung zu revolutionieren.
Big Data: Werkzeuge und Technologien, die man kennen mussNachdem Sie nun eine ungefähre Vorstellung davon haben, was Big Data ist, gehen wir in diesem Big Data-Tutorial noch einen Schritt weiter und sprechen über die Kernkonzepte.
Inhaltsverzeichnis
Big-Data-Merkmale
Wie verarbeitet man heterogene Daten in so großem Umfang, wo herkömmliche Analysemethoden definitiv versagen? Dies war eine der größten Herausforderungen für Big-Data-Wissenschaftler. Um die Antwort zu vereinfachen, stellte Doug Laney, Key Analyst von Gartner, die drei grundlegenden Konzepte zur Definition von „Big Data“ vor.
Volumen
Dies ist das Hauptunterscheidungsmerkmal, wenn es um Big-Data-Systeme geht. Jeder von uns hat einen digitalen Fußabdruck, und die Menge an Datensätzen, die von jedem unserer Geräte gesammelt werden können, ist verblüffend. Nehmen Sie zum Beispiel Facebook – im Jahr 2016 gab es 2,6 Billionen Beiträge auf der Social-Networking-Plattform. Twitter meldet sich mit 500 Millionen Tweets pro Tag an. Addieren Sie dies zu all den anderen digitalen Geräten, mit denen Sie verbunden sind, und es ist leicht zu verstehen, wie jeder Mensch auf dem Planeten durchschnittlich 0,77 GB Daten pro Tag generiert.
Geschwindigkeit
90 % der derzeit verfügbaren Daten wurden allein in den letzten zwei Jahren generiert. Jeden Tag werden 2,5 Billionen Bytes an Daten generiert, und diese Daten sollen in Echtzeit (oder nahezu in Echtzeit) verarbeitet werden, um Erkenntnisse zu gewinnen, die in einer sich ständig verändernden Welt nicht überflüssig werden. Aus diesem Grund haben sich Big-Data-Analysten von einem traditionellen Batch-orientierten Ansatz verabschiedet und Echtzeitanalysen eingeführt, um sicherzustellen, dass sie Informationen generieren, die für die aktuelle Situation relevant sind.
Vielfalt
Was Big-Data-Systeme für Unternehmen und Gemeinschaften so relevant macht, ist die Tatsache, dass es sich um einzigartige Datensätze handelt, da sie aus unterschiedlichen Quellen stammen und mit unterschiedlichen Methoden verarbeitet werden. Daten können aus Social-Media-Feeds, physischen Geräten wie Fitbit, Heimsicherheitssystemen, Auto-GPS-Systemen und mehr stammen. Die Daten selbst sind sehr unterschiedlich – es können Rich Media (Fotos, Videos, Audios) oder strukturierte Protokolle und unstrukturierte Daten sein. Der USP von Big Data besteht darin, dass es all diese Informationen, unabhängig von ihrer Herkunft, konsolidiert, um einen umfassenden Datensatz jedes Benutzers bereitzustellen.

Die drei Vs werden seit 2001 zur Unterscheidung von Big Data verwendet, aber die neuesten Narrative sprechen dafür, dieser Liste „Wahrheit, Visualisierung, Variabilität und Wert“ hinzuzufügen, was den Umfang der Big-Data-Analyse noch weiter erweitert.
Das war über die Eigenschaften von Big Data. Als Nächstes in diesem Big Data-Tutorial sprechen wir darüber, wie man diese Daten nutzbar macht und Erkenntnisse daraus ableitet.
Big Data-Anwendungen in der PopkulturWie macht man Big Data sinnvoll?
Der USP von Big Data ist die Vielfalt an Erkenntnissen, die gezogen werden können. Dies ist normalerweise nicht mit traditionellen Methoden möglich, da viele Erkenntnisse, Trends und Muster oft nicht offensichtlich sind. Darüber hinaus eignen sich kleine Datenanalysetechnologien nicht für die große Menge und Vielfalt von Inhalten, die durch Big-Data-Methoden generiert werden.
Um diese Barrieren zu überwinden, wurden verschiedene neue Technologien entwickelt – die beliebteste ist Apache Hadoop. Diese Technologien verwenden Clustered Computing, um Informationen in ein Datensystem aufzunehmen, die Daten zu berechnen und zu analysieren und die Datenströme zu visualisieren.
Big Data hat in jedem erdenklichen Bereich einen festen Platz gefunden und es wäre falsch, nicht über die Wunder zu sprechen, die Big Data vollbringt.

YouTube-Video ansehen
Lassen Sie uns dieses Big-Data-Tutorial abschließen, indem wir über die Anwendungen von Big Data sprechen:
Anwendungen von Big Data
- Persönliche Entwicklung: Auf individuellerer Ebene wird Big Data zur Optimierung der individuellen Gesundheit eingesetzt. Armbänder und Smartwatches verwenden Daten über Schlafzyklus, Kalorienverbrauch, Aktivitätsniveau und mehr, um Erkenntnisse zur Verbesserung der Gesundheit des Benutzers zu gewinnen, die auf personalisierte Weise an den einzelnen Benutzer zurückgegeben werden.
- Werbung: Marketingunternehmen nutzen eine Vielzahl von Datenpunkten, darunter GPS, Verkehrsmuster, Augenbewegungsverfolgung usw., um festzustellen, an welchen Anzeigen die Menschen mehr interessiert sind, und so eine genauere Marketingstrategie zu bestimmen. Dies ist ein Bruch mit der traditionellen Marketingstrategie, bei der die Preisgestaltung „pro Impression“ der Anzeige erfolgte.
- Lieferkettenoptimierung: Big Data spielt eine große Rolle bei der Optimierung von Lieferrouten (ein großes Anliegen für Unternehmen wie Amazon und eBay), bei der Live-Verkehrsdaten, Fahrerverhalten usw. mithilfe von Radiofrequenz-Identifikatoren und GPS-Systemen zur Identifizierung verfolgt werden je nach Tages- und Jahreszeit die richtige Route.
- Wettervorhersage: Anwendungen auf Mobiltelefonen werden verwendet, um Informationen über Wettermuster in Echtzeit zu sammeln. Durch die Verwendung einer Kombination aus Umgebungsthermometern, Barometern und Hygrometern können diese Apps genaue Echtzeitdaten für Vorhersagemodelle generieren, was die Genauigkeit von Wettervorhersagesystemen erheblich verbessern kann.
- Aufbau einer Smart-City-Infrastruktur: Städte erproben Big-Data-Analysesysteme, um eine Smart-City-Infrastruktur zu entwickeln. Das von Dürre heimgesuchte Kalifornien nutzte Big-Data-Analysen, um den Wasserverbrauch der Verbraucher zu verfolgen, was dazu beitrug, den Wasserverbrauch um 80 % zu senken. Los Angeles hat seine Verkehrsstaus um 16 % reduziert, indem Verkehrszeichen in der ganzen Stadt überwacht wurden.
Mit jedem Jahr, das vergeht, wird Big Data immer größer und festigt seinen Einfluss auf alle Bereiche. Wir hoffen, dass dieses Big-Data-Tutorial Ihnen helfen konnte, den Hype um das Wort „Big Data“ zu verstehen. Wenn Sie tiefer eintauchen möchten, gibt es zahlreiche Big Data-Tutorials, -Kurse und -Zertifizierungen, die Sie in Schwung bringen.
Warten Sie nicht länger, lassen Sie dieses Big Data-Tutorial der Funke sein, den Sie brauchen, um das Biest Big Data zu zähmen.
Wenn Sie mehr über Big Data erfahren möchten, schauen Sie sich unser PG Diploma in Software Development Specialization in Big Data-Programm an, das für Berufstätige konzipiert ist und mehr als 7 Fallstudien und Projekte bietet, 14 Programmiersprachen und Tools abdeckt und praktische praktische Übungen enthält Workshops, mehr als 400 Stunden gründliches Lernen und Unterstützung bei der Stellenvermittlung bei Top-Unternehmen.
Lernen Sie Softwareentwicklungskurse online von den besten Universitäten der Welt. Verdienen Sie Executive PG-Programme, Advanced Certificate-Programme oder Master-Programme, um Ihre Karriere zu beschleunigen.
