初心者のためのビッグデータチュートリアル:あなたが知る必要があるすべて
公開: 2018-05-22ビッグデータは、概念として、デジタルイノベーション、モノのインターネット(IoT)、およびデータサイエンス研究に関するほぼすべての会話で喚起されてきました。 ただし、この用語が正確に何を意味するのかについては、まだ混乱があります。 このビッグデータチュートリアルでは、ビッグデータを使い始める前に知っておく必要のあるすべてのことを明確にすることを目的としています。
簡単に言えば、ビッグデータとは、複数のソースから発生する大量のさまざまなデータの収集、分析、および処理です。 これらの大規模なデータセットは、人間の行動に関する洞察を提供し、ビジネス慣行、戦略、製品設計、人工知能などに情報を提供できます。 このビッグデータチュートリアルでは、流行語に関する主要な概念と用語について説明します。
YouTubeビデオを見る
このチュートリアルの終わりまでに、ビッグデータの旅の最初の一歩を踏み出すのに十分なアイデアが得られることを願っています。 ただし、ビッグデータのチュートリアルに進む前に、スモールデータとビッグデータの違いを見てみましょう。
スモールデータとビッグデータ
小さなデータと比較することで、大きなデータの範囲を簡単に理解できます。 小さなデータとは、単一のマシンで、または従来の分析方法を使用して管理できる情報です。 このデータの出典と影響は小規模です。 たとえば、生産ログを使用して、製造ラインの生産性に関する毎週のパフォーマンスレポートを作成できます。 または調査結果は、ブランド認知に関するマーケティングレポートで使用できます。

2種類のデータの明確な違いを理解するには、いくつかの統計を確認するだけです。2020年までに、インターネットに接続された500億台を超えるデバイスから、地球上のすべての人が1秒あたり1.7MBのデータを生成するようになります。 ほぼ同じ数のソースからのこのような大量のデータは、業界全体のビジネス上の意思決定、eコマースサイトの再構築、さらには医療提供に革命をもたらすために使用できます。
ビッグデータ:ツールとテクノロジーを知っている必要がありますビッグデータとは何かについて大まかに理解できたので、このビッグデータチュートリアルをさらに一歩進めて、コアコンセプトについて説明しましょう。
目次
ビッグデータの特徴
従来の分析方法が確実に失敗するような大規模な異種データをどのように処理しますか? これは、ビッグデータ科学者にとって最も重要な課題の1つです。 答えを単純化するために、Gartnerの主要アナリストであるDoug Laneyは、「ビッグデータ」を定義するための3つの基本的な概念を提示しました。
音量
これは、ビッグデータシステムの主な特徴です。 私たち一人一人にはデジタルフットプリントがあり、各デバイスから収集できるデータセットの量は驚くべきものです。 Facebookを例にとると、2016年の時点で、ソーシャルネットワーキングプラットフォームには2.6兆件の投稿がありました。 Twitterは1日あたり5億ツイートでログインします。 これを接続されている他のすべてのデジタルデバイスに追加すると、地球上のすべての人間が1日あたり平均0.77GBのデータを生成する方法を簡単に理解できます。
速度
現在利用可能なデータの90%は、過去2年間だけで生成されたものです。 毎日2.5兆バイトのデータが生成され、このデータはリアルタイム(またはほぼリアルタイム)で処理され、絶えず変化する世界で冗長にならない洞察を生成することが期待されます。 これが、ビッグデータアナリストが従来のバッチ指向のアプローチから離れ、現在の状況に関連する情報を生成していることを確認するためにリアルタイム分析を採用した理由です。
バラエティ
ビッグデータシステムをビジネスやコミュニティに非常に関連性のあるものにしているのは、これらがさまざまなソースから出現し、さまざまな方法を使用して処理されるため、これらが一意のデータセットであるという事実です。 データは、ソーシャルメディアフィード、Fitbitなどの物理デバイス、ホームセキュリティシステム、自動車のGPSシステムなどから取得できます。 データ自体は非常に多様です。リッチメディア(写真、ビデオ、オーディオ)、または構造化ログと非構造化データの場合があります。 ビッグデータのUSPは、その出所に関係なく、このすべての情報を統合して、すべてのユーザーの包括的なデータセットを提供することです。

2001年以来、ビッグデータを区別するために3つのVが使用されていますが、最新の説明では、このリストに「真実性、視覚化、変動性、価値」を追加することに賛成しています。これにより、ビッグデータ分析の範囲がさらに広がります。
それはビッグデータの特徴についてでした。次のこのビッグデータチュートリアルでは、このデータを実行可能にし、そこから洞察を引き出す方法について話しましょう。
ポップカルチャーにおけるビッグデータアプリケーションビッグデータを理解する方法は?
ビッグデータのUSPは、引き出すことができるさまざまな洞察です。 多くの洞察、傾向、およびパターンはしばしば自明ではないため、これは通常、従来の方法では実行できません。 さらに、スモールデータ分析テクノロジーは、ビッグデータメソッドによって生成される大量かつ多様なコンテンツには適していません。
これらの障壁を克服するために、さまざまな新しいテクノロジーが開発されました。最も人気のあるのはApacheHadoopです。 これらのテクノロジーは、クラスター化されたコンピューティングを利用して、データシステムに情報を取り込み、データを計算および分析し、データストリームを視覚化します。
ビッグデータは、想像できるあらゆる領域で確固たる地位を築いており、このビッグデータが行っている驚異について話さないのは間違いです。

YouTubeビデオを見る
ビッグデータのアプリケーションについて話して、このビッグデータチュートリアルを締めくくりましょう。
ビッグデータの応用
- 自己啓発:より個人的なレベルでは、ビッグデータは個人の健康を最適化するために使用されています。 アームバンドとスマートウォッチは、睡眠サイクル、カロリー消費量、活動レベルなどに関するデータを使用して、ユーザーの健康を改善するための洞察を開発します。これは、パーソナライズされた方法で個々のユーザーにフィードバックします。
- 広告:マーケティング会社は、GPS、交通パターン、眼球運動の追跡など、さまざまなデータポイントを利用して、人々がより興味を持っている広告を特定し、それによってより正確なマーケティング戦略を決定しています。 これは、価格が広告の「インプレッションあたり」であった従来のマーケティング戦略からの脱却です。
- サプライチェーンの最適化:ビッグデータは、配信ルートの最適化(AmazonやeBayなどの企業にとって大きな懸念事項)で大きな役割を果たしています。ライブトラフィックデータ、ドライバーの行動などは、無線周波数識別子とGPSシステムを使用して追跡されます。時間帯や年によっては、正しいルートをたどることができます。
- 天気予報:携帯電話のアプリケーションは、リアルタイムで天気パターンに関する情報をクラウドソーシングするために使用されています。 これらのアプリは、周囲温度計、気圧計、湿度計を組み合わせて使用することで、予測モデルの正確なリアルタイムデータを生成でき、天気予報システムの精度を大幅に向上させることができます。
- スマートシティインフラストラクチャの構築:都市は、スマートシティインフラストラクチャを開発するためにビッグデータ分析システムを試験運用しています。 干ばつに苦しむカリフォルニア州は、ビッグデータ分析を使用して消費者による水の使用量を追跡し、水の使用量を80%削減しました。 ロサンゼルスは、市内の信号を監視することにより、交通渋滞を16%削減しました。
年を追うごとに、ビッグデータはますます大きくなり、すべてのドメインでのグリップを強化しています。 このビッグデータチュートリアルが、「ビッグデータ」という言葉の背後にある誇大宣伝を理解するのに役立つことを願っています。 深く掘り下げることに興味がある場合は、ビッグデータのチュートリアル、コース、認定資格が多数あり、うまくいくでしょう。
もう待つ必要はありません。このビッグデータチュートリアルを、ビッグデータである獣を飼いならすために必要な火花にしましょう。
ビッグデータについて詳しく知りたい場合は、ビッグデータプログラムのソフトウェア開発スペシャライゼーションのPGディプロマをチェックしてください。このプログラムは、働く専門家向けに設計されており、7つ以上のケーススタディとプロジェクトを提供し、14のプログラミング言語とツール、実践的なハンズオンをカバーしています。ワークショップ、トップ企業との400時間以上の厳格な学習と就職支援。
世界のトップ大学からオンラインでソフトウェア開発コースを学びましょう。 エグゼクティブPGプログラム、高度な証明書プログラム、または修士プログラムを取得して、キャリアを早急に進めましょう。
