Décoder l'analyse de données facile ou pas si facile
Publié: 2016-12-15Rédigé par le professeur S. Sadagopan, directeur - IIIT Bangalore. Le professeur Sadagopan est l'un des universitaires les plus expérimentés du groupe d'experts du programme de diplôme UpGrad & IIIT-B PG en analyse de données.
En tant que professionnel de l'analyse en herbe confondu par le jargon, le battage médiatique et les messages marketing écrasants qui parlent de millions d'emplois à venir qui sont payés en millions de roupies, vous devriez avoir des éclaircissements sur la "vraie" valeur d'une formation en analyse de données. Voici quelques informations qui devraient, espérons-le, vous aider à réduire votre confusion.
Certaines personnes intelligentes peuvent utiliser la "pensée analytique" pour arriver à des "chiffres incroyables" ; ils sont très utiles mais étant « intuitifs », ils ne peuvent pas être « enseignés ».
Par exemple:
Table des matières
Analytique facile
Préconfiguration des GAB avec Data Insights
"Nous avons le guichet automatique le plus rapide de cette planète"

Réclamé une banque respectée. Ont-ils obtenu un nouveau guichet automatique spécialement conçu pour eux ? Certainement pas. Certains employés intelligents avec un état d'esprit analytique ont découvert que 90% du temps où les utilisateurs se rendent à un guichet automatique pour retirer de l'argent, ils utilisent un montant fixe, disons 5 000 roupies. Ainsi, la Banque a reconfiguré les options d'écran standard - Demande de solde, Retrait, Imprimer le relevé, etc. - pour inclure une autre option. Retirez le montant XYZ, en fonction des actions passées de chaque client.
Cela a fini par économiser une étape du fonctionnement de l'ATM. Au lieu de sélectionner l'option de retrait puis de saisir le montant à retirer, vous pouvez désormais gagner du temps, ce qui rend le processus plus pratique et intuitif. Une décision intelligente en effet, cependant, c'est quelque chose connu sous le nom de "Easy Analytics" que d'autres peuvent également copier. En fait, d'autres ont copié, dans les trois mois !
Un guide de démarrage pour l'analyse de donnéesDonnées cachées dans la météo
Dans les exemples d'ensembles de données qui accompagnaient un tableur dans les années 90, il y avait des données sur la superficie et la population de chaque État des États-Unis. Il y avait aussi un exercice pour enseigner la partie formule de la feuille de calcul pour calculer la densité de population (population par km2). Le New Jersey, avec une population de 467 habitants au km2, est l'État avec la plus forte densité.

Alors que j'enseignais à une classe d'étudiants en MBA dans le New Jersey, j'ai rencontré un étudiant indien qui s'est rendu compte qu'en termes de densité de population, le New Jersey est plus peuplé que l'Inde avec 446 habitants au km2 ! Une observation intéressante, même si comparer un Etat à un Pays est un peu trompeur. Encore une fois, un exercice Easy Analytics débouchant sur une « belle » observation !
Certains exercices simples d'analyse de données peuvent être effectués de manière routinière et sont relativement plus faciles grâce à des outils incroyables :
Le comportement d'achat de B-School décodé
Dans une B-School en Inde qui a un magasin sur le campus (le campus est situé loin du centre-ville), certains étudiants intelligents ont mis plusieurs années de données sur les ventes de leur magasin de campus . Ils étaient enthousiasmés par la puissance informatique phénoménale et le logiciel d'analyse quasi infaillible.
La vraie surprise, cependant, était que huit articles représentaient 85% de leurs ventes annuelles . Plus important encore, ces huit articles ont été consommés en seulement six jours de l'année ! Tout le monde savait qu'une poignée d'articles étaient les seuls articles à rotation rapide, mais ils n'en connaissaient pas l'ampleur (85 %) ou l'intensité (consommation en seulement six jours).

Il s'avère que pendant les 3 premiers jours du semestre, les étudiants stockaient les articles pour le semestre complet ! La B-School a jugé judicieux de demander à un magasin voisin d'installer un stand temporaire pendant seulement deux semaines au début des semestres et de fermer le Campus Store. Cela a permis d'économiser de l'espace utile et des coûts sans causer de désagréments majeurs aux étudiants. Un bon exemple d'Easy Analytics réalisé à l'aide d'un outil puissant.
L' analyse « pas si simple » nécessite une compréhension analytique approfondie, des outils, un « état d'esprit analytique » et un travail acharné. Voici deux exemples, l'un datant des années 70 et l'autre très récent :
Des analyses pas si simples
Voler ou ne pas voler, telle est la question
Il y a longtemps, American Airlines a perfectionné la surréservation planifiée des sièges d'avion , grâce au système de réservation aérienne SABRE qui gérait chaque siège d'avion.
Armé de données antérieures détaillées sur les « sièges vides » et les « absences » dans chaque segment de chaque vol pour chaque jour de l'année, et en modélisant les sièges d'avion comme des denrées périssables, l'American Airlines a pu améliorer le rendement, c'est-à -dire l'utilisation de l'avion capacité. Ils y sont parvenus grâce à une surréservation planifiée, c'est-à-dire en vendant plus de billets que le nombre de sièges, sur la base des annulations prévues .

Si en effet plus de passagers se présentaient que le nombre réel de sièges, American Airlines demanderait à toute personne se portant volontaire de renoncer au voyage sur le vol spécifique, avec l'offre de les faire voler par le prochain vol (souvent gratuit) et de prendre en charge l'hébergement à l'hôtel si nécessaire. Parfois, ils offraient même des incitations en espèces au volontaire pour qu'il se retire.

En utilisant une modélisation sophistiquée de la recherche statistique et opérationnelle , American Airlines s'assurerait que les vols étaient complets et que les incidents réels de plus de passagers que la capacité totale étaient proches de zéro. En fait, de nombreux étudiants attendraient avec impatience de tels incidents afin qu'ils puissent obtenir des incitations (en fait, je devrais m'inclure dans cette liste) mais ils étaient rarement récompensés !)
Ce qu'American Airlines a commencé comme une expérience est devenu la pratique standard de l'industrie au fil des ans. Jusqu'à récemment, une équipe d'analystes bien formés (souvent titulaires d'un doctorat) et disposant d'un accès à une énorme puissance de calcul était nécessaire pour qu'un tel exercice d'analyse soit soutenu.
Aujourd'hui, les logiciels de nouvelle génération tels que le langage de programmation R et les ordinateurs de bureau puissants dotés d'une puissance de visualisation/graphique importante changent très rapidement le monde de l'analyse de données. Toute personne bien formée (ne nécessitant plus nécessairement un doctorat) peut devenir un professionnel de l'analyse de premier ordre.
Libérer la puissance de l'analyse des donnéesCabine hors du sac
Uber est un autre exemple montrant comment la puissance de l'analyse de données peut perturber une industrie bien établie. Taxi-for-sure à Bangalore et Ola Cabs sont similaires à Uber. Ensemble, ces sociétés Taxi-App (utilisant une application mobile pour héler un taxi, surveiller l'état du taxi, utiliser et payer le taxi) tentent de convaincre le monde de passer de la possession d'une voiture à l'utilisation d'une voiture à la demande.
Un exercice d'analyse simple mais approfondi en 2008 a donné une telle confiance à Uber qu'il a commencé à parler de réduire les ventes de voitures de 25 % d'ici 2025 !
Après avoir créé l'application Uber pour iPhone, le fondateur d'Uber a inscrit quelques centaines de clients de taxi à San Francisco et quelques centaines de chauffeurs de taxi dans cette région également. Tout ce que les chauffeurs inscrits avaient à faire était de toucher l'application Uber dès qu'ils étaient prêts pour un client. De même, les clients de taxi inscrits ont été invités à toucher l'application Uber chaque fois qu'ils cherchaient un taxi.
Grâce au téléphone connecté à Internet (connectivité), à l'application mobile (interface utilisateur), au GPS (localisation du taxi et de l'utilisateur final) et au SIG (détails de localisation), Uber pourrait essayer de connecter les chauffeurs de taxi et les utilisateurs de taxi.
Le véritable aperçu était que près de 90 % du temps, les chauffeurs de taxi trouvaient un client à moins de 100 mètres ! De la même manière, près de 90% du temps, les usagers des taxis ont été mis en relation avec leurs chauffeurs potentiels en un rien de temps, pas trop loin.
Malheureusement, jusqu'à la création de l'application Uber, les passagers et les chauffeurs de taxi n'avaient aucun moyen de connaître ces informations. Plus important encore, ils n'avaient aucun moyen de se joindre ! Une fois qu'ils ont eu ces informations et accès, une nouvelle façon de héler un taxi a pu être établie.
Avec un logiciel back-end pour planifier les taxis, une passerelle de paiement et un mécanisme de paiement mobile , un service de taxi bien supérieur pourrait être établi. Bien sûr, près de chez nous, nous avions encore de meilleures options comme Taxi-for-sure essayant d'étendre cette expérience même aux pousse-pousse automatiques. Le reste, comme on dit, c'est "l'histoire en devenir !"
Des cours approfondis sur l'analyse de données vous aideront à vous préparer à ces applications à fort impact. Ce n'est pas facile, mais souvenez-vous des paroles de l'ancien président américain Kennedy
"nous avons choisi d'aller sur la Lune non pas parce que c'est facile, mais parce que c'est dur !"
Obtenez une certification en science des données des meilleures universités du monde. Apprenez les programmes Executive PG, les programmes de certificat avancés ou les programmes de maîtrise pour accélérer votre carrière.
Qu'est-ce que le décodage ?
Le décodage consiste à convertir le code en texte brut ou en tout autre format pouvant être utilisé dans des opérations futures. Le contraire de l'encodage est le décodage. Il restaure les états d'origine des diffusions et des fichiers de communication de données codées. Le décodage est défini comme la compréhension et l'interprétation du message codé. Cette procédure est effectuée par un décodeur, soit un humain, soit un système qui décode et comprend le message codé. Cela remplit l'objectif de la communication en garantissant que l'expéditeur et le destinataire reçoivent le message. Lorsque le récepteur comprend facilement le message, le décodage est réussi.
En quoi l'analyse de données est-elle différente de la science des données ?
Les apprenants peuvent utiliser à la fois la science des données et l'analyse des données pour examiner les données et élaborer des conclusions. Cependant, ce qui les différencie, c'est leur utilisation d'outils et d'approches pour simuler la complexité et l'imprévisibilité croissantes du monde. Traditionnellement, les analystes de données se sont appuyés sur des techniques basées sur des règles pour gérer la complexité et l'ambiguïté. Vous pouvez utiliser l'analyse des données pour transformer les énormes quantités de données qui tourbillonnent dans l'entreprise d'aujourd'hui en informations et prévisions significatives. Il utilise des méthodes et une technologie scientifiques pour vous permettre d'examiner les données que vous collectez afin d'accomplir une série de tâches.
Quelle est l'importance de l'analyse de données ?
Dans toute organisation, l'analyse des données est cruciale. Il aide les entreprises à maximiser leurs résultats. Supposons que vous l'incluiez dans la stratégie de votre entreprise. Dans ce cas, cela signifie qu'il peut vous aider à réduire les coûts en identifiant des moyens plus lucratifs de faire des affaires et en collectant d'énormes quantités de données. L'analyse commerciale aide les organisations à prendre de meilleures décisions, à comprendre les souhaits et les besoins de leurs clients et à répondre à leurs attentes, ce qui se traduit par des biens et services meilleurs et innovants. L'analyse de données aide toute entreprise en développement en analysant la chaîne de valeur de l'entreprise. Par exemple, l'analyse vous dira comment les données actuelles peuvent aider l'entreprise.
