Petites données, grandes opportunités

Publié: 2022-03-11

Résumé

Qu'est-ce que les mégadonnées ?
  • Le "Big Data" est une mesure subjective qui décrit des ensembles de données si volumineux qu'ils ne peuvent pas être gérés et analysés par des outils logiciels de base de données typiques.
  • Ces ensembles sont plutôt analysés par calcul pour révéler des modèles, des tendances et des associations, en particulier en ce qui concerne le comportement et les interactions humaines.
  • Les données volumineuses et l'analyse sont devenues courantes avec l'avènement d'Internet, du commerce électronique, des médias sociaux et de l'interconnexion des appareils, qui ont tous contribué à l'augmentation importante du volume de données analysables nécessaires pour que les données volumineuses deviennent une réalité.
  • Gartner et IBM déconstruisent le big data en quatre V : volume , vélocité , variété et véracité - chacun étant un élément constitutif requis pour transformer le big data en valeur monétisable.
Qu'est-ce que les petites données ?
  • Les petites données, également une mesure subjective, sont définies comme des ensembles de données suffisamment petits en volume et en format pour les rendre accessibles, informatifs, exploitables et compréhensibles par les personnes sans l'utilisation de systèmes et de machines complexes pour l'analyse.
  • Les petites données ne se sont imposées comme une catégorie à part entière qu'avec l'émergence des mégadonnées, et représentent donc un dérivé de ces dernières.
  • Les petites entreprises qui envisagent une stratégie d'analyse doivent d'abord se concentrer sur l'utilisation de petites données pour générer des informations exploitables sur leurs clients avant de passer à des applications de mégadonnées pour des analyses plus prescriptives et prédictives.
Définir l'analyse des données.
  • L'analyse de données est une discipline de longue date dans laquelle des statisticiens et des spécialistes des données hautement qualifiés analysent des ensembles d'échantillons statistiquement significatifs (c'est-à-dire de grande taille) à l'aide de logiciels sophistiqués pour identifier les modèles et les tendances. Cette analyse permet d'obtenir des informations utiles pour prendre de meilleures décisions, principalement en ce qui concerne les interactions avec les clients.
  • Ces dernières années, les logiciels permettant ce travail sont devenus plus accessibles, puissants et faciles à utiliser, permettant ainsi au citoyen data scientist d'émerger et de commencer à entreprendre des projets qui étaient auparavant le domaine des spécialistes techniques hautement qualifiés.

introduction

Les données et l'analyse sont rapidement devenues des mots à la mode dans le monde des affaires. Il serait difficile de déchiffrer un journal sans faire référence aux entreprises avant-gardistes "utilisant intelligemment les données" pour glaner des informations sur le comportement des clients, effectuer des analyses de risques ou gérer plus efficacement leur infrastructure. Les grandes entreprises riches en données, en particulier celles de la variété réglementée, se sont engagées dans la prise de décision basée sur les données pendant des années, comme en témoigne le pionnier de l'analyse de données de Capital One pour mieux comprendre ses clients - des informations ensuite utilisées pour lancer des informations hyper-ciblées et extrêmement des campagnes de marketing percutantes qui ont conduit à son succès fulgurant.

Mais malgré des débuts de niche, l'utilisation des données est rapidement devenue courante. Il existe aujourd'hui peu de raisons crédibles pour qu'une entreprise donnée, quelle que soit sa taille et ses effectifs, ne dispose pas de l'analytique en tant que processus/capacité métier de base. Les objections traditionnelles telles que le coût, les ressources et l'expertise ne coupent plus la moutarde. Au contraire, les données générées en interne deviennent rapidement un atout stratégique omniprésent exploité comme n'importe quel autre, par des entreprises compétitives cherchant à rester compétitives.

Cet article vise à présenter brièvement à ses lecteurs le monde des données et de l'analyse, en vous guidant à travers la dynamique du marché, les outils, les acteurs et les solutions uniques aux deux, avant de consacrer la seconde moitié à un guide de mise en œuvre pratique et à un cadre pour les petites entreprises.

Un guide du profane sur les grandes et les petites données

Avec l'avènement d'Internet et avec lui le commerce électronique, les médias sociaux et l'interconnectivité des appareils, une explosion du volume de données mondialement disponibles et analysables pour ceux qui possèdent les outils pour les exploiter a explosé. Chaque tweet, publication, like, balayage à gauche, balayage à droite, double pression, révision, texte et transaction - chacun est une donnée utilisable pour cartographier nos empreintes numériques qui disent tout sur qui nous sommes, comment nous prenons des décisions, où et pourquoi. Ces données, appelées à juste titre "big data" pour l'immensité, la profondeur et la complexité de leur forme, ont ouvert une mer de possibilités dans l'analyse prescriptive et prédictive, rendant possible l'hyper personnalisation de tant de produits que nous consommons quotidiennement.

Formellement, les mégadonnées décrivent de grands ensembles de données qui peuvent être analysés par ordinateur pour révéler des modèles, des tendances et des associations, le plus souvent liés au comportement et aux interactions humaines. Pour que les données soient qualifiées de « volumineuses », l'ensemble/la banque doit être si grand qu'il nécessite des méthodes de données avancées et des systèmes complexes pour en extraire la valeur.

Dans un rapport de recherche de 2001, le groupe META (aujourd'hui Gartner) a encadré les mégadonnées en trois dimensions appelées les trois V des données. Ce sont les suivants : volume (quantité), vélocité (vitesse de génération/transmission) et variété (gamme de type et de source). Ces trois V ont ensuite été étendus en quatre V par IBM, pour inclure la véracité (qualité/intégrité) des données comme dimension finale requise pour capturer la valeur.

Graphique 1 : Les quatre V du Big Data

… mais vous aviez probablement déjà entendu parler du big data. Les petites données, en revanche, sont une sous-classe de données jugées suffisamment modestes pour les rendre accessibles, informatives et exploitables par les personnes, sans avoir besoin d'outils d'analyse trop complexes. Mieux résumé par l'ancien consultant de McKinsey, Allen Bonde, "Les mégadonnées concernent les machines, tandis que les petites données concernent les personnes" - en particulier, des informations significatives organisées et conditionnées pour la dérivation des causes, des modèles et des raisons du "pourquoi" des personnes.

Analyse basée sur SaaS

Parallèlement à l'augmentation de la disponibilité et de l'utilité des données, l'émergence d'une industrie de l'analyse autonome s'est produite. Autrefois le repaire exclusif des statisticiens, des scientifiques des données et des analystes de niveau maîtrise et doctorat, l'analyse a évolué pour devenir une industrie de plates-formes logicielles en tant que service (SaaS) en libre-service, fonctionnellement robustes mais peu coûteuses, qui permettent même aux plus novice des utilisateurs pour extraire de la valeur de leurs données. Les petites entreprises qui manquaient auparavant de l'expertise ou des budgets nécessaires pour exécuter ce type d'analyse sont désormais en concurrence sur un pied d'égalité avec leurs homologues mieux dotés en ressources et établissent des points défendables sur leurs marchés.

Outre les avantages économiques du modèle SaaS, une étude menée par le groupe Aberdeen, une société de recherche sur les technologies et les services, montre que les organisations qui adoptent les outils SaaS comptent deux fois plus d'employés qui utilisent instinctivement les données pour prendre des décisions et atteindre leurs objectifs de retour sur investissement 40 % plus vite que ceux qui ne le font pas. Pour la plupart des entreprises, les rapports de marketing par e-mail, Google Analytics et d'autres outils d'analyse Web tiers sont déjà utilisés activement, en plus des rapports générés en interne à partir des systèmes de comptabilité, de marketing, d'ERP et de CRM et utilisés comme mécanisme principal pour monétiser leurs petites données.

De plus, et bien qu'il s'agisse d'un marché important et en croissance dont la mesure précise peut être difficile, IDC estime le marché mondial des outils de business intelligence et d'analyse à près de 14 milliards de dollars en 2017, avec une croissance de 11,7 % en glissement annuel, avec Forrester Research , une société d'études de marché mondiale, prévoit un TCAC de 15 % jusqu'en 2021.

Données sur les parts de marché

Sans surprise, le marché des outils et solutions d'analyse est dominé par la vieille garde des éditeurs de logiciels, des sociétés telles que SAP, IBM, Oracle et Microsoft. En 2015, SAP était en tête du marché avec 10 % de part de marché et 1,2 milliard de dollars de revenus de produits d'analyse et de business intelligence (BI) ; SAS Institute était numéro deux, avec une part de 9 % ; IBM, troisième avec 8 %, et Oracle et Microsoft respectivement quatrième et cinquième avec 7 % et 5 %. Fait intéressant, la part de marché des cinq plus grands fournisseurs a diminué en raison de la croissance supérieure au marché des startups soutenues par du capital-risque telles que Sentiment Strategies, Tableau et Teradata, ce qui suggère qu'une grande partie de la croissance future de l'industrie sera générée par des entreprises plus petites, des entreprises plus rapides et plus agiles.

Graphique 2 : Principaux fournisseurs d'analyse de données aux États-Unis, part de marché par entreprise

Un guide de mise en œuvre de l'analyse de données pour les petites entreprises

Au niveau le plus élevé possible, une culture centrée sur les données donne à la direction une plus grande confiance dans sa capacité à prendre les meilleures décisions possibles, souvent et de manière cohérente, tout en travaillant à partir de la même version de la vérité, une version transparente et quantifiable. Après tout, la plupart d'entre nous ont assisté à des sessions où des dirigeants en guerre ont avancé/défendu différents arguments en s'appuyant sur différentes sources anecdotiques, modèles de faits et interprétations, remettant rapidement en question l'intégrité des entrées et donc des sorties. Ainsi, la première décision qui doit être prise par une petite entreprise donnée qui cherche à suivre la voie de l'analyse des données est de savoir si ladite entreprise cherche vraiment à devenir une organisation axée sur les données.

Une fois cette décision descendante prise, un cadre doit être établi pour optimiser le potentiel et l'utilité de la nouvelle priorité stratégique. Pour commencer, plusieurs questions doivent être posées. Premièrement, quels sont les objectifs à court et à long terme de l'entreprise, du projet, de l'initiative ou du service en question ? Deuxièmement, qui devrait être responsable de l'effort et de ses résultats ? Troisièmement, quels problèmes spécifiques l'entreprise, le projet, l'initiative ou le département cherche-t-il à résoudre avec les données ? Et quatrièmement, quels outils devraient être utilisés pour piloter l'initiative ?

Une fois ces questions répondues, l'étape suivante consiste à formuler un plan d'exécution tangible qui, avec un peu de planification, une structure organisationnelle, une direction descendante et un enthousiasme ascendant, positionnera l'organisation à portée de main pour générer des résultats réels et mesurables. des résultats plus cohérents qu'il ne l'a fait par le passé. Le diagramme ci-dessous est conçu pour fournir un cadre permettant de considérer les différents éléments d'une approche simple d'analyse de données.

Graphique 3 : Résumé des éléments, des dimensions et des considérations d'une approche d'analyse de données

A la question des objectifs

C'est la première question importante à résoudre. À un niveau élevé, l'objectif primordial de toute entreprise cherchant à exploiter ses données est de développer un processus systématique pour prendre des décisions commerciales judicieuses, un processus cohérent et reproductible, et qui donne des résultats mesurablement meilleurs. À ce stade, il est important de noter que devenir une organisation solide axée sur les données est un voyage et non une destination, et en tant que tel, «l'adhésion» du haut et le consensus du bas sont des étapes fondamentales importantes qui s'avéreront essentielles. à une adoption massive et à des actifs analytiques pleinement utilisés. Après avoir obtenu l'adhésion, une prochaine étape éprouvée consiste à organiser stratégiquement quelques "gains rapides" pour susciter l'excitation et l'engagement nécessaires pour mener à bien ce processus. La recherche d'un consensus, l'adhésion et les gains rapides obtenus, à la fois la recherche et mes expériences, dictent une approche de mise en œuvre qui suppose la structure, la séquence et les considérations suivantes :

Commencez par l'analyse descriptive, un tableau de bord visuel simple qui met en évidence les performances de l'entreprise à l'aide de données transactionnelles existantes pour tirer des conclusions qui s'étaient auparavant avérées peu concluantes sans données quantifiables. Ensuite, développez des capacités d'exploration au sein de votre tableau de bord, partagez des informations, des résultats de performance et des instructions d'auto-assistance de manière stratégique et avec les bons collègues/influenceurs organisationnels. Cela lancera à la fois le processus de diffusion auprès de leurs subordonnés et la culture de confiance en les données que vous cherchez à cultiver.

Deuxième étape : passer à des capacités d'analyse prédictive plus sophistiquées, soit en utilisant des ressources techniques internes, soit avec l'aide de fournisseurs tiers. Ces capacités prédictives associent des sources de données internes et externes pour mieux répondre à des questions commerciales spécifiques telles que « Quelle est la probabilité qu'un client fasse défaut ? » ou « Les clients qui achètent x achètent généralement également y » et un aperçu temporel du rendement d'un ministère ou d'une initiative donnée. Dans ce cas, les « sources de données externes » incluent les données des médias sociaux, les données de la force de vente ou les données sur l'expérience utilisateur, qui fournissent toutes des sources d'informations riches et statistiquement significatives, où les données internes sont encore trop limitées pour être exploitables par elles-mêmes.

La troisième étape consiste à passer à des analyses prescriptives avancées qui aident à déterminer l'action appropriée pour guider/prévenir le comportement des consommateurs, des entreprises, des concurrents, des employés ou des fournisseurs sur fond de données historiques. Il convient de noter cependant que cette étape commence généralement à marquer la transition des petites données aux grandes ; et pourtant, il s'agit d'une étape nécessaire qui doit être intégrée au processus de décision à l'échelle de votre entreprise pour garantir les niveaux les plus élevés d'intégrité des entrées-sorties et de cohérence dans la prise de décision.

Graphique 4 : Cadre d'identification des buts et des objectifs par une organisation capable d'analyser

Vue détaillée des différentes étapes de l'analyse

Analyse descriptive – Tableaux de bord

C'est un truisme que ce qui est mesuré est géré, et donc en développant une seule vérité déterministe des données, les dirigeants au sein d'une organisation sont mieux à même de prendre des décisions plus judicieuses et plus unifiées. Les tableaux de bord sont le point de départ de tels parcours analytiques et l'illustration visuelle de la vérité déterministe des données d'une entreprise. Bien sûr, ce qui est pertinent pour un groupe peut être dénué de sens pour un autre, il convient donc de tenir dûment compte de l'objectif ou du thème d'un tableau de bord donné, des informations à inclure, du public récepteur pertinent pour son contenu et de question/problème est que ledit groupe cherche à répondre/résoudre.

Graphique 5 : Exemple de tableau de bord d'analyse des ventes

Graphique 6 : Exemple de tableau de bord d'analyse de commerce électronique

Des tableaux de bord bien conçus guident la prise de décision plutôt que de simplement présenter des informations historiques, et les meilleurs concentrent efficacement l'attention sur les tendances et les modèles récurrents (positifs et négatifs) tout en illustrant avec précision les éléments vitaux d'une entreprise. Des tableaux de bord plus sophistiqués offrent des fonctionnalités d'exploration qui permettent aux dirigeants d'accéder aux causes profondes d'un problème diagnostiqué avec des fonctionnalités d'annotation et de partage qui permettent une visualisation plus dynamique et en temps réel.

Analyse prédictive - Fusion, exploration et interrogation des données

Une fois le processus du tableau de bord terminé, l'aspirante organisation axée sur les données peut commencer à devenir plus ambitieuse. Pour cela, une étape suivante typique consiste à "utiliser des données volumineuses et variées pour effectuer une analyse plus avancée et donner une dimension supplémentaire au domaine de décision". En mélangeant des données spécifiques à l'entreprise enrichies avec celles de tiers, allant des fournisseurs verticaux spécifiques tels qu'Experian, Acxiom et D&B aux médias sociaux ou aux fournisseurs de données de vente tels que Facebook, Twitter et Salesforce, l'entreprise donnée peut explorer une plus grande, des ensembles plus larges, plus variés et statistiquement significatifs pour des informations nouvelles et meilleures sur les performances de l'entreprise et le comportement des clients.

Prescriptive Analytics - Déploiement de l'analytique dans les processus métier

Les entreprises au niveau de l'entreprise ayant des besoins différents en termes de données, de clients, de réglementations et de problèmes / problèmes commerciaux spécifiques et avec des budgets et des compétences internes différents auront probablement des fournisseurs de technologies qui répondent à leurs besoins plus uniques. Ils opèrent à une échelle où la capacité d'opérationnaliser l'analyse dans leurs processus et flux de travail commerciaux devient plus importante et économique. Souvent, ces entreprises seront dans des secteurs réglementés où elles doivent être en mesure de démontrer qu'elles ont mis en place des traitements équitables et reproductibles.

Les prêteurs ne montrent aucun parti pris dans leurs politiques de prêt, que ce soit pour le sexe, le revenu ou la race.

A la question de la responsabilité

C'est une chose de déterminer une action spécifique et une autre de la mettre en œuvre. Il doit y avoir un lien entre le diagnostic, la prescription et la décision et un individu/groupe responsable du résultat souhaité. C'est ici que le rôle du sponsor exécutif devient important.

Dans les petites et les grandes entreprises, ledit sponsor exécutif - le champion désigné de l'enrichissement des données et de facto le directeur des données - est une personne, généralement le PDG, le directeur financier ou le directeur marketing au début, déjà imprégné de données et d'analyses, à l'écoute de la sorte de problèmes mieux résolus par les données, ou du moins un croyant dans le potentiel de transformation de l'analyse des données.

En plus de ce protagoniste, le processus nécessite également généralement un champion secondaire, plus pratique, en particulier une fois que l'entreprise commence à passer de l'analyse descriptive à l'analyse prédictive. Traditionnellement, cette personne était un data scientist interne de formation technique, mais a plus récemment pris la forme d'un passionné de technologie souvent appelé le citoyen data scientist. Cet individu s'auto-sélectionne généralement - un jockey de feuille de calcul autoproclamé avec le bon équilibre entre curiosité intellectuelle et dextérité, mais qui est prêt à vivre dans les mauvaises herbes de la mise en œuvre. Dans de nombreux cas, cette personne est en avance sur la direction en reconnaissant l'impact potentiel qu'un processus formel d'analyse de données peut créer dans son entreprise, mais n'avait tout simplement pas le statut ou la crédibilité nécessaires pour vendre sa vision.

A la question du problème commercial

Chaque entreprise prospère et défaillante a son ensemble unique de défis qui ne peuvent être résolus que par la combinaison appropriée de ressources, de processus et de capacités qui lui sont propres. Cela dit, les types de défis commerciaux les mieux adaptés pour être résolus par les données peuvent, le plus souvent, être réduits, catégorisés et résolus à l'aide du cadre défini dans le graphique 7.

De plus, quelques lignes directrices/paramètres anecdotiques ont été élaborés au fil des ans, qui optimisent davantage non seulement les chances d'identifier les bons types de problèmes à résoudre avec les données, mais aussi leurs chances d'être résolus avec succès. Ces lignes directrices/paramètres sont les suivants : Premièrement, choisissez des questions simples et claires dont les implications comptent beaucoup ; deuxièmement, en cherchant des réponses à partir de données, visez l'aspect pratique de la solution plutôt que la perfection d'une réponse académique ; troisièmement, gardez à l'esprit la nature et la base de connaissances de votre public destinataire lors de la livraison du diagnostic et de la solution ; et enfin, ne sélectionner que des problèmes mesurables et quantifiables avec des données et des solutions déjà existantes qui peuvent, dans une égale mesure, être suivies.

Graphique 7 : Cadre d'identification du problème métier à résoudre

A la question des bons outils et méthodes

La dernière de nos quatre questions-cadres originales, en ce qui concerne la construction d'une organisation durable axée sur les données, concerne la sélection d'outils, de méthodes ou de plates-formes. Pour cela, je dirai d'abord que les outils d'analyse de données ont considérablement évolué ces dernières années, avec divers avantages et inconvénients pour l'utilisateur professionnel. Les avantages incluent une baisse substantielle des coûts associés à la location de ces outils et une augmentation de la liste des fonctionnalités et de la complexité des options disponibles, car ils sont passés d'outils spécifiques à une fonction à des plates-formes de fonctionnalités qui se chevauchent. De plus, les fournisseurs SaaS proposent des essais gratuits, mais avec des restrictions sur le volume et le type de données ; les nouveaux clients ont la possibilité de prendre une décision d'achat éclairée après avoir testé plusieurs plateformes.

Le principal inconvénient de ces plates-formes est que, dans le but de rester compétitifs les uns avec les autres, les fournisseurs ont innové de manière si agressive vers la complexité que leurs offres approchent désormais de la saturation des fonctionnalités avec des offres qui dépassent l'utilité des utilisateurs professionnels moyens. Le résultat malheureux est l'écrasement de l'utilisateur novice, ce qui rend plus difficile la réalisation des « gains rapides » évoqués précédemment et réduit ainsi la probabilité que la culture des données s'installe dans une entreprise donnée.

Heureusement, de nombreuses ressources sont disponibles pour aider les utilisateurs potentiels, évaluer et comparer les solutions d'informatique décisionnelle concurrentes, bien qu'une certaine connaissance des fonctionnalités communes de base soit utile pour les évaluer par rapport aux besoins et priorités spécifiques d'une entreprise. Quelques-unes de ces fonctionnalités incluent : le nombre et l'étendue des connexions de données, la disponibilité de tableaux de bord pré-assemblés, les capacités d'exploration, de publication et de partage, l'intégration avec la capacité du logiciel de fusion et d'exploration de données, le potentiel de mise à l'échelle (sur les paramètres de volume et de variété), le nombre et la précision des approches de modélisation, et les référentiels clients par industrie spécifique. Bien qu'il soit certes simple dans son résumé, le graphique 7 ci-dessus présente certains fournisseurs clés qui jouent dans différentes catégories (descriptif, prédictif, normatif).

Petites données, grandes opportunités

Malgré ses débuts de niche, il est clair que l'analyse de données et le marché des outils d'analyse basés sur SaaS ont considérablement évolué ces dernières années, au grand bénéfice du citoyen scientifique des données et de son entreprise. Le big data, le small data, les outils en libre-service sont désormais suffisamment répandus pour justifier leur considération en tant que compétence de base même pour les entreprises les moins techniques. En d'autres termes, avec tant de données utiles et exploitables générées et les coûts des outils en libre-service évoluant à l'inverse des fonctionnalités et des capacités proposées, peu de raisons continueront d'exister pour que même les petites entreprises ne commencent pas à exploiter les données dans une certaine mesure.

Cet article aurait dû illustrer qu'avec un peu de planification, de définition d'objectifs et de sélection de clients, même votre startup peut commencer à niveler le terrain de jeu concurrentiel avec les titans de l'industrie que vous avez décidé de perturber, libérant ainsi une énorme valeur économique pour vous. et vos parties prenantes. Vous n'avez qu'à commencer; alors allez-y, lancez-vous !