Le point de départ de l'entreprise : science des données et intelligence artificielle

Publié: 2022-03-11

Le domaine en pleine expansion de l'intelligence artificielle et de la science des données présente une liste décourageante d'options pour les entreprises qui espèrent exploiter son potentiel. L'apprentissage automatique, l'apprentissage en profondeur, le traitement du langage naturel, les réseaux de neurones, l'automatisation des processus robotiques et bien d'autres variantes ésotériques remplissent les gros titres et les livres blancs.

Sur le point de fournir une puissance de calcul miraculeuse, ces technologies implorent les dirigeants de les adopter ou voient leurs entreprises bientôt dépassées par celles qui le font. Pour quelques entreprises avec des divisions entières consacrées à l'IA, adapter une telle technologie aux cas d'utilisation est une affaire quotidienne. Mais pour la grande majorité, savoir par où commencer est moins simple.

Dans cet article, les dirigeants de Toptal partagent leur point de vue sur l'application pratique de solutions liées à la technologie artificielle aux besoins commerciaux courants.

Pedro Nogueira, spécialiste de l'apprentissage automatique et de la science des données, offre une nouvelle rafraîchissante aux nouvelles entreprises : la première solution est souvent simple, relativement peu coûteuse et financièrement relutive. Complétant la perspective de Nogueira, l'équipe de Toptal Enterprise met en évidence les tendances récentes en matière d'automatisation des processus robotiques, qui aide les entreprises à rationaliser les flux de travail de routine.

Automatisation des processus robotiques et IA : des outils pour différentes tâches

Pour encadrer les conseils partagés par Nogueira, il est utile de comprendre la différence entre l'automatisation robotique des processus (RPA) et l'intelligence artificielle (IA) et les types de données que chaque approche est la mieux adaptée à gérer.

La RPA et l'IA diffèrent en fonction des tâches qu'elles effectuent. Robot logiciel, RPA excelle dans les tâches répétitives analogues à celles effectuées par un ouvrier ou une machine à la chaîne de montage. À l'inverse, l'IA est mieux adaptée aux environnements moins structurés, reproduisant la capacité d'analyse fondamentale du jugement et de la prise de décision humains.

Définitionnellement, les deux approches sont également distinctes. L'IEEE Standards Association, une organisation internationale composée d'experts de l'industrie, les définit comme suit :

RPA : logiciel préconfiguré qui utilise des règles métier et une activité prédéfinie pour effectuer l'exécution autonome d'une combinaison de processus, d'activités, de transactions et de tâches.

IA : la combinaison de l'automatisation cognitive, de l'apprentissage automatique (ML), du raisonnement, de la génération et de l'analyse d'hypothèses, du traitement du langage naturel et de la mutation intentionnelle d'algorithmes produisant des informations et des analyses égales ou supérieures aux capacités humaines.

La RPA est généralement considérée comme un sous-ensemble de l'IA et qui cible les routines répétitives. La différence essentielle est que la RPA n'apprend pas, tandis que l'IA peut s'auto-modifier, modifiant son activité en réponse à des apports environnementaux variables.

Par conséquent, la RPA est la mieux adaptée aux données hautement structurées, tandis que l'IA gère les données non structurées ou semi-structurées. La différence entre les deux types de données, résumées ci-dessous, est facile à saisir pour quiconque a construit une base de données de tableur.

Les données qui s'intègrent parfaitement dans une telle feuille de calcul, telles que les coordonnées des clients, sont structurées. Les données qui ne correspondent pas - comme le langage naturel - ne sont pas structurées. Il est essentiel d'apprécier la différence entre ces types de données pour comprendre quelles formes d'IA sont appropriées pour une analyse de rentabilisation donnée.

Bloquer et résoudre avec l'automatisation des processus métier

Pour la plupart des entreprises, le point de départ le plus simple et le moins risqué pour tirer parti de l'IA est l'automatisation des processus métier. Composés de tâches banales qui nécessitent peu d'intelligence et peut-être aucun effort humain, ces processus justifient un investissement dans une technologie qui élimine ou réduit considérablement l'intervention humaine. Les entreprises et les employés en bénéficieront de trois manières distinctes :

Les employés concentrent leurs efforts sur les tâches de plus grande valeur et sur la résolution de problèmes.
Les entreprises réalisent un retour sur investissement positif grâce à des coûts d'exploitation minimaux.
La qualité du processus s'améliore en raison de l'absence d'erreur humaine.

La RPA pilote plusieurs flux de travail dans le secteur de l'assurance

Pour les entreprises qui rationalisent déjà des procédures internes simples telles que le remboursement des dépenses, des opportunités plus complexes offrent un potentiel de retour sur investissement élevé. Dans le secteur de l'assurance, par exemple, la génération de devis d'assurance et le traitement des réclamations d'assurance présentent des cas d'utilisation parfaits pour la RPA.

Lors de la souscription d'une police, les compagnies d'assurance doivent équilibrer le risque et la récompense. Essentiellement, en moyenne, la valeur actualisée nette des primes d'assurance doit être supérieure à celle des sinistres. Lors de la souscription, les compagnies d'assurance estiment la composante risque de cette équation, ce qui les aide à prévoir le moment et l'ampleur des passifs futurs.

La souscription a toujours été un processus manuel, dont les exigences analytiques ont été supervisées par des actuaires. Aujourd'hui, ce travail est de plus en plus effectué automatiquement et sous la supervision de spécialistes des données qui s'appuient sur de nouvelles sources de données pour mieux prévoir les risques. Par exemple, dans l'industrie automobile, les assureurs évaluaient historiquement les historiques de pertes, qui sont des enregistrements des réclamations d'assurance passées pour un conducteur donné. Les assureurs ont commencé à intégrer les cotes de crédit des conducteurs dans leur analyse des risques, reconnaissant que des cotes élevées sont positivement corrélées à une conduite sécuritaire et à des pertes proportionnellement moindres.

Réfléchissant à l'exemple de la souscription, Nogueira note que "lorsque les entreprises pensent qu'elles ont besoin d'IA, elles ont souvent besoin de data scientists".

Pour Nogueira, le processus de devis d'assurance est assez familier tant au niveau professionnel que personnel. Scientifique des données avec une expérience de projet dans le secteur de l'assurance et passionné de moto qui a récemment fait le tour du Portugal, il partage une anecdote à laquelle tout conducteur ou propriétaire peut s'identifier : "Si j'ai besoin de changer de moto, ce que j'aime faire fréquemment, alors je aller en ligne à un ensemble de compagnies d'assurance et partager mes données via leurs questionnaires en ligne.

Une fois soumises, les données entrent dans "un modèle qui vit quelque part sur le backend et analyse mon profil de risque selon un ou plusieurs modèles, puis me fournit un devis". Dans les secondes nécessaires pour recevoir un tel devis, toutes les analyses sont automatiques, remplacées par une intervention humaine uniquement dans le cas de données aberrantes.

L'automatisation entraîne également des flux de travail en aval dans le cycle de vie du client d'assurance, notamment pendant le processus de réclamation. Lorsqu'un client d'assurance dépose une réclamation, la compagnie d'assurance détermine s'il faut payer entièrement, payer partiellement ou refuser la réclamation. Le processus implique souvent plusieurs parties externes, y compris le client de l'assurance et le prestataire de services, par exemple un hôpital dans le cas des soins de santé ou un atelier de réparation dans le cas de l'automobile.

Dans l'industrie automobile, le règlement des réclamations dépend de la vérification des dommages causés à un véhicule, de la détermination des coûts de réparation, de la sélection de l'atelier de réparation et du paiement de la réparation. Pour les estimations de réparation, les photos jouent un rôle essentiel dans le processus de réclamation. L'expert en sinistres prend des photos du véhicule accidenté, tout comme l'atelier, avant et après les réparations. Ces photos fournissent la preuve des dommages, de la réparation et de la base du remboursement.

Historiquement, ces photos étaient interprétées exclusivement par des personnes, mais désormais, un logiciel de reconnaissance d'images couplé à une automatisation basée sur des règles fournit des informations critiques à l'expert en sinistres, permettant des réparations et une couverture plus rapides.

La science des données est le cheval de bataille et les scientifiques des données sont les moteurs

Les entreprises doivent "définir ce qui peut être facilement automatisé et ce qui doit être transmis aux décideurs humains", selon Nogueira. Quel que soit le processus envisagé pour l'automatisation, poursuit-il, « examinez d'abord les données et déterminez les règles ».

S'il admet que les domaines de la science des données et de l'IA fusionnent, pour l'entreprise qui s'installe, Nogueira délimite les deux :

« La science des données est l'IA appliquée à des scénarios réels et à des besoins commerciaux courants. Il s'agit davantage de comprendre les données, de les gérer, de les rendre facilement disponibles, faciles à traiter et, finalement, de guider la prise de décision par les parties prenantes de l'entreprise.

Un tel travail revient souvent à nettoyer et à rassembler des ensembles de données disparates - ce qui n'est pas une tâche facile - puis à appliquer une analyse statistique, telle qu'une régression logistique, pour améliorer les prévisions et les décisions.

En revanche, l'IA est beaucoup plus axée sur la recherche et adaptée à l'analyse de données non structurées. "Imaginez un projet vraiment complexe, avec beaucoup d'incertitude, par exemple en essayant de construire un modèle qui détermine combien de personnes pourraient entrer dans un supermarché en fonction des habitudes de marche, de la vidéo CCTV et des données sensorielles."

En fin de compte, ce modèle pourrait prédire comment les gens achètent, ce qu'ils recherchent et comment positionner les produits les uns par rapport aux autres, en optimisant le plan d'étage pour maximiser les profits. Si un tel projet « ciel bleu », s'il réussit, serait sans aucun doute précieux pour les détaillants, il nécessiterait également une équipe de plusieurs experts et pourrait facilement coûter des multiples d'une initiative basée sur la science des données. Dans le cas du commerce de détail, une entreprise peut se concentrer sur un ou quelques-uns des composants les plus critiques du modèle prédictif - par exemple, l'optimisation des heures d'ouverture du magasin par rapport au trafic piétonnier et aux coûts d'exploitation.

Le point de départ essentiel pour renforcer les capacités en science des données consiste à recruter le bon type et le bon nombre de talents. Heureusement, selon Nogueira, la plupart des entreprises "n'ont pas besoin d'une grande équipe de développeurs super experts pour effectuer la plupart des automatisations courantes, surtout si l'on considère le nombre d'API et de SDK disponibles".

Bien que ces technologies prêtes à l'emploi fournissent des outils puissants, il est essentiel qu'elles soient manipulées par de bonnes mains. Ici, Nogueira met en garde : "ces outils pourraient en fait être un problème, car beaucoup de gens les utilisent d'une manière qu'ils ne devraient pas, car ils ne les comprennent pas."

Le danger, note-t-il, réside dans le "surajustement des modèles de données", qui résulte de l'application d'un modèle aux données d'une manière qui ne tient pas compte de l'éventail complet des possibilités. Un tel surentraînement, prévient-il, "peut finir par être extrêmement coûteux pour l'entreprise, car dans des situations que vous n'avez jamais vues auparavant, le modèle ne se généralise pas bien, ce qui peut conduire à prendre de mauvaises décisions sur les données".

Pour éviter de tels écueils, Nogueira encourage les entreprises à embaucher des data scientists expérimentés. Toutes les entreprises qui cherchent à libérer la valeur des données client ou opérationnelles "ont besoin d'une personne ayant une bonne compréhension des statistiques et un sens des affaires suffisant pour comprendre les cas d'utilisation et où réside la valeur dans l'entreprise". Du point de vue des qualifications, un data scientist solide a généralement au moins un BS en mathématiques ou en statistiques, une forte capacité à coder et peut analyser un cas d'utilisation commerciale pour déterminer où la science des données peut avoir le plus d'impact.

Pensées d'adieu

Alors que la science des données présente un point de départ convaincant du point de vue risque/récompense, le paysage plus large des technologies d'IA mérite également d'être exploré. Les dirigeants d'entreprise devraient considérer la science des données comme le point de ralliement autour duquel entamer la conversation interne sur l'IA.

Au fur et à mesure qu'ils réalisent des histoires de réussite avec l'automatisation des processus métier, ils devraient envisager d'élargir la portée pour inclure des cas d'utilisation plus difficiles, peut-être mieux adaptés aux technologies alternatives d'IA. Dans les articles suivants, Insights explorera le paysage plus large de l'IA, aidant les dirigeants à naviguer dans un domaine qui offrira sans aucun doute de solides rendements.