Évolution de la modélisation du langage dans la vie moderne

Publié: 2020-03-04

Comment la modélisation du langage, conçue au milieu du siècle précédent, est-elle devenue partie intégrante de l'intelligence artificielle avec des applications pratiques dans la vie moderne ? Comment ce mélange d'intelligence artificielle et de linguistique computationnelle est-il devenu le cœur de notre monde ? Parcourons le concept de traitement du langage naturel (NLP) et ses applications populaires telles que les chatbots, les commandes vocales et les assistants virtuels tels que Google Assistant, Siri, Cortana et Alexa d'Amazon.

Table des matières

Qu'est-ce que la PNL ?

En termes simples, la PNL aide les ordinateurs à comprendre, interpréter et utiliser la langue humaine et permet également une communication complète de manière plus nuancée. La PNL s'appuie sur diverses disciplines, notamment la linguistique et l'informatique, et offre aux ordinateurs la capacité de lire du texte, d'entendre la parole et d'interpréter une grande quantité de données. Il a beaucoup évolué depuis les années 1950 et fait désormais partie de notre quotidien. Il est susceptible de continuer à fournir des solutions standard et innovantes aux problèmes courants, en réduisant le temps, les efforts humains et les coûts.

Histoire de la PNL

Alan Turing , un expert en informatique théorique et en intelligence artificielle, a conçu pour la première fois l'idée du traitement du langage naturel dans les années 1950. Il a écrit un article expliquant un test pour une machine, dans lequel il a déclaré que si une machine peut faire partie d'une conversation à l'aide d'un téléimprimeur, alors on peut aussi lui apprendre à imiter un humain. Des schémas répétés permettraient à une machine d'apprendre cet acte, après quoi elle pourrait être considérée comme capable de penser.

En 1954, une expérience menée par l'Université de Georgetown et IBM s'est efforcée de traduire automatiquement six phrases russes en anglais, semant l'espoir que la traduction automatique serait possible dans un court laps de temps. Cependant, ce n'est qu'à la fin des années 1980 que le premier système de traduction automatique statistique (traductions générées par un modèle statistique) a été développé. Sur une période des années 1950 aux années 1980, des progrès ont été réalisés dans la construction d'autres programmes de langage naturel.

Parmi ceux-ci, ELIZA a occupé le devant de la scène au milieu des années 1960. Il s'agissait d'un programme informatique développé au laboratoire d'intelligence artificielle du MIT par Joseph Weizenbaum pour élucider la superficialité de la communication entre les humains et les machines. Elle a révélé que la communication avec les machines n'impliquait pas de contextualiser les événements et ne suivait qu'un scénario. Pourtant, les utilisateurs ont attribué des sentiments humains au programme. ELIZA a ouvert la voie à ce que nous appelons aujourd'hui les chatbots (également appelés chatterbots), qui ont évolué au fil du temps.

Les années 1970 ont été la décennie de la création d'informations structurées du monde réel en données compréhensibles par ordinateur, et un certain nombre de programmes ont amélioré la technologie disponible. Parmi les plus notables figuraient PARRY (un chatbot de 1972 avec des réponses émotionnelles), et plus tard, Racter (un chatbot ironique créé en 1984) et Jabberwacky (un chatbot conçu en 1988 qui visait à simuler une conversation humaine de manière divertissante).

Les années 1980 ont été révolutionnaires dans le traitement du langage naturel, lorsque des algorithmes d'apprentissage automatique ont été utilisés pour le traitement du langage. Il y a eu une augmentation de la puissance de calcul et la simplification progressive de la linguistique. Avec les arbres de décision, le marquage de la parole et l'accent mis sur les modèles statistiques, les modèles de langage de cache et la reconnaissance vocale, les résultats sont devenus plus fiables.

Les premiers succès de l'apprentissage automatique peuvent être attribués à IBM Research, où successivement, des modèles statistiques plus complexes ont été développés, y compris la traduction de toutes les procédures gouvernementales dans toutes les langues officielles du Canada et de l'Union européenne.

Le 21 e siècle a introduit l'apprentissage par représentation (apprentissage automatique des caractéristiques) et les méthodes d' apprentissage automatique de type réseau neuronal profond pour obtenir des résultats de pointe. Cela inclut les incorporations de mots pour capturer la sémantique et les questions et réponses de niveau supérieur, donnant naissance à la traduction automatique neuronale (NMT), qui utilise un réseau de neurones artificiels pour prédire une séquence de mots, modélisant une phrase entière dans un seul modèle intégré.

Au cours des deux dernières décennies, la PNL a exploré davantage de modèles de langage neuronal, d'apprentissage multitâche, d'incorporation de mots, de réseaux neuronaux plus avancés, de modèles séquence à séquence, de réseaux basés sur la mémoire et de modèles de langage pré-formés. Cette avancée a conduit à des applications telles que les claviers intelligents et les suggestions de réponse par e-mail à l'assistance vocale par les machines.

Il y a maintenant un passage constant du traitement du langage naturel (NLP) à la compréhension du langage naturel (NLU), où un utilisateur ayant un lien émotionnel humain avec les machines ne sera pas hérétique.

Codage versus PNL statistique

Initialement, les systèmes de traitement du langage étaient conçus par codage manuel, essentiellement en écrivant de la grammaire ou en élaborant des règles heuristiques. Cependant, au milieu des années 1980, cela a changé pour l'apprentissage automatique, qui utilisait l'inférence statistique pour apprendre automatiquement ces règles grâce à l'analyse d'un grand nombre d'exemples du monde réel. Cela a entraîné une différence palpable de vitesse et de compréhension des systèmes de traitement du langage.

Les procédures d'apprentissage utilisées lors de l'apprentissage automatique se sont automatiquement concentrées sur les cas les plus courants. Ils pourraient signaler et corriger les entrées erronées, les mots mal orthographiés et gérer des tâches plus complexes via des algorithmes. Cela a changé la donne et a atteint un scénario où la PNL pourrait être utilisée largement et avec succès à l'échelle mondiale.

Ce fut un long chemin pour atteindre un point où l'induction grammaticale, la lemmatisation, la segmentation morphologique, l'étiquetage de la parole, l'analyse, la rupture de phrase, la radicalisation, la segmentation des mots et l'extraction terminologique pourraient être utilisées pour créer des plates-formes robustes pour l'utilisation de la PNL.

Applications PNL dans la vraie vie

1. Traduction automatique

La PNL a développé plusieurs points de contact dans nos vies, en particulier au cours de la dernière décennie. L'une des applications les plus populaires est la traduction automatique , plus connue sous le nom de Google Translate . Basé sur la SMT (traduction automatique statistique, qui fait référence à la traduction automatique générée sur la base de modèles statistiques), Google Translate ne fait pas de traduction mot à mot mais attribue une valeur sémantique aux mots afin de les traduire de manière cohérente.

Cependant, en raison de l'ambiguïté et de la flexibilité inhérentes au langage humain, une telle traduction n'est pas entièrement exacte. Cela dit, Google Traduction reste l'outil le plus populaire utilisé pour la traduction en voyage, comblant le fossé linguistique.

2. Reconnaissance vocale

Un autre exemple exemplaire et relatable de la PNL. Les logiciels de reconnaissance vocale permettent de décoder la voix humaine, utilisable dans la téléphonie mobile, la domotique, l'informatique mains libres, l'assistance virtuelle, les jeux vidéo, etc. L'utilisation la plus populaire de cela dans notre vie quotidienne est venue avec l'avènement de Google Assistant, Siri et Alexa d'Amazon .

Comment cela marche-t-il? Dans le cas de Google Assistant, la parole est transformée en texte à l'aide du système Hidden Markov Model (HMM). Le système HMM écoute des extraits de mots prononcés de 10 à 20 millisecondes, recherche des phonèmes et les compare à des paroles préenregistrées. Le processus de compréhension est suivi par l'identification de la langue et du contexte.

Le système décompose chaque mot en sa partie du discours (nom, verbe, etc.) et détermine ensuite le contexte de vos commandes. Ensuite, il catégorise cette commande et exécute effectivement une tâche. Alexa, en revanche, fonctionne un peu différemment.

Chaque fois que vous dites quelque chose, les mots retournent sur le serveur Amazon pour être déchiffrés. Le système s'appuie sur une énorme base de données de mots et d'instructions pour évaluer et exécuter une commande. Par exemple, si Alexa détecte des mots tels que « pizza » ou « dîner », il ouvrira une application alimentaire, ou s'il détecte le mot « jouer », il se connectera aux options musicales.

3. Analyse des sentiments

Quand on parle de PNL, l'analyse des sentiments ne peut être ignorée. Ceci est également connu sous le nom d'opinion mining ou d'émotion AI, qui mesure l'inclinaison des opinions des gens. Il s'agit d'identifier des informations subjectives dans le texte et a un certain nombre d'applications. La surveillance de la marque et la gestion de la réputation sont l'utilisation la plus courante de l'analyse des sentiments dans les industries.

Il permet aux entreprises de suivre la perception d'une marque, d'identifier les tendances, de rester à l'écoute des influenceurs et de leur impact, de surveiller les critiques d'un produit ou d'un service, de rechercher de nouvelles idées et variations et d'ajuster les stratégies marketing en conséquence. Outre la perception de la marque et l'opinion des clients, les études de marché sont un autre domaine important d'application de l'analyse des sentiments.

La création et le suivi du contenu généré par les utilisateurs (critiques), les articles de presse, le contenu des concurrents et le comblement des lacunes en matière d'informations sur le marché sont souvent les sous-ensembles de l'analyse des sentiments. La gestion de la réputation et l'analyse des produits sont une autre application de l'analyse des sentiments utilisée dans tous les secteurs. Grâce à cela, les marques peuvent obtenir des commentaires nuancés sur leurs produits.

L'analyse des sentiments basée sur les aspects est une autre façon pour les marques d'utiliser l'analyse des sentiments de manière productive. L'approche d'analyse basée sur les aspects permet d'extraire les points les plus viables concernant les commentaires des clients. Compte tenu de cette richesse d'informations et d'analyses, les marques sont en mesure d'ajuster, d'actualiser et de diriger la communication et d'apporter des modifications au produit ou au service en conséquence.

4. Assistants virtuels

L'assistance virtuelle à l'aide de chatbots plus matures est une approche moderne pour une communication rapide et efficace avec les consommateurs. Les tâches à faible priorité mais à rotation élevée, qui ne nécessitent aucune compétence, peuvent être facilement fournies à l'aide de chatbots. Il y a eu une confiance et une popularité croissantes parmi les utilisateurs et les développeurs alors que nous nous dirigeons vers l'évolution rapide des chatbots intelligents qui offriront une assistance personnalisée au client dans un proche avenir.

En fait, l'application des chatbots a également poussé les professionnels du marketing à utiliser l'assistance virtuelle de manière plus productive, en créant de nouveaux formats d'annonces et de communication adaptés aux programmes des chatbots.

5. Santé

Dans le monde médical, les services de soins primaires alimentés par l'IA impliquent de résoudre de nombreuses tâches de PNL. Certains des cas d'utilisation actuels de la PNL en médecine impliquent l'extraction de différentes entités médicales, y compris des symptômes, des maladies ou des traitements à partir d'une grande quantité d'informations.

La découverte de connaissances à partir de textes médicaux non structurés pour dessiner des modèles et des relations est extrêmement utile pour les professionnels de la santé. Autant que la PNL peut être utilisée pour tirer des informations, elle peut également être utilisée pour communiquer des réponses pertinentes et créer une fonctionnalité de saisie semi-automatique pour un système de communication médicalement conscient.

6. Système de messagerie

En 2017, Google a déployé SmartReply , sa prouesse basée sur l'apprentissage automatique, pour répondre aux e-mails avec peu d'effort. La saisie plus rapide, la saisie prédictive, la vérification orthographique et la vérification grammaticale en font partie. Smart Reply analyse le texte d'un message entrant et suggère trois réponses de base que l'utilisateur peut modifier et envoyer, réduisant ainsi le temps passé pour des réponses simples ou banales.

Celui-ci est entièrement basé sur des réseaux de neurones formés pour analyser les messages et les convertir en codes numériques qui représentent leur signification. Au sein du système de messagerie, la classification des e-mails et la détection des spams sont d'autres moyens par lesquels la PNL a simplifié nos vies.

7. Comportement de recherche

Le comportement de recherche est un autre aspect soutenu par la PNL que nous rencontrons quotidiennement. Les moteurs de recherche utilisent le NLP pour afficher des résultats pertinents basés sur des comportements de recherche similaires ou sur l'intention de l'utilisateur, afin que l'utilisateur moyen trouve facilement ce dont il a besoin. Par exemple, Google prédit non seulement ce que les recherches populaires peuvent s'appliquer à la requête d'un individu au moment où il commence à taper, mais examine également l'ensemble du tableau en montrant les résultats tangentiels pertinents.

8. Appels téléphoniques numériques

Les appels téléphoniques numériques peuvent sembler être une partie intrusive de la journée, lorsqu'un message marketing enregistré vous parle, mais c'est un excellent moyen d'atteindre un grand nombre de personnes et de résoudre rapidement les problèmes. La PNL permet un langage généré par ordinateur proche de la voix d'un humain, qui peut recueillir des informations auprès d'un consommateur et effectuer des tâches simples telles que relayer des informations et prendre un rendez-vous.

9. Maisons intelligentes

Les commandes vocales embarquées, telles que le verrouillage des portes, le fait de baisser les vitres ou la lecture de certaines musiques, ne sont que quelques-unes des fonctions que la PNL a activées dans l' industrie automobile . Dans le domaine de l'automatisation, la domotique est également étroitement liée à la PNL, où les commandes vocales pour fermer ou ouvrir les stores, les lumières et les appareils sont au cœur des « maisons intelligentes ».

Ce ne sont là que quelques-uns des nombreux usages de la PNL que nous rencontrons dans nos vies. Les points de contact se trouvent dans le monde des affaires, du développement personnel, des ressources humaines, des ventes, de l'enseignement, de la médecine, des télécommunications, de l'automobile, des infrastructures, du coaching et bien d'autres.

Et après?

Le NLP, bien qu'encore naissant par rapport au big data et au deep learning, est largement considéré comme l'avenir du service client. Il promet de rendre les données plus conviviales et conversationnelles, ce qui en fait le pôle de tente de l'analyse commerciale. Les chatbots, par exemple, seront encore plus sophistiqués et sains avec la capacité de décoder des demandes complexes et longues en temps réel.

Ce qui est susceptible de changer en ce qui concerne les capacités actuelles de la PNL, c'est la compréhension nuancée du langage. Le NLP du futur permettra de comprendre les subtilités et le ton du langage et fournira des connaissances et des idées utiles, qui pourraient être dans le domaine des rapports annuels, des transcriptions d'appels, des communications sensibles aux investisseurs ou des documents juridiques et de conformité.

L'utilisation étendue de la PNL peut également être observée dans les secteurs de la robotique, de la santé, des services financiers, de l'automobile et des infrastructures, avec des points de contact utilisés quotidiennement. Le NLP du futur sera au cœur de l'analyse pour améliorer et développer les entreprises dans le monde entier.

Si vous souhaitez en savoir plus sur le traitement du langage naturel, consultez notre programme de diplôme PG en apprentissage automatique et IA qui est conçu pour les professionnels en activité et propose plus de 30 études de cas et missions, plus de 25 sessions de mentorat de l'industrie, plus de 5 travaux pratiques. projets de synthèse, plus de 450 heures de formation rigoureuse et d'aide au placement dans les meilleures entreprises.

Préparez-vous à une carrière d'avenir

DIPLÔME PG EN APPRENTISSAGE MACHINE ET INTELLIGENCE ARTIFICIELLE

En savoir plus @ upGrad