L’IA va-t-elle vraiment nous voler nos emplois ?
Explorer l'IA, les données et la technologie
Vous êtes-vous déjà demandé comment des outils comme les assistants IA comprennent vos questions et vos commandes et produisent une réponse qui, à première vue, semble au moins cohérente ? Comment une machine qui, à son niveau le plus élémentaire, effectue des calculs sur des octets, peut-elle obtenir des résultats aussi étonnants ?
Pour accomplir cet exploit, nous utilisons des techniques de traitement du langage naturel (TALN), un sous-domaine de l’informatique qui combine l’étude de la grammaire et de l’apprentissage automatique pour permettre aux ordinateurs de comprendre le langage humain et de produire des réponses cohérentes.
La PNL a acquis une notoriété significative au cours de la dernière année grâce à l’émergence des LLM, ou grands modèles de langage. Même si le nom LLM ne vous dit peut-être pas grand-chose à première vue, vous avez probablement déjà interagi avec certains d'entre eux : ChatGPT, Gemini et DeepSeek, entre autres, sont de grands modèles de langage.
Il existe également des SLM, ou modèles linguistiques à petite échelle. Ceux-ci sont généralement entraînés avec un ensemble de données plus restreint, moins de paramètres et tendent à se concentrer sur un domaine spécifique, contrairement aux LLM, qui se veulent plus généralistes et produisent des réponses dans différents domaines de connaissances.
Ci-dessous, je vais vous présenter quelques techniques de PNL afin que vous puissiez comprendre ce qui se passe dans les coulisses.
Dans cet article, nous explorerons certains concepts de base du PNL, notamment la tokenisation, le marquage des parties du discours (POS) et la reconnaissance d'entités nommées (NER).
Bien que le traitement du langage naturel nous ait permis d'obtenir une interaction homme-machine très fluide, ouvrant de nouvelles opportunités dans divers domaines, nous n'avons pas encore réussi à obtenir un modèle de raisonnement véritablement autonome capable de passer le test de Turing (un test qui évalue la capacité d'une machine à présenter un comportement intelligent de type humain).
Examinons maintenant plus en détail certains de ces processus de base.
La tokenisation est la première étape fondamentale du traitement du langage. Elle consiste à diviser un texte en fragments plus petits, appelés tokens, qui peuvent être des mots ou des phrases. Cette étape permet aux machines de traiter les textes plus précisément et d’extraire les informations pertinentes.
Prenons un exemple en utilisant les phrases suivantes comme base :
« J'ai hâte de sortir des bois et d'aller à la campagne aujourd'hui. Le soleil brille, les oiseaux chantent et je suis de très bonne humeur. Tu ne ressens pas la même chose, Caton ? »
Les jetons de ce texte seraient chaque mot et signe de ponctuation qui s'y trouvent. Des scripts peuvent être créés pour effectuer cette tâche automatiquement. Il est important de souligner qu’il est important de préserver l’ordre des jetons, car il s’agit d’informations précieuses qui peuvent nous indiquer le sens d’un mot ou à quelle famille grammaticale il appartient. Le résultat ressemblerait à ceci.
Python
['Je','veux','quitter','la',forêt','et','aller','au',champ','aujourd'hui','.'Le' ,'soleil','brille','les',oiseaux','chantent','et','je','suis',de'très','bonne',' humeur','.'N'arrive-t-il','pas',les'mêmes','choses','à',Cato','?']
| Étiquette | Catégorie grammaticale | Définition |
|---|---|---|
| NN | NOM | Noms de personnes, de lieux, de choses ou d'idées |
| VB | VERBE | Mots qui décrivent des actions, des états ou des événements |
| JJ | ADJECTIF | Mots qui décrivent ou modifient les noms |
| RB | ADVERBE | Mots qui modifient les verbes, les adjectifs ou d’autres adverbes |
| PRP | PRONOM | Mots qui remplacent les noms |
| DT | DÉTERMINATEUR | Mots qui introduisent les noms |
| PP | PARTICULE | Mots qui font partie des verbes à particule |
|---|
| Étiquette | Catégorie grammaticale | Définition |
|---|
| ADP | Adposition | Prépositions et postpositions (par exemple, dans, sur, à). |
|---|
| NUM | Numéral | Indique des nombres (par exemple, un, deux, 42). |
|---|
| PROPN | Nom propre | Nommez des entités spécifiques (par exemple, John, Paris, Google). |
|---|
| SYM | Symbole | Symboles non alphanumériques (par exemple, $, %, +, @). |
|---|
| X | Autre | Catégorisation générale des mots non classés (par exemple, expressions étrangères ou fautes de frappe) |
|---|
La reconnaissance d'entités nommées (NER) est un processus par lequel les entités sont reconnues dans un texte, telles que des lieux, des personnes, des produits, des organisations, des nationalités, des dates, des valeurs numériques, entre autres. .
En utilisant NER, nous pouvons extraire des informations pertinentes d’un texte et les transformer en informations structurées (comme un tableau), qui peuvent être utilisées pour une analyse plus approfondie.
Vous essayez d'extraire différentes entitésd'un texte.
Vous pouvez trouver plus d'informations sur NER ici
La reconnaissance d’entités nommées (NER) aide les machines à identifier et à catégoriser les éléments clés du texte, tels que les noms, les dates et les lieux. Par exemple, dans la phrase :
« Cato a remporté le prix à Bogotá la semaine dernière »,
NER étiquetterait :
« Caton » en tant que PERSONNE,
« prix » en tant qu'ÉVÉNEMENT et
"Bogotá" comme LIEU.
Le NER est utile pour extraire des informations précieuses à partir de textes longs. Il peut aider à résumer du texte, à répondre à des questions et à améliorer les tâches d’analyse des sentiments. Les étiquettes NER sont généralement déterminées sur la base d’ontologies ou de vocabulaires créés par l’homme.
Vous trouverez ci-dessous une liste de certaines catégories NER courantes :
| Catégorie NER | Définition | Exemple |
|---|---|---|
| PER (Personne) | Noms de personnes | Isabel Allende, Mon Laferte |
| ORG (Organisation) | Noms d'organisations ou d'entreprises | Umbrella Corporation, Nokia |
| LOC (Localisation) | Noms de lieux géographiques | Bogotá, Parc Tayrona, Sagrada Familia |
| GPE (Entité géopolitique) | Régions politiques, telles que pays, villes ou États | Colombie, Sucre |
| DATE | Expressions de date ou d'heure spécifiques | 1er septembre 2024, demain |
| TEMPS | Horaires spécifiques | 15h00, midi |
| ARGENT | Montants monétaires | 50 000 pesos, 10 euros |
| POURCENTAGE | Pourcentages | 15 pour cent, 50 % |
|FAC (Installation) |Bâtiments, aéroports, routes| Monnaie, aéroport El Dorado, autoroute panaméricaine
|NORP | Nationalités, religions, groupes politiques | Colombie, Catholicisme, Parti vert
| PROD | Produit | Café Juan Valdez, Flores, Renault |
|---|---|---|
| LANGUE | Langues | Espagnol, Wayuu, Créole, Anglais |
| ÉVÉNEMENT | Événements nommés | Règne de la Panela, Jeux panaméricains |
Et pour revenir à notre prière initiale, nous pourrions nous attendre à un résultat comme celui-ci.
Le NER est essentiel pour extraire des informations structurées à partir de textes non structurés, ce qui est utile dans des tâches telles que la recherche et le résumé d'informations.
Analyse des sentiments
L’analyse des sentiments consiste à déterminer le sentiment ou l’émotion derrière un texte. Cela peut être délicat car le sarcasme, l’ironie ou le contexte peuvent changer radicalement le sens. Par exemple, la phrase « Super, exactement ce dont j'avais besoin ! » Cela peut sembler positif, mais il est probable que cela soit négatif en raison du ton.
L'analyse des sentiments classe une phrase comme positive, neutre ou négative, et parfois même plus précisément, comme fortement positive ou fortement négative. Cela est particulièrement utile pour traiter les commentaires des clients ou comprendre l’opinion publique. Les systèmes PNL modernes peuvent aller au-delà du positif, du neutre et du négatif et détecter davantage d’émotions dans le texte.
Voici une liste de certaines des émotions que ces systèmes peuvent détecter.
| Émotion | Ton émotionnel | Exemple |
|---|---|---|
| Bonheur | Positif | J'ai enfin atteint mon objectif et j'en suis très heureux ! |
| Émotion | Positif | J'ai hâte de commencer mon nouveau travail demain. Ce sera incroyable ! |
| Gratitude | Positif | Merci beaucoup de m'avoir aidé à traverser cette période difficile. Cela signifie beaucoup pour moi. |
| Colère | Négatif | Je n'arrive pas à croire qu'ils m'ont menti. Je suis furieux! |
| Tristesse | Négatif | Je me sens très déprimé aujourd'hui. Tout me rappelle ce que j'ai perdu. |
| La peur | Négatif | Marcher seul dans cette ruelle sombre me terrifie. |
| Déception | Négatif | J'espérais vraiment un meilleur résultat, mais je pense que je vais devoir réessayer. |
| Indifférence | Neutre | Je n'ai pas vraiment d'opinion sur ce sujet. Cela ne m'affecte pas. |
| Curiosité | Contexte spécifique | Je suis vraiment curieux de voir comment cette expérience va se dérouler ! Je suis curieux de savoir pourquoi tu m'évites. Cela me semble suspect. |
| Confusion | Contexte spécifique | Ce puzzle est déroutant, mais je m'amuse à le résoudre ! Je suis confus quant à ce qui se passe et cela me rend anxieux. |
| Espoir | Contexte spécifique | J’espère que cette nouvelle opportunité apportera le changement que j’attendais. J'espère que tu me pardonneras, mais au fond, j'ai peur que non. |
| Frustration | Contexte spécifique | Je suis frustré par ce projet, mais je sais que j'en serai fier une fois terminé. Ce trafic est tellement frustrant qu'il me fait perdre tout mon après-midi. |
| Amour | Contexte spécifique | J'aime passer du temps avec ma famille ;C'est très gratifiant. Je t'aime, mais cette relation détruit ma santé mentale. |
| Culpabilité | Contexte spécifique | Je me sens coupable de ce que j'ai dit, alors je vais m'excuser et arranger les choses. |
Cependant, les émotions sont complexes et le contexte est essentiel. Par exemple, « Je ne suis pas malheureux » est techniquement négatif, mais cela implique quelque chose de positif. L’analyse des sentiments utilise des modèles d’apprentissage automatique pour tenir compte de ces subtilités, même si même les meilleurs modèles peuvent être confrontés au sarcasme ou à l’ambiguïté.
Avez-vous déjà lu une histoire dans laquelle les personnages apparaissent comme « il », « elle » ou « ils » et vous vous retrouvez à essayer de reconstituer de qui il s’agit ? C'est l'essence même de la résolution de coréférence : déterminer quand différents mots ou expressions font réellement référence à la même personne ou à la même chose.
Examinons cela de plus près avec notre exemple de phrase : « J’ai hâte de sortir aujourd’hui. Le soleil brille, les oiseaux chantent et je suis de très bonne humeur. Tu ne ressens pas la même chose, Caton ? » Dans ce récit léger, « tu » s’adresse clairement à Caton, tandis que « je » appartient à l’orateur. Pour nous, c’est simple : nos esprits relient les points de manière transparente. Mais pour un ordinateur ? C'est comme démêler une toile complexe. La résolution de coréférence donne aux machines les outils pour suivre ces connexions, garantissant qu'elles peuvent déterminer qui est qui, même dans un texte long et alambiqué.
Cette compétence joue un rôle clé dans des applications telles que la rédaction de résumés, où il est crucial de comprendre à qui ou à quoi chaque pronom fait référence. Imaginez un résumé qui utilise « il » ou « ils » de manière ambiguë et sans contexte : il semblerait décousu et difficile à suivre. La résolution des coréférences garantit que les résumés et autres tâches à forte intensité de texte restent clairs et fluides.
Dans notre exemple, en utilisant des outils comme spaCy et neuralcoref, l'ordinateur identifie les coréférences suivantes : « je » fait référence au locuteur et apparaît deux fois dans le texte. « Vous » désigne directement Caton, la personne à laquelle vous vous adressez. Cette corrélation peut nous sembler triviale, mais pour une machine, elle est le résultat d’algorithmes sophistiqués travaillant en coulisses pour imiter notre compréhension naturelle.
Grâce à ces connexions établies, les machines peuvent parcourir le texte de manière plus fluide, transformant des données fragmentées en informations cohérentes.
Un résultat attendu de ce processus serait quelque chose comme :
La PNL peut sembler intimidante au début, mais lorsque vous la décomposez (tokenisation, marquage POS, NER, analyse des sentiments et résolution de coréférence), elle devient plus accessible. Chacune de ces techniques joue un rôle essentiel pour aider les machines à comprendre le langage humain. Nous n'avons pas couvert toutes les techniques possibles dans le domaine, mais c'est peut-être un bon aperçu pour vous donner une idée de ce qui se passe dans les coulisses du langage machine.
Le point essentiel à retenir est que la PNL vise à permettre aux machines de traiter et de comprendre le langage humain de manière significative. Que vous analysiez des sentiments, étiquetiez des parties du discours ou identifiiez des entités clés, ces éléments de base sont essentiels pour créer des systèmes PNL efficaces.
En démystifiant ces concepts, j’espère que vous vous sentirez plus connecté à la technologie qui alimente une grande partie de notre monde numérique. Et peut- être que cette nouvelle compréhension vous incitera à approfondir la PNL ou simplement à mieux apprécier la beauté du langage.