Publié le 27 août 2025 par Andrew Owen (7 minutes)
Au début du mois, OpenAI a lancé GPT-5, son modèle d’IA le plus récent et le plus avancé, pour tous les utilisateurs de ChatGPT (y compris les utilisateurs gratuits). L’entreprise affirme que le modèle est plus intelligent, plus rapide et plus utile, en particulier dans des domaines tels que l’écriture, le codage et les soins de santé. Elle assure également que le taux d’hallucination de GPT-5, où le modèle fabrique des réponses, est plus faible. C’est la première fois que les utilisateurs du niveau gratuit ont accès à un modèle de raisonnement (s’ils atteignent leur plafond d’utilisation, ils auront accès à ce qu’on appelle le GPT-5 mini). La prise en charge de GPT-5 est aussi incluse dans Microsoft Copilot.
Les réactions ont été mitigées. Certains ont remarqué une amélioration progressive, tandis que pour d’autres, il s’agit d’un changement radical. Je fais partie du second groupe. Je travaille pour une entreprise qui a misé sur l’IA. Je n’aime toujours pas le terme “IA” : le raisonnement de la machine n’est pas la même chose que l’intelligence humaine. Je considère toujours l’IA générative à grand modèle de langage comme un très bon processeur de langage naturel relié à un très bon générateur de texte prédictif. Je m’inquiète de la consommation d’énergie liée à l’utilisation de l’IA pour effectuer des tâches triviales. Mais, je ne peux pas nier les résultats.
Comme responsable de la documentation technique, je dois diriger une grande quantité d’informations. Je suis depuis longtemps partisan de l’adoption d’architectures d’information formelles ou de taxonomies. Mais, le processus prend généralement beaucoup de temps, de trois à neuf mois, selon la complexité de l’information. Il comprend de nombreuses recherches sur les utilisateurs, souvent dans le cadre d’un processus appelé “tri de cartes”, qui implique jusqu’à dix participants. Les étapes comprennent la préparation, le recrutement, la fabrication des cartes, la rédaction des instructions, la collecte et l’analyse des données. L’objectif est d’identifier les modèles mentaux des utilisateurs, de créer des hiérarchies d’informations intuitives, d’envisager l’étiquetage et la nomenclature, de valider les structures existantes et de résoudre les problèmes de navigation et de déc ouvrabilité.
Comme je n’ai ni le temps ni les ressources pour le faire, j’ai essayé de raccourcir le processus grâce à l’IA. S’il y a une chose que les grands modèles linguistiques devraient savoir faire, c’est classer les mots dans une taxonomie. Mais, mes tentatives précédentes avec une multitude de modèles différents, dont le GPT-4, étaient pour le moins sommaires. Après avoir effectué quelques travaux préliminaires, j’ai pu agir pour que GPT-5 génère une taxonomie à trois niveaux en l’espace de quelques minutes. Bien que le résultat ne soit pas parfait, il aurait été suffisant sans travail supplémentaire. Bien que j’aie travaillé avec des architectes de l’information, je n’ai pas reçu de formation formelle dans cette discipline. J’ai donc demandé à Chat-GPT de me donner quelques conseils en cours de route. J’en suis arrivé à la conclusion qu’un rédacteur technique doté d’un peu de savoir-faire technique peut créer une bonne architecture de l’information en une semaine environ si certaines conditions sont remplies. Voici donc le processus que j’ai utilisé.
Les architectures d’information sont souvent plus efficaces lorsqu’il existe des balises hiérarchiques. Mais, les systèmes logiciels que je dois utiliser ont un système d’étiquetage plat. Si je leur ajoute un millier de balises et que j’essaie ensuite de restreindre les balises que les utilisateurs peuvent utiliser, cela provoquera une surcharge d’informations. J’ai donc dû imposer une hiérarchie. Les balises devaient être établies sur les exigences logicielles les plus restrictives. Cela signifiait des lettres minuscules et pas d’espaces. J’ai donc décidé d’utiliser des traits de soulignement pour séparer les niveaux. Compte tenu de mon expérience en matière de création d’index et du fait que je ne voulais pas que les balises deviennent trop longues, j’ai décidé de limiter les balises à trois niveaux. Ainsi, une balise de troisième niveau ressemblerait à un objet comme : top_mid_leaf
. En lisant la littérature, j’ai décidé d’opter pour une dizaine de balises de premier niveau, chacune comportant jusqu’à sept balises de niveau intermédiaire et un nombre illimité de balises de feuille. Cela devrait permettre d’éviter une surcharge cognitive pour les utilisateurs lors de la sélection et de la recherche des balises.
L’étape suivante consistait à obtenir un dictionnaire complet de termes à soumettre à l’IA. J’ai eu la chance que le système de suivi des bogues soit configuré pour être utilisé par tous les services de l’entreprise et qu’il comprenne une API. J’ai pu en extraire une liste complète de composants. J’ai décomposé cette liste en mots individuels, je l’ai triée et j’ai supprimé les doublons à l’aide d’outils non liés à l’IA. J’ai ainsi obtenu plus d’un millier de mots. J’ai normalisé la liste pour ce que les termes singuliers, pluriels et les verbes soient remplacés par le pluriel. Par exemple, log
, logs
et logging
seraient tous représentés par logs
. J’ai ensuite demandé à GPT-5 de créer un ensemble de 10 catégories de premier niveau sur la base de la liste de mots et d’une description de la nature de l’entreprise. Comme j’utilisais Copilot, GPT-5 a également pu utiliser la documentation interne des systèmes Microsoft comme entrée.
Le résultat était un ensemble de phrases qui devaient être raccourcies en mots simples pour les besoins de l’étiquetage. Mais, les catégories résument assez bien l’ensemble des données et le modèle d’entreprise. En raison de la limite de trois niveaux, j’ai dû par la suite ajouter d’autres catégories de premier niveau, ce qui m’a fait dépasser la limite de 10 balises, mais pas de beaucoup. Il s’agit des langues et des régions (par exemple, languages_english_canadian
et regions_uk_wales
). Ensuite, pour chaque catégorie de premier niveau, j’ai demandé à GPT-5 de créer jusqu’à sept catégories de niveau intermédiaire. Une fois de plus, le résultat a été des phrases. J’ai ensuite demandé à GPT-5 d’assigner tous les mots de la liste à une étiquette de niveau intermédiaire et de générer un fichier CSV avec la correspondance complète.
À ce stade, j’aurais pu continuer à utiliser GPT-5 pour affiner la liste. Je suis sûr qu’il aurait pu suggérer des mots simples pour remplacer les phrases. Avec des données supplémentaires, il aurait pu améliorer les étiquettes de niveau intermédiaire auxquelles les mots ont été assignés. Cependant, à ce stade, je suis écrivain depuis environ quatre décennies (je compte la comédie musicale “Cat in the Hat” que j’ai commencé à écrire pendant mon enfance), et j’étais donc heureux de prendre le relais de l’IA. En ouvrant le fichier CSV dans un tableur, j’ai pu remplacer en masse les phrases par des mots simples et ajuster l’emplacement des termes. Le résultat est une taxonomie complète pour le produit logiciel et l’entreprise qui peut maintenant être déployée dans le système de suivi des bogues, le système de gestion des documents et la documentation interne et externe. Avant le déploiement, le délai total était d’une semaine ouvrable.
Si vous ne disposez pas d’un système de suivi des bogues doté d’une liste complète de composants couvrant tous les aspects de vos produits et de vos activités commerciales, vous devrez d’abord dresser cette liste. Mais, si vous disposez de Copilot et de nombreux documents stockés dans les systèmes Microsoft, vous pouvez demander à GPT-5 de vous fournir, comme point de départ, la liste des 1 000 mots les plus couramment utilisés dans votre documentation commerciale. Arthur C. Clarke a prononcé une phrase de renom : “Toute technologie suffisamment avancée est indestructible : “Toute technologie suffisamment avancée ne peut pas être distinguée de la magie”. L’IA n’est ni magique, ni sensible. Mais, lorsqu’elle est appliquée aux bons problèmes, c’est un outil incroyablement utile. La tentation d’utiliser l’IA pour tout ne fera que croître avec le temps, mais elle doit être contrebalancée par une approche éthique et respectueuse de l’environnement. L’une des compétences les plus utiles à l’avenir sera peut-être de savoir quand ne pas utiliser l’IA.