Travailler sur les données privées d’une entreprise
S’agissant d’assistants IA (par exemple un chatbot), nous sommes maintenant habitués à des applications qui s’appuient sur des LLM entrainés sur des données générales, c’est à dire publiques et non relative à une entité privée.
De ce fait :
– la thématique est non limitée, ce qui ouvre la porte à des "hallucinations",
– les données ne peuvent être suffisamment détaillées pour satisfaire un utilisateur professionnel,
– vous ne pouvez pas assurer leur mise à jour,
– s’agissant le plus souvent d’applications "dans le Cloud" diffusées en mode SaaS ou PaaS, la sécurité des données ne peut être aussi bien assurée que dans le cas d’applications installées sur les serveurs privés d’une entité.
i-Tego propose des outils, généralement sous la forme de service Web, appliquant la génération augmentée de récupération ( Retrivial Augmented Generation, RAG) pour traiter localement les données de l’entité sur ses propres serveurs. L’alternative étant le "fine tuning" exigeant de transférer à une entité extérieure les données de l’entreprise pour compléter l’apprentissage de son modèle de langage.
De plus, grâce à notre serveur d’authentification OAuthSD, vous maîtriserez quelles applications et qui auront accès à vos données et avec quels privilèges.
Offrir des outils répondant à des objectifs particuliers
Les premiers travaux d’i-Tego portent sur l’IA générative appliqué à des connaissances.
Il est rapidement apparu que des applications particulières exigent d’appliquer des traitements de données différenciés selon les objectifs poursuivis : on ne peut se contenter du seul mode question/réponse.
On pourra objecter que la question posée à un chatbot (le "prompt") peut inclure des instructions qui permettront d’atteindre des objectifs particuliers.
A ceci nous répondons que :
– c’est tout un art que de formuler correctement les instructions ;
– répéter cette formulation à chaque question peut s’avérer fastidieux ;
– cela ne permet pas de configurer les traitements internes, en particulier le "prompt système" reste le même, ainsi que la logique et les réglages des différentes étapes.
Le démonstrateur : WSGiTego
WSGiTego est le prototype d’un service web conçu pour être intégré à une application textuelle. Il répond aux questions, apporte automatiquement des corrections aux textes fournis et s’oppose aux contenus inappropriés. C’est un outil idéal pour garantir de manière automatisée la qualité rédactionnelle d’un site web, modérer automatiquement un forum, générer des réponses pour une FAQ, augmenter la productivité des rédacteurs etc. C’est une application multilingue.
Pour répondre aux objectifs particuliers d’un site Web, WSGiTego a permis de configurer les modes suivants :
- ’answer’ : L’assistant doit fournir une réponse à la question posée.
- ’summarize’ : L’assistant doit résumer et corriger un texte donné.
- ’correct’ : L’assistant doit corriger l’orthographe et la grammaire d’un texte.
- ’improve’ : L’assistant doit améliorer un texte en éliminant les répétitions.
- ’complete’ : L’assistant doit compléter une question en se basant sur un contexte donné.
- ’extend’ : L’assistant doit développer un texte en détaillant chaque phrase.
Sauf ’answer’, les autres modes s’opposent à une question inappropriée (vulgarité, racisme, sexisme, conflictualité etc.) en générant un message d’erreur.