le NLG dans le développement logiciel

Dans ce court chapitre, nous présentons quelques exemples concrets qui peuvent bénéficier de la génération en langage naturel (NLG). Il s'agit d'une technologie naissante avec de nombreuses utilisations potentielles, que nous commençons tout juste à étudier.

En mai 2020, OpenAI a dévoilé le plus grand réseau neuronal du monde, baptisé GPT-3, un modèle de langage de 175 milliards de paramètres. GPT-3 a été entraîné en utilisant pratiquement toutes les données publiques disponibles sur Internet et a surpassé les modèles de pointe dans une série de tâches de traitement du langage naturel (NLP), notamment la traduction, la réponse à des questions et les tests de cloze. GPT-3 est un gigantesque modèle de traitement du langage naturel, qui atteint l'état de l'art dans une série de tâches. Sa principale avancée est l'élimination de la nécessité d'un réglage fin spécifique à la tâche. L'une des tâches pour lesquelles GPT-3 est très performant est la génération de texte - dans notre cas, la génération de code.

Bien que GPT-3 ne nécessite aucun entraînement (un exemple d'apprentissage à zéro coup), ses performances déjà excellentes sont surpassées par l'apprentissage à un coup ou à quelques coups.

Après avoir établi la tâche linguistique, nous compilons une petite collection d'échantillons triés sur le volet. Dans l'apprentissage automatique plus typique, un grand ensemble de données est nécessaire, suivi d'une annotation. Cependant, les modèles de langue ont une fenêtre d'entrée limitée. L'invite textuelle et la complétion générée doivent avoir une longueur inférieure à 2048 tokens (environ 1500 mots) lors de l'utilisation de l'API OpenAI pour GPT-3. Dans le cadre de cette contrainte, nous devons communiquer très efficacement ce que nous attendons du modèle (le "prompt"), en nous appuyant sur le nouvel art de "l'ingénierie du prompt". Cela nécessite une très petite collection d'exemples, contrairement à l'apprentissage automatique standard, qui requiert entre 60 et 80 % du temps total consacré à la préparation des données.

L'API GPT-3 détermine le modèle optimal pour nos besoins. Elle applique de manière abstraite la "correspondance floue" à un très grand modèle. Elle recherche la correspondance la plus proche, et son comportement peut être influencé par plusieurs paramètres.

Nous combinons la compréhension du langage naturel (NLU) avec la génération du langage naturel (NLP) dans deux domaines. Bien que nous générions du code structuré, cela relève toujours de la NLG.

Cas d'utilisation : Génération de cas de test

La figure ci-dessous illustre le fonctionnement de GPT-3 avec SQL. Le format est de type question-réponse, dans lequel nous demandons à GPT-3 d'effectuer une action et il détermine la meilleure correspondance. L'ingénierie critique est la conception de l'invite utilisée pour choisir les cas appropriés pour demander GPT-3. La solution réelle sera similaire à celle-ci (que nous ne pouvons pas démontrer en raison de la protection de la propriété intellectuelle), en ce sens que les utilisateurs téléchargeront des cas de test et le code Python sera généré.

Dans notre situation, nous fournissons des cas de test en entrée et recevons du code en sortie.

Cas d'utilisation : Génération de tests de couverture de code

La couverture du code est l'un des aspects les plus critiques des projets agiles car elle nous permet de construire des pipelines CI/CD. Si les programmeurs aiment écrire du code, ils ne sont pas aussi enthousiastes à l'idée de construire des cas de test. Généralement, ces cas de test de couverture de code sont écrits dans le même langage que le logiciel sous-jacent. GPT-3 est bien adapté à ce type de génération de code de test, car il est entraîné sur Github, entre autres sources, dans le cadre de ses données d'entraînement. Cela augmente considérablement la productivité des développeurs, car il leur suffit de vérifier que le code de couverture de test fourni par GPT-3 est exact. Cela devient un exercice de débogage plutôt qu'une tâche de programmation de la couverture du code.

Enseignements tirés de quelques mises en œuvre réelles

L'une des leçons les plus importantes que nous avons tirées des mises en œuvre chez les clients est la diversité des modèles qui existent au sein des différentes équipes. Étant donné que notre modèle de paire clé-valeur doit être entraîné sur des modèles spécifiques afin d'améliorer les performances, l'obtention de données d'entraînement suffisantes (échantillons pour chaque type de modèle) est une difficulté importante, d'autant plus lorsque des modèles plus récents sont utilisés dans les projets.

Lors de la démonstration de ces solutions basées sur GPT-3 à des clients, il arrive que l'on fasse de la survente ou que l'on croie que les modèles font tout. Ce n'est pas le cas. GPT-3 génère fréquemment du code obsolète et fait des appels à des bibliothèques obsolètes. Parfois, il ne fonctionne tout simplement pas correctement et produit des déchets. La conception de l'invite appropriée est un talent qui doit être acquis via une utilisation extensive de GPT-3 et l'expérimentation de la façon de configurer les paramètres du modèle. En juillet 2021, GPT-3 n'est intégré à aucun système en nuage, ce qui pose des problèmes de sécurité et d'intégration.

Des modèles plus récents comme CuBERT (Code Understanding BERT) sont constamment développés et il est essentiel de les utiliser pour les travaux NLP/NLU afin d'en améliorer la qualité.

About the author

Rajeswaran Viswanathan

Rajeswaran Viswanathan

Rajeswaran Viswanathan is the head of AI Center of Excellence in India. He has published many papers and articles. He is the author of proportion – A comprehensive R package for inference on single. Binomial proportion and Bayesian computations. It is most widely used for categorical data analysis. He has a passion for teaching and mentoring next generation of data scientists.

About Capgemini

Capgemini is a global leader in partnering with companies to transform and manage their business by harnessing the power of technology. The Group is guided everyday by its purpose of unleashing human energy through technology for an inclusive and sustainable future. It is a responsible and diverse organisation of 270,000 team members in nearly 50 countries. With its strong 50 year heritage and deep industry expertise, Capgemini is trusted by its clients to address the entire breadth of their business needs, from strategy and design to operations, fueled by the fast evolving and innovative world of cloud, data, AI, connectivity, software, digital engineering and platforms. The Group reported in 2020 global revenues of €16 billion.

Get the Future You Want I www.capgemini.com

We respect your privacy

We use cookies to improve your experience on our website. They help us to improve site performance, present you relevant advertising and enable you to share content in social media.

You may accept all cookies, or choose to manage them individually. You can change your settings at any time by clicking Cookie Settings available in the footer of every page.

For more information related to the cookies, please visit our cookie policy.

Cookies	Description
Registered visitor cookie	Cookie given to each registered user.
Registered visitor functionality cookie	Cookies used to remember the unique identifier given to each registered user.
Social plug-in content sharing cookie	Cookies set by services such as Facebook Connect or Twitter Button, which allow social networks users to share the content of our websites on social networks.
Unregistered visitor cookie	Cookies used to give to unregistered users a unique identifier in order to recognize them and to analyze how they use the website.
Analytic cookie	Cookies used to store URLs of the previous page visited, enabling to track users navigating from inside or from outside the website. If you click on a Sogeti advertisement on a non-Sogeti website, a cookie may be used to log which website you are on, in order to ensure our advertisements are served effectively and to measure whether our advertisements are viewed. Google Analytics: cookies set by Google analytics are used for web analytical purpose, but are not used to track individual users. For further information on how Google Analytics collects and uses information on our behalf and the right to use such cookies, please refer to the Google Analytics products and services privacy statement. If you object to your Personal Data being collected by Google Analytics, you may download and install the Google Analytics Opt-out Browser Add-on. Pardot: cookies set by Pardot are used to track users on our website. Visits are tracked for known users only. Unknown users are recorded as anonymous users. Please refer to Pardot privacy policy for any further information on their use and your rights related to the use of such cookies.

le NLG dans le développement logiciel

Download the "Section 3.2: Inform & Interpret" as a PDF

Use the site navigation to visit other sections and download further PDF content

Dans ce court chapitre, nous présentons quelques exemples concrets qui peuvent bénéficier de la génération en langage naturel (NLG). Il s'agit d'une technologie naissante avec de nombreuses utilisations potentielles, que nous commençons tout juste à étudier.

Enseignements tirés de quelques mises en œuvre réelles

About the author

About Capgemini