Section 3.2 : Traitement du langage

Introduction

À mesure que la quantité de données textuelles que nous générons tout au long du cycle de vie des applications augmente, nous pourrions consider aborder et traiter ces données dans notre prise de décision. Pour cela, nous avons besoin d'aide pour les analyser, catégoriser et hiérarchiser. La contrainte est la nature déroutante et diversifiée du langage humain. Nous avons des distinctions dans nos langues syntaxiques, sémantiques et régionales. En outre, la compréhension de notre expertise dans le domaine de l'ingénierie de la Qualité est nécessaire. Cette section traite de la manière dont l'intelligence artificielle, et plus précisément le traitement du langage naturel (NLP), nous permet de comprendre des informations non structurées et d'en tirer des enseignements significatifs. Permettez-nous d'examiner le contexte de deux études de cas différentes avant de vous présenter le NLP dans le chapitre suivant.

Étude de cas n° 1 : la nécessité d'une analyse de couverture automatisée

La conception et la production de cas de test sont des activités essentiellement manuelles qui occupent jusqu'à 70% du temps au cours du cycle de vie d'un test logiciel. Les scénarios de test préparés par des testeurs inexpérimentés ne répondent souvent pas de manière adéquate aux exigences fonctionnelles. De plus, les changements d'exigences révèlent l'impossibilité de réutiliser les cas de test générés manuellement, ce qui entraîne des retards et des augmentations de coûts. De nombreux projets logiciels font appel à un certain type de développement axé sur le comportement pour définir les exigences, qui passent des parties prenantes de l'entreprise aux récits d'utilisateurs en langage clair.

Les exigences de l'utilisateur doivent finalement être converties en langage naturel, afin qu'elles soient faciles à comprendre et à mettre en œuvre par les humains. Les cas de test en langage naturel ont des limites en raison de la possibilité d'une interprétation incorrecte entraînant des erreurs de vérification.

La traçabilité des exigences des utilisateurs et des cas de test peut être établie et utilisée pour l'analyse de la couverture des exigences par les tests. La documentation technique de l'utilisateur final, qui couvre souvent les caractéristiques et les fonctions, n'est jamais examinée, et il n'y a pas de correspondance entre les techniques de cas de test et la documentation technique. Pour comprendre les systèmes haut de gamme et sensibles qui sont contrôlés par des opérateurs professionnels, il est recommandé de consulter le document technique de l'utilisateur final. Cela met en évidence la nature critique de s'assurer que les différents domaines/flux de travail énoncés dans la spécification technique sont couverts par les procédures de test conçues et d'identifier toute lacune éventuelle.

Pour toute entreprise développant des logiciels, le contrôle de la qualité doit être un facteur de différenciation pour garantir la qualité, la stabilité et la résilience du produit. Pour assurer une couverture optimale des fonctionnalités du logiciel, il est nécessaire d'écrire et de mettre en œuvre des procédures de test appropriées par rapport à l'ensemble des fonctionnalités. La traçabilité entre les caractéristiques du produit et les procédures de test est une tâche exigeante et complexe.

Ce contexte était celui d'une entreprise américaine spécialisée dans la production de dispositifs médicaux. Une traçabilité de bout en bout entre les caractéristiques du produit et les processus de test a été établie à l'aide du traitement du langage naturel et de techniques avancées d'apprentissage profond, garantissant que les caractéristiques du produit recevaient le maximum de couverture de test. Cette solution s'est avérée extrêmement bénéfique en termes d'assurance qualité des produits et de réduction des coûts en réduisant le processus difficile d'élaboration de la stratégie et de la conception des tests. Avec l'aide de la solution construite, des fonctionnalités avec une couverture de test éparse ou nulle ont été trouvées, aidant les gestionnaires de test à améliorer leur stratégie de test, leur planification et leur conception. Ici, IBM Watson, Java, Cloudent DB, IBM Bluemix furent déployés.

Étude de cas n° 2 : la nécessité de détailler les éléments de classification

Lorsqu'un projet logiciel prend de l'ampleur, la gestion du flux de travail et du processus de développement devient plus difficile. Par conséquent, il est essentiel que l'équipe de pilotage comprenne la nature du travail effectué par les différentes équipes de développeurs.

En termes plus simples, tout développeur, à tout moment au cours des différentes phases du projet, peut écrire du code qui cherche à accomplir l'une des tâches suivantes :

L'ajout de nouvelles fonctionnalités
Amélioration de la conception
Correction de bogues
Amélioration des exigences non fonctionnelles

L'objectif ici est de définir quelques grandes catégories de travail qui couvrent la grande majorité des tâches de développement.

Comprendre comment les différentes équipes de développement répartissent leur travail entre les quatre catégories ci-dessus peut s'avérer utile dans le pilotage quotidien des outils en développement. Si la majorité du temps est consacrée à la résolution d'anomalies, la direction devrait demander aux développeurs principaux d'accorder une plus grande importance à la qualité.

Pour ce faire, nous pouvons utiliser les commentaires de commit, qui sont fournis en langage naturel par les développeurs. Ces commentaires peuvent être étiquetés et utilisés pour former des classificateurs qui classeront ensuite automatiquement les changements futurs.

Il s'agit de la méthodologie adoptée par l'ingénierie Capgemini dans les secteurs de la santé, de l'automobile et des fournisseurs indépendants de logiciels (ISV). La technologie sous-jacente est Python, Sklearn, NLTK, Numpy, Pandas, MySQL.

La méthode construite pour classer les commits à l'aide du traitement du langage naturel (NLP) a atteint une précision supérieure à 90 % et a permis de classer les commits entrants dans l'une des catégories indiquées ci-dessus. Il est devenu plus facile d'évaluer le processus de développement logiciel et le flux de travail d'une très grande équipe en utilisant cette solution de génie logiciel. La répartition des efforts et la dynamique du projet sont plus faciles à suivre et à optimiser.

Dans cette section

Chapitre 1: L'intérêt du NLP et du NLU

Chapitre 2: Le NLP pour les artefacts dupliqués et orphelins

Chapitre 3: le NLG dans le développement logiciel

Chapitre 4: Le NLP pour les recommandations en aval

Chapitre 5: le NLP et l'analyse des sentiments

We respect your privacy

We use cookies to improve your experience on our website. They help us to improve site performance, present you relevant advertising and enable you to share content in social media.

You may accept all cookies, or choose to manage them individually. You can change your settings at any time by clicking Cookie Settings available in the footer of every page.

For more information related to the cookies, please visit our cookie policy.

Cookies	Description
Registered visitor cookie	Cookie given to each registered user.
Registered visitor functionality cookie	Cookies used to remember the unique identifier given to each registered user.
Social plug-in content sharing cookie	Cookies set by services such as Facebook Connect or Twitter Button, which allow social networks users to share the content of our websites on social networks.
Unregistered visitor cookie	Cookies used to give to unregistered users a unique identifier in order to recognize them and to analyze how they use the website.
Analytic cookie	Cookies used to store URLs of the previous page visited, enabling to track users navigating from inside or from outside the website. If you click on a Sogeti advertisement on a non-Sogeti website, a cookie may be used to log which website you are on, in order to ensure our advertisements are served effectively and to measure whether our advertisements are viewed. Google Analytics: cookies set by Google analytics are used for web analytical purpose, but are not used to track individual users. For further information on how Google Analytics collects and uses information on our behalf and the right to use such cookies, please refer to the Google Analytics products and services privacy statement. If you object to your Personal Data being collected by Google Analytics, you may download and install the Google Analytics Opt-out Browser Add-on. Pardot: cookies set by Pardot are used to track users on our website. Visits are tracked for known users only. Unknown users are recorded as anonymous users. Please refer to Pardot privacy policy for any further information on their use and your rights related to the use of such cookies.

Section 3.2 : Traitement du langage

Download the "Section 3.2: Inform & Interpret" as a PDF

Use the site navigation to visit other sections and download further PDF content

Étude de cas n° 1 : la nécessité d'une analyse de couverture automatisée

Étude de cas n° 2 : la nécessité de détailler les éléments de classification

Dans cette section