


Calcul du score BLEU pour la traduction automatique neuronale à l'aide de Python
En utilisant la traduction automatique neuronale en NMT ou NLP, nous pouvons traduire du texte d'une langue donnée vers une langue cible. Pour évaluer la qualité de la traduction, nous avons utilisé les scores des étudiants BLEU ou Bilingual Assessment en Python.
Le score BLEU fonctionne en comparant les phrases traduites automatiquement aux phrases traduites par l'homme, toutes deux utilisant des n-grammes. De plus, à mesure que la durée de la peine augmente, le score BLEU diminue. Généralement, les scores BLEU vont de 0 à 1, les valeurs plus élevées indiquant une meilleure qualité. Cependant, obtenir des scores parfaits est très rare. Notez que l'évaluation est effectuée sur la base de la correspondance des sous-chaînes, elle ne prend pas en compte d'autres aspects du langage tels que la cohérence, le temps et la grammaire.
Formule
BLEU = BP * exp(1/n * sum_{i=1}^{n} log(p_i))
Ici, chaque terme a la signification suivante -
BP est une pénalité de brièveté. Il ajuste le score BLEU en fonction de la longueur des deux textes. Sa formule est -
BP = min(1, exp(1 - (r / c)))
n est l'ordre maximum de correspondance n-gramme
p_i est le score de précision
Algorithme
Étape 1 - Importez la bibliothèque de jeux de données.
Étape 2 - Utilisez la fonction load_metric avec bleu comme paramètre.
Étape 3 - Faites une liste basée sur les mots de la chaîne traduite.
Étape 4 - Répétez l'étape 3 avec les mots de la chaîne de sortie souhaitée.
Étape 5 - Utilisez bleu.compute pour trouver la valeur bleu.
Exemple 1
Dans cet exemple, nous utiliserons la bibliothèque NLTK de Python pour calculer le score BLEU pour la traduction automatique d'une phrase allemande vers l'anglais.
Texte source (anglais) - Il pleut aujourd'hui
Texte traduit automatiquement – Il pleut aujourd'hui
Texte obligatoire - Il pleut aujourd'hui, il pleut aujourd'hui
Bien que nous puissions constater que la traduction n'a pas été effectuée correctement, nous pouvons avoir une meilleure idée de la qualité de la traduction en recherchant la partition bleue.
Exemple
#import the libraries from datasets import load_metric #use the load_metric function bleu = load_metric("bleu") #setup the predicted string predictions = [["it", "rain", "today"]] #setup the desired string references = [ [["it", "is", "raining", "today"], ["it", "was", "raining", "today"]] ] #print the values print(bleu.compute(predictions=predictions, references=references))
Sortie
{'bleu': 0.0, 'precisions': [0.6666666666666666, 0.0, 0.0, 0.0], 'brevity_penalty': 0.7165313105737893, 'length_ratio': 0.75, 'translation_length': 3, 'reference_length': 4}
Vous pouvez voir que la traduction n'est pas très bonne, donc le score bleu est de 0.
Exemple 2
Dans cet exemple, nous calculerons à nouveau le score BLEU. Mais cette fois, nous traduirons automatiquement une phrase française vers l’anglais.
Texte source (allemand) - Nous partons en voyage
Texte traduit automatiquement - Nous partons en voyage
Texte obligatoire - Nous allons voyager, nous allons voyager
Vous pouvez constater que cette fois le texte traduit est plus proche du texte souhaité. Vérifions son score BLEU.
Exemple
#import the libraries from datasets import load_metric #use the load_metric function bleu = load_metric("bleu") #steup the predicted string predictions = [["we", "going", "on", "a", "trip"]] #steup the desired string references = [ [["we", "are", "going", "on", "a", "trip"], ["we", "were", "going", "on", "a", "trip"]] ] #print the values print(bleu.compute(predictions=predictions, references=references))
Sortie
{'bleu': 0.5789300674674098, 'precisions': [1.0, 0.75, 0.6666666666666666, 0.5], 'brevity_penalty': 0.8187307530779819, 'length_ratio': 0.8333333333333334, 'translation_length': 5, 'reference_length': 6}
Vous pouvez voir que la traduction terminée cette fois est très proche du résultat souhaité, donc le score bleu est également supérieur à 0,5.
Conclusion
BLEU Score est un excellent outil pour vérifier l'efficacité de votre modèle de traduction afin que vous puissiez l'améliorer davantage et produire de meilleurs résultats. Bien que le score BLEU puisse être utilisé pour se faire une idée approximative d’un modèle, il se limite à un vocabulaire précis et ignore souvent les nuances du langage. C'est pourquoi les scores BLEU sont rarement compatibles avec le jugement humain. Mais vous pouvez certainement essayer des alternatives comme le score ROUGE, la métrique METEOR et la métrique CIDEr.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

PHP et Python ont chacun leurs propres avantages et choisissent en fonction des exigences du projet. 1.Php convient au développement Web, en particulier pour le développement rapide et la maintenance des sites Web. 2. Python convient à la science des données, à l'apprentissage automatique et à l'intelligence artificielle, avec syntaxe concise et adaptée aux débutants.

Python excelle dans les jeux et le développement de l'interface graphique. 1) Le développement de jeux utilise Pygame, fournissant des fonctions de dessin, audio et d'autres fonctions, qui conviennent à la création de jeux 2D. 2) Le développement de l'interface graphique peut choisir Tkinter ou Pyqt. Tkinter est simple et facile à utiliser, PYQT a des fonctions riches et convient au développement professionnel.

La fonction ReadDir dans le système Debian est un appel système utilisé pour lire le contenu des répertoires et est souvent utilisé dans la programmation C. Cet article expliquera comment intégrer ReadDir avec d'autres outils pour améliorer sa fonctionnalité. Méthode 1: combinant d'abord le programme de langue C et le pipeline, écrivez un programme C pour appeler la fonction readdir et sortir le résultat: # include # include # include # includeIntmain (intargc, char * argv []) {dir * dir; structDirent * entrée; if (argc! = 2) {

Pour maximiser l'efficacité de l'apprentissage de Python dans un temps limité, vous pouvez utiliser les modules DateTime, Time et Schedule de Python. 1. Le module DateTime est utilisé pour enregistrer et planifier le temps d'apprentissage. 2. Le module de temps aide à définir l'étude et le temps de repos. 3. Le module de planification organise automatiquement des tâches d'apprentissage hebdomadaires.

Cet article vous guidera sur la façon de mettre à jour votre certificat NGINXSSL sur votre système Debian. Étape 1: Installez d'abord CERTBOT, assurez-vous que votre système a des packages CERTBOT et Python3-CERTBOT-NGINX installés. Si ce n'est pas installé, veuillez exécuter la commande suivante: Sudoapt-getUpDaSuDoapt-GetInstallCertBotpyThon3-Certerbot-Nginx Étape 2: Obtenez et configurez le certificat Utilisez la commande Certbot pour obtenir le certificat LETSCRYPT et configure

La configuration d'un serveur HTTPS sur un système Debian implique plusieurs étapes, notamment l'installation du logiciel nécessaire, la génération d'un certificat SSL et la configuration d'un serveur Web (tel qu'Apache ou Nginx) pour utiliser un certificat SSL. Voici un guide de base, en supposant que vous utilisez un serveur Apacheweb. 1. Installez d'abord le logiciel nécessaire, assurez-vous que votre système est à jour et installez Apache et OpenSSL: SudoaptupDaSuDoaptupgradeSudoaptinsta

Développer un plugin Gitlab sur Debian nécessite des étapes et des connaissances spécifiques. Voici un guide de base pour vous aider à démarrer avec ce processus. Installation de GitLab Tout d'abord, vous devez installer GitLab sur votre système Debian. Vous pouvez vous référer au manuel d'installation officiel de Gitlab. Obtenez un jeton d'accès API avant d'effectuer l'intégration de l'API, vous devez d'abord obtenir le jeton d'accès API de GitLab. Ouvrez le tableau de bord GitLab, recherchez l'option "AccessTokens" dans les paramètres utilisateur et générez un nouveau jeton d'accès. Sera généré

Apache est le héros derrière Internet. Ce n'est pas seulement un serveur Web, mais aussi une plate-forme puissante qui prend en charge un trafic énorme et fournit un contenu dynamique. Il offre une flexibilité extrêmement élevée grâce à une conception modulaire, permettant l'expansion de diverses fonctions au besoin. Cependant, la modularité présente également des défis de configuration et de performance qui nécessitent une gestion minutieuse. Apache convient aux scénarios de serveur qui nécessitent des besoins complexes hautement personnalisables.
