Table des matières
Système basé sur des règles
Systèmes basés sur l'apprentissage automatique
Comparaison
Systèmes hybrides
Cas
Soins de santé
Transactions frauduleuses
Résumé
Maison Périphériques technologiques IA Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

May 25, 2023 am 09:04 AM
机器学习 ml

Après toutes ces années, nous sommes tous convaincus que le ML peut, sinon mieux fonctionner, du moins égaler les solutions pré-ML presque partout. Par exemple, pour certaines contraintes de règles, nous réfléchirons tous à la question de savoir si elles peuvent être remplacées par un modèle ML basé sur une arborescence. Mais le monde n’est pas toujours noir et blanc, et même si l’apprentissage automatique a certainement sa place dans la résolution des problèmes, il n’est pas toujours la meilleure solution. Les systèmes basés sur des règles peuvent même surpasser l'apprentissage automatique, en particulier dans les domaines où l'explicabilité, la robustesse et la transparence sont essentielles.

Dans cet article, je présenterai quelques cas pratiques et comment la combinaison de règles manuelles et de ML améliore notre solution.

Système basé sur des règles

Un système basé sur des règles fournit une aide à la prise de décision grâce à des règles prédéfinies. Le système évalue les données en fonction de règles stockées et effectue des opérations spécifiques basées sur des mappages.

Voici quelques exemples :

Détection de fraude : dans la détection de fraude, des systèmes basés sur des règles peuvent être utilisés pour signaler et enquêter rapidement sur les transactions suspectes en fonction de règles prédéfinies.

Par exemple, les tricheurs d'échecs, leur méthode de base consiste à installer une application d'échecs informatique dans une autre fenêtre et à utiliser le programme pour jouer aux échecs. Quelle que soit la complexité du programme, chaque étape prend 4 à 5 secondes. Par conséquent, un « seuil » est ajouté pour calculer le temps de chaque pas du joueur. Si la fluctuation n'est pas importante, il peut être jugé comme tricheur, comme le montre la figure ci-dessous :

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

Industrie de la santé. : Des systèmes basés sur des règles peuvent être utilisés. Gérez les prescriptions et évitez les erreurs de médication. Ils peuvent également être très utiles pour aider les médecins à prescrire des analyses supplémentaires aux patients en fonction des résultats antérieurs.

Gestion de la chaîne d'approvisionnement : dans la gestion de la chaîne d'approvisionnement, des systèmes basés sur des règles peuvent être utilisés pour générer des alertes de faible stock, aider à gérer les dates d'expiration ou les lancements de nouveaux produits.

Systèmes basés sur l'apprentissage automatique

Les systèmes d'apprentissage automatique (ML) utilisent des algorithmes pour apprendre à partir des données et faire des prédictions ou entreprendre des actions sans avoir à être explicitement programmés. Les systèmes d’apprentissage automatique utilisent les connaissances acquises grâce à la formation sur de grandes quantités de données pour faire des prédictions et prendre des décisions concernant de nouvelles données. Les algorithmes de ML peuvent améliorer leurs performances à mesure que davantage de données sont utilisées pour la formation. Les systèmes d'apprentissage automatique incluent le traitement du langage naturel, la reconnaissance d'images et de parole, l'analyse prédictive, etc.

Détection de fraude : les banques peuvent utiliser des systèmes d'apprentissage automatique pour tirer des enseignements des transactions frauduleuses passées et identifier les activités frauduleuses potentielles en temps réel. Ou bien, il pourrait effectuer une ingénierie inverse du système et rechercher des transactions qui semblent très « anormales ».

Soins de santé : les hôpitaux peuvent utiliser des systèmes ML pour analyser les données des patients et prédire la probabilité qu'un patient développe une certaine maladie sur la base de certaines radiographies.

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

Comparaison

Les systèmes basés sur des règles et les systèmes ML ont leurs propres avantages et inconvénients

Les avantages des systèmes basés sur des règles sont évidents :

  • Facile à comprendre et à expliquer
  • Rapide à mettre en œuvre
  • Facile à modifier
  • Robuste

Inconvénients :

  • Problèmes impliquant un grand nombre de variables
  • Problèmes avec de nombreuses contraintes
  • Limité aux règles existantes

Les avantages des systèmes basés sur le ML sont également évidents

  • Système d'apprentissage autonome
  • La capacité de résoudre des problèmes plus complexes
  • Intervention humaine réduite et efficacité améliorée par rapport aux systèmes basés sur des règles
  • Adaptation flexible aux changements de données et d'environnement grâce à l'apprentissage continu

Inconvénients :

  • Données requises, Parfois, beaucoup de
  • se limite aux données ML que nous avons vues auparavant
  • Capacité cognitive limitée

Grâce à la comparaison, nous avons constaté que les avantages et les inconvénients des deux systèmes ne sont pas contradictoires et sont complémentaires. Existe-t-il donc un moyen. les combiner ? Comment combiner leurs avantages ?

Systèmes hybrides

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

Les systèmes hybrides, qui combinent des systèmes basés sur des règles et des algorithmes d'apprentissage automatique, sont devenus de plus en plus populaires récemment. Ils peuvent fournir des résultats plus robustes, précis et efficaces, en particulier lorsqu’il s’agit de problèmes complexes.

Jetons un coup d'œil à un système hybride qui peut être mis en œuvre à l'aide de l'ensemble de données de location :

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

Ingénierie des fonctionnalités : convertissez les étages en l'une des trois catégories suivantes : élevé, moyen ou faible, en fonction de l'étage du bâtiment. nombre. Cela peut améliorer l'efficacité des modèles ML

Des règles codées en dur peuvent être utilisées dans le cadre du processus d'ingénierie des fonctionnalités pour identifier et extraire les fonctionnalités importantes dans les données d'entrée. Par exemple, si le domaine problématique est clair et sans ambiguïté, les règles peuvent être définies facilement et avec précision, et des règles codées en dur peuvent être utilisées pour créer de nouvelles fonctionnalités ou modifier des fonctionnalités existantes afin d'améliorer les performances du modèle d'apprentissage automatique. Bien que les règles de codage en dur et l’ingénierie des fonctionnalités soient deux techniques différentes, elles peuvent être utilisées ensemble pour améliorer les performances des modèles d’apprentissage automatique. Les règles codées en dur peuvent être utilisées pour créer de nouvelles fonctionnalités ou modifier des fonctionnalités existantes, tandis que l'ingénierie des fonctionnalités peut être utilisée pour extraire des fonctionnalités qui ne sont pas facilement capturées par des règles codées en dur.

Post-traitement : arrondissez ou normalisez le résultat final.

Des règles codées en dur peuvent être utilisées dans le cadre de l'étape de post-traitement pour modifier la sortie du modèle d'apprentissage automatique. Par exemple, si un modèle d'apprentissage automatique génère un ensemble de prédictions incompatibles avec certaines règles ou contraintes connues, des règles codées en dur peuvent être utilisées pour modifier les prédictions afin qu'elles soient conformes aux règles ou contraintes. Les techniques de post-traitement telles que le filtrage ou le lissage peuvent affiner le résultat d'un modèle d'apprentissage automatique en supprimant le bruit ou les erreurs, ou en améliorant la précision globale des prédictions. Ces techniques sont particulièrement efficaces lorsqu'il existe une incertitude dans les prédictions probabilistes de sortie du modèle d'apprentissage automatique ou dans les données d'entrée. Dans certains cas, des techniques de post-traitement peuvent également être utilisées pour améliorer les données d'entrée avec des informations supplémentaires. Par exemple, si un modèle d'apprentissage automatique est formé sur un ensemble de données limité, des techniques de post-traitement peuvent être utilisées pour extraire des fonctionnalités supplémentaires de sources externes (telles que les réseaux sociaux ou les flux d'actualités) afin d'améliorer la précision des prédictions.

Cas

Soins de santé

Jetons un coup d'œil aux données sur les maladies cardiaques :

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

Si nous utilisons une forêt aléatoire pour prédire la classe cible :

clf = RandomForestClassifier(n_estimators=100, random_state=random_seed
 X_train, X_test, y_train, y_test = train_test_split(
 df.iloc[:, :-1], df.iloc[:, -1], test_size=0.30, random_state=random_seed
 )
 clf.fit(X_train, y_train))
Copier après la connexion

L'une des raisons du choix de la forêt aléatoire ici est ses capacités d’importance des fonctionnalités de construction. L'importance des fonctionnalités utilisées pour l'entraînement est visible ci-dessous :

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

Regardez les résultats :

y_pred = pd.Series(clf.predict(X_test), index=y_test.index
 cm = confusion_matrix(y_test, y_pred, labels=clf.classes_)
 conf_matrix = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=clf.classes_)
 conf_matrix.plot())
Copier après la connexion

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

f1_score(y_test, y_pred): 0.74
 recall_score(y_test, y_pred): 0.747
Copier après la connexion

C'est à ce moment-là qu'un cardiologue voit votre modèle. Sur la base de son expérience et de ses connaissances du domaine, il estime que la caractéristique de la thalassémie (thal) est bien plus importante que ce qui est indiqué ci-dessus. Nous avons donc décidé de créer un histogramme et de voir les résultats.

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

Spécifiez ensuite une règle obligatoire

y_pred[X_test[X_test["thal"] == 2].index] = 1
Copier après la connexion

La matrice de confusion résultante devient comme ceci :

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

f1_score(y_test, y_pred): 0.818
 recall_score(y_test, y_pred): 0.9
Copier après la connexion

Le résultat a été grandement amélioré. C’est là que la connaissance du domaine joue un rôle important dans l’évaluation des scores des patients.

Transactions frauduleuses

L'ensemble de données ci-dessous concerne les transactions frauduleuses bancaires.

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

L'ensemble de données est fortement déséquilibré :

df["Class"].value_counts()
 0 28431
 1 4925
Copier après la connexion

Pour créer les règles, nous examinons le diagramme de distribution des fonctionnalités :

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

Nous allons écrire notre propre classe HybridEstimator qui servira de prédicteur pour les règles manuelles :

from hulearn.classification import FunctionClassifier
 rules = {
 "V3": ("<=", -2),
 "V12": ("<=", -3),
 "V17": ("<=", -2),
 }
 def create_rules(data: pd.DataFrame, rules):
 filtered_data = data.copy()
 for col in rules:
 filtered_data[col] = eval(f"filtered_data[col] {rules[col][0]} {rules[col][1]}")
 result = np.array(filtered_data[list(rules.keys())].min(axis=1)).astype(int)
 return result
 hybrid_classifier = FunctionClassifier(create_rules, rules=rules)
Copier après la connexion

Nous pouvons comparer les résultats d'un système purement basé sur des règles et de la méthode kNN. La raison d'utiliser kNN ici est qu'il peut gérer des données déséquilibrées :

Combinez des approches basées sur des règles et du machine learning pour créer de puissants systèmes hybrides

. Comme nous pouvons le voir, avec seulement 3 règles écrites, il fonctionne mieux que le modèle KNN

Résumé

Notre exemple ici n'est peut-être pas très précis, mais il suffit d'illustrer que le modèle hybride offre des avantages pratiques, tels qu'une rapidité mise en œuvre, bonne réponse aux valeurs aberrantes, robustesse et transparence accrue. Ils sont utiles lorsqu’il s’agit de combiner la logique métier avec l’apprentissage automatique. Par exemple, les systèmes hybrides règles-ML dans le domaine de la santé peuvent diagnostiquer des maladies en combinant des règles cliniques avec des algorithmes d'apprentissage automatique qui analysent les données des patients. L'apprentissage automatique peut obtenir d'excellents résultats sur de nombreuses tâches, mais il nécessite également des connaissances supplémentaires dans un domaine. La connaissance du domaine peut aider les modèles d'apprentissage automatique à mieux comprendre les données, ainsi qu'à prédire et classer avec plus de précision.

Les modèles hybrides peuvent nous aider à combiner la connaissance du domaine et les modèles d'apprentissage automatique. Les modèles hybrides sont généralement composés de plusieurs sous-modèles, chacun étant optimisé pour une connaissance d'un domaine spécifique. Ces sous-modèles peuvent être des modèles basés sur des règles codées en dur, des modèles basés sur des méthodes statistiques, ou encore des modèles basés sur le deep learning.

Les modèles hybrides peuvent utiliser les connaissances du domaine pour guider le processus d'apprentissage des modèles d'apprentissage automatique, améliorant ainsi la précision et la fiabilité du modèle. Par exemple, dans le domaine médical, les modèles hybrides peuvent combiner l’expertise d’un médecin avec la puissance d’un modèle d’apprentissage automatique pour diagnostiquer la maladie d’un patient. Dans le domaine du traitement du langage naturel, les modèles hybrides peuvent combiner les connaissances linguistiques et les capacités des modèles d’apprentissage automatique pour mieux comprendre et générer du langage naturel.

En bref, les modèles hybrides peuvent nous aider à combiner la connaissance du domaine et les modèles d'apprentissage automatique, améliorant ainsi la précision et la fiabilité du modèle, et ayant un large éventail d'applications dans diverses tâches.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Cet article vous amènera à comprendre SHAP : explication du modèle pour l'apprentissage automatique Cet article vous amènera à comprendre SHAP : explication du modèle pour l'apprentissage automatique Jun 01, 2024 am 10:58 AM

Dans les domaines de l’apprentissage automatique et de la science des données, l’interprétabilité des modèles a toujours été au centre des préoccupations des chercheurs et des praticiens. Avec l'application généralisée de modèles complexes tels que l'apprentissage profond et les méthodes d'ensemble, la compréhension du processus décisionnel du modèle est devenue particulièrement importante. Explainable AI|XAI contribue à renforcer la confiance dans les modèles d'apprentissage automatique en augmentant la transparence du modèle. L'amélioration de la transparence des modèles peut être obtenue grâce à des méthodes telles que l'utilisation généralisée de plusieurs modèles complexes, ainsi que les processus décisionnels utilisés pour expliquer les modèles. Ces méthodes incluent l'analyse de l'importance des caractéristiques, l'estimation de l'intervalle de prédiction du modèle, les algorithmes d'interprétabilité locale, etc. L'analyse de l'importance des fonctionnalités peut expliquer le processus de prise de décision du modèle en évaluant le degré d'influence du modèle sur les fonctionnalités d'entrée. Estimation de l’intervalle de prédiction du modèle

Transparent! Une analyse approfondie des principes des principaux modèles de machine learning ! Transparent! Une analyse approfondie des principes des principaux modèles de machine learning ! Apr 12, 2024 pm 05:55 PM

En termes simples, un modèle d’apprentissage automatique est une fonction mathématique qui mappe les données d’entrée à une sortie prédite. Plus précisément, un modèle d'apprentissage automatique est une fonction mathématique qui ajuste les paramètres du modèle en apprenant à partir des données d'entraînement afin de minimiser l'erreur entre la sortie prédite et la véritable étiquette. Il existe de nombreux modèles dans l'apprentissage automatique, tels que les modèles de régression logistique, les modèles d'arbre de décision, les modèles de machines à vecteurs de support, etc. Chaque modèle a ses types de données et ses types de problèmes applicables. Dans le même temps, il existe de nombreux points communs entre les différents modèles, ou il existe une voie cachée pour l’évolution du modèle. En prenant comme exemple le perceptron connexionniste, en augmentant le nombre de couches cachées du perceptron, nous pouvons le transformer en un réseau neuronal profond. Si une fonction noyau est ajoutée au perceptron, elle peut être convertie en SVM. celui-ci

Identifier le surapprentissage et le sous-apprentissage grâce à des courbes d'apprentissage Identifier le surapprentissage et le sous-apprentissage grâce à des courbes d'apprentissage Apr 29, 2024 pm 06:50 PM

Cet article présentera comment identifier efficacement le surajustement et le sous-apprentissage dans les modèles d'apprentissage automatique grâce à des courbes d'apprentissage. Sous-ajustement et surajustement 1. Surajustement Si un modèle est surentraîné sur les données de sorte qu'il en tire du bruit, alors on dit que le modèle est en surajustement. Un modèle surajusté apprend chaque exemple si parfaitement qu'il classera mal un exemple inédit/inédit. Pour un modèle surajusté, nous obtiendrons un score d'ensemble d'entraînement parfait/presque parfait et un score d'ensemble/test de validation épouvantable. Légèrement modifié : "Cause du surajustement : utilisez un modèle complexe pour résoudre un problème simple et extraire le bruit des données. Parce qu'un petit ensemble de données en tant qu'ensemble d'entraînement peut ne pas représenter la représentation correcte de toutes les données."

L'évolution de l'intelligence artificielle dans l'exploration spatiale et l'ingénierie des établissements humains L'évolution de l'intelligence artificielle dans l'exploration spatiale et l'ingénierie des établissements humains Apr 29, 2024 pm 03:25 PM

Dans les années 1950, l’intelligence artificielle (IA) est née. C’est à ce moment-là que les chercheurs ont découvert que les machines pouvaient effectuer des tâches similaires à celles des humains, comme penser. Plus tard, dans les années 1960, le Département américain de la Défense a financé l’intelligence artificielle et créé des laboratoires pour poursuivre son développement. Les chercheurs trouvent des applications à l’intelligence artificielle dans de nombreux domaines, comme l’exploration spatiale et la survie dans des environnements extrêmes. L'exploration spatiale est l'étude de l'univers, qui couvre l'ensemble de l'univers au-delà de la terre. L’espace est classé comme environnement extrême car ses conditions sont différentes de celles de la Terre. Pour survivre dans l’espace, de nombreux facteurs doivent être pris en compte et des précautions doivent être prises. Les scientifiques et les chercheurs pensent qu'explorer l'espace et comprendre l'état actuel de tout peut aider à comprendre le fonctionnement de l'univers et à se préparer à d'éventuelles crises environnementales.

Implémentation d'algorithmes d'apprentissage automatique en C++ : défis et solutions courants Implémentation d'algorithmes d'apprentissage automatique en C++ : défis et solutions courants Jun 03, 2024 pm 01:25 PM

Les défis courants rencontrés par les algorithmes d'apprentissage automatique en C++ incluent la gestion de la mémoire, le multithread, l'optimisation des performances et la maintenabilité. Les solutions incluent l'utilisation de pointeurs intelligents, de bibliothèques de threads modernes, d'instructions SIMD et de bibliothèques tierces, ainsi que le respect des directives de style de codage et l'utilisation d'outils d'automatisation. Des cas pratiques montrent comment utiliser la bibliothèque Eigen pour implémenter des algorithmes de régression linéaire, gérer efficacement la mémoire et utiliser des opérations matricielles hautes performances.

IA explicable : Expliquer les modèles IA/ML complexes IA explicable : Expliquer les modèles IA/ML complexes Jun 03, 2024 pm 10:08 PM

Traducteur | Revu par Li Rui | Chonglou Les modèles d'intelligence artificielle (IA) et d'apprentissage automatique (ML) deviennent aujourd'hui de plus en plus complexes, et le résultat produit par ces modèles est une boîte noire – impossible à expliquer aux parties prenantes. L'IA explicable (XAI) vise à résoudre ce problème en permettant aux parties prenantes de comprendre comment fonctionnent ces modèles, en s'assurant qu'elles comprennent comment ces modèles prennent réellement des décisions et en garantissant la transparence des systèmes d'IA, la confiance et la responsabilité pour résoudre ce problème. Cet article explore diverses techniques d'intelligence artificielle explicable (XAI) pour illustrer leurs principes sous-jacents. Plusieurs raisons pour lesquelles l’IA explicable est cruciale Confiance et transparence : pour que les systèmes d’IA soient largement acceptés et fiables, les utilisateurs doivent comprendre comment les décisions sont prises

Cinq écoles d'apprentissage automatique que vous ne connaissez pas Cinq écoles d'apprentissage automatique que vous ne connaissez pas Jun 05, 2024 pm 08:51 PM

L'apprentissage automatique est une branche importante de l'intelligence artificielle qui donne aux ordinateurs la possibilité d'apprendre à partir de données et d'améliorer leurs capacités sans être explicitement programmés. L'apprentissage automatique a un large éventail d'applications dans divers domaines, de la reconnaissance d'images et du traitement du langage naturel aux systèmes de recommandation et à la détection des fraudes, et il change notre façon de vivre. Il existe de nombreuses méthodes et théories différentes dans le domaine de l'apprentissage automatique, parmi lesquelles les cinq méthodes les plus influentes sont appelées les « Cinq écoles d'apprentissage automatique ». Les cinq grandes écoles sont l’école symbolique, l’école connexionniste, l’école évolutionniste, l’école bayésienne et l’école analogique. 1. Le symbolisme, également connu sous le nom de symbolisme, met l'accent sur l'utilisation de symboles pour le raisonnement logique et l'expression des connaissances. Cette école de pensée estime que l'apprentissage est un processus de déduction inversée, à travers les connaissances existantes.

Flash Attention est-il stable ? Meta et Harvard ont constaté que les écarts de poids de leur modèle fluctuaient de plusieurs ordres de grandeur. Flash Attention est-il stable ? Meta et Harvard ont constaté que les écarts de poids de leur modèle fluctuaient de plusieurs ordres de grandeur. May 30, 2024 pm 01:24 PM

MetaFAIR s'est associé à Harvard pour fournir un nouveau cadre de recherche permettant d'optimiser le biais de données généré lors de l'apprentissage automatique à grande échelle. On sait que la formation de grands modèles de langage prend souvent des mois et utilise des centaines, voire des milliers de GPU. En prenant comme exemple le modèle LLaMA270B, sa formation nécessite un total de 1 720 320 heures GPU. La formation de grands modèles présente des défis systémiques uniques en raison de l’ampleur et de la complexité de ces charges de travail. Récemment, de nombreuses institutions ont signalé une instabilité dans le processus de formation lors de la formation des modèles d'IA générative SOTA. Elles apparaissent généralement sous la forme de pics de pertes. Par exemple, le modèle PaLM de Google a connu jusqu'à 20 pics de pertes au cours du processus de formation. Le biais numérique est à l'origine de cette imprécision de la formation,

See all articles