


Techniques de fractionnement non conventionnelles pour les ensembles de données d'apprentissage automatique de séries chronologiques
Une tentative pour garantir que les modèles d'apprentissage automatique se généralisent dans des environnements inconnus consiste à diviser les données. Ceci peut être réalisé de différentes manières, depuis les divisions en 3 voies (entraînement, test, évaluation) jusqu'aux divisions en k validées de manière croisée. Le principe de base est qu'en entraînant un modèle d'apprentissage automatique sur un sous-ensemble de données et en l'évaluant sur des données inconnues, vous pouvez mieux déterminer si le modèle était sous-ajusté ou surajusté pendant l'entraînement.
Pour la plupart des travaux, un simple système à 3 voies suffit. En production réelle, les méthodes de fractionnement nécessitent souvent des méthodes plus complexes pour garantir les problèmes de généralisation. Ces répartitions sont plus complexes car elles sont dérivées de données réelles plutôt que des structures de données sur lesquelles sont basées les méthodes de répartition ordinaires. Cet article tente d'expliquer certaines manières non conventionnelles de diviser les données dans le développement de l'apprentissage automatique, ainsi que les raisons qui les sous-tendent.
Commençons par l'ensemble de données
Pour plus de simplicité, utilisons un format tabulaire pour représenter un simple ensemble de données de séries chronologiques multivariées. Les données se composent de 3 fonctionnalités numériques, 1 fonctionnalité catégorielle et 1 fonctionnalité d'horodatage. Voici la visualisation :
Ce type d'ensemble de données est courant dans de nombreux cas d'utilisation et industries pour l'apprentissage automatique. Un exemple spécifique est celui des données en continu transmises par plusieurs capteurs dans une usine. La variable catégorielle sera l'ID de la machine, la caractéristique numérique sera les informations que le capteur enregistre (par exemple pression, température, etc.) et l'horodatage sera l'heure à laquelle les données ont été transférées et enregistrées dans la base de données.
Split
Supposons que vous ayez reçu cet ensemble de données sous la forme d'un fichier csv du service d'ingénierie des données et que vous ayez été chargé d'écrire un modèle de classification ou de régression. Dans ce cas, l’étiquette peut être n’importe quelle fonctionnalité ou colonne supplémentaire. La première chose à faire est de diviser les données en sous-ensembles significatifs.
Pour plus de commodité, vous pouvez simplement diviser en ensemble d'entraînement et ensemble de test. Le problème se pose immédiatement : un simple fractionnement des données ne fonctionnera pas ici : les données sont composées de plusieurs flux de données de capteurs indexés dans le temps. Alors, comment diviser les données pour que l'ordre soit préservé et que le modèle d'apprentissage automatique ultérieur se généralise bien ?
Une autre vue des données
La transformation la plus simple que nous puissions faire est de représenter chaque donnée pour des classes catégorielles (dans notre exécution) exemple, visualisation des données pour chaque machine). Cela produira les résultats suivants :
Séparation horizontale
Le regroupement rend le problème de la séparation un peu plus facile, et cela dépend beaucoup de vos hypothèses. Vous vous demandez peut-être : comment un modèle d'apprentissage automatique formé sur un groupe se généralise-t-il à d'autres groupes, c'est-à-dire que s'il est formé sur les flux temporels de classe_1, classe_2 et classe_3, comment le modèle fonctionnera-t-il sur les flux temporels de classe_4 et de classe_5 ? Voici une visualisation de cette division :
La méthode de division ci-dessus est ce que j'appelle la division horizontale. Dans la plupart des bibliothèques d'apprentissage automatique, cette répartition est facilement réalisée en regroupant simplement par caractéristiques catégorielles et en partitionnant selon les catégories. En s'entraînant avec cette répartition, le modèle a collecté des informations qui se généralisent à des groupements inconnus.
Il convient de noter que le fractionnement n'utilise pas le temps comme base pour se diviser lui-même. Cependant, on peut supposer que vous diviserez également par ordre temporel de chaque flux temporel pour maintenir cette relation dans les données. Cela nous amène à la prochaine scission.
Partage vertical
Mais que se passe-t-il si vous souhaitez s'étaler sur le temps lui-même ? Pour la plupart des modélisations de séries chronologiques, les méthodes courantes de division des données sont passées et futures. Autrement dit, les données historiques de l'ensemble de formation sont comparées aux données de l'ensemble d'évaluation. L'hypothèse dans ce cas est la suivante : comment un modèle d'apprentissage automatique entraîné sur chaque groupe de données historiques se généralise-t-il à chaque groupe de données futures ? montrera que le modèle est capable d'extraire des modèles dans le flux temporel qu'il a observé et de faire des prédictions précises sur le comportement futur. Cependant, cela n’indique pas en soi que le modèle se généralise bien à d’autres flux temporels provenant de différents groupes.
Bien sûr, vos multiples flux temporels doivent désormais être triés individuellement, nous devons donc toujours les regrouper. Mais cette fois, au lieu de croiser les groupes, nous prélevons des échantillons de chaque groupe passé et les mettons en formation, et mettons le futur groupe en évaluation en conséquence. Dans cet exemple idéalisé, tous les flux temporels ont la même longueur, c'est-à-dire que chaque flux temporel a exactement le même nombre de points de données. Cependant, dans le monde réel, cela peut ne pas être le cas. Vous avez donc besoin d'un système permettant de créer des index pour chaque groupe à des fins de fractionnement.
Fractionnement hybride
Vous vous demandez peut-être s'ils peuvent générer un modèle qui puisse bien se généraliser sous les contraintes du fractionnement horizontal et vertical ? Dans ce cas, l'hypothèse serait la suivante : comment un modèle d'apprentissage automatique formé sur certains groupes de données historiques se généralise-t-il aux données futures de ces groupes et à toutes les données d'autres groupes ? Une visualisation de cette répartition hybride ressemblerait à ceci :
Bien sûr, si la formation du modèle réussit, ce modèle sera certainement plus robuste dans le monde réel que les autres modèles. Non seulement il peut démontrer qu’il a observé des modèles d’apprentissage pour certains groupes, mais il peut également démontrer qu’il a acquis des informations qui se généralisent à tous les groupes. Cela pourrait être utile si nous devions ajouter davantage de machines similaires à l’usine à l’avenir.
Division multidimensionnelle
Le concept de division horizontale et verticale peut être généralisé à de nombreuses dimensions. Par exemple, vous souhaiterez peut-être effectuer un regroupement en fonction de deux caractéristiques catégorielles au lieu d'une pour isoler davantage les sous-groupes dans vos données et les trier par sous-groupes. Il peut également y avoir une logique complexe au milieu pour filtrer les groupes avec des échantillons de petite taille, ainsi que d'autres logiques de niveau métier liées au domaine.
Conclusion
Cet exemple hypothétique sert à illustrer les possibilités infinies des différentes divisions d'apprentissage automatique qui peuvent être créées. Tout comme il est important de garantir l’équité de l’apprentissage automatique lors de l’évaluation des modèles, il est tout aussi important de consacrer suffisamment de temps à réfléchir au partitionnement de votre ensemble de données et à ses conséquences en matière de biais des modèles en aval.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Dans les domaines de l’apprentissage automatique et de la science des données, l’interprétabilité des modèles a toujours été au centre des préoccupations des chercheurs et des praticiens. Avec l'application généralisée de modèles complexes tels que l'apprentissage profond et les méthodes d'ensemble, la compréhension du processus décisionnel du modèle est devenue particulièrement importante. Explainable AI|XAI contribue à renforcer la confiance dans les modèles d'apprentissage automatique en augmentant la transparence du modèle. L'amélioration de la transparence des modèles peut être obtenue grâce à des méthodes telles que l'utilisation généralisée de plusieurs modèles complexes, ainsi que les processus décisionnels utilisés pour expliquer les modèles. Ces méthodes incluent l'analyse de l'importance des caractéristiques, l'estimation de l'intervalle de prédiction du modèle, les algorithmes d'interprétabilité locale, etc. L'analyse de l'importance des fonctionnalités peut expliquer le processus de prise de décision du modèle en évaluant le degré d'influence du modèle sur les fonctionnalités d'entrée. Estimation de l’intervalle de prédiction du modèle

Cet article présentera comment identifier efficacement le surajustement et le sous-apprentissage dans les modèles d'apprentissage automatique grâce à des courbes d'apprentissage. Sous-ajustement et surajustement 1. Surajustement Si un modèle est surentraîné sur les données de sorte qu'il en tire du bruit, alors on dit que le modèle est en surajustement. Un modèle surajusté apprend chaque exemple si parfaitement qu'il classera mal un exemple inédit/inédit. Pour un modèle surajusté, nous obtiendrons un score d'ensemble d'entraînement parfait/presque parfait et un score d'ensemble/test de validation épouvantable. Légèrement modifié : "Cause du surajustement : utilisez un modèle complexe pour résoudre un problème simple et extraire le bruit des données. Parce qu'un petit ensemble de données en tant qu'ensemble d'entraînement peut ne pas représenter la représentation correcte de toutes les données."

Vous êtes confronté à un décalage et à une connexion de données mobile lente sur iPhone ? En règle générale, la puissance de l'Internet cellulaire sur votre téléphone dépend de plusieurs facteurs tels que la région, le type de réseau cellulaire, le type d'itinérance, etc. Vous pouvez prendre certaines mesures pour obtenir une connexion Internet cellulaire plus rapide et plus fiable. Correctif 1 – Forcer le redémarrage de l'iPhone Parfois, le redémarrage forcé de votre appareil réinitialise simplement beaucoup de choses, y compris la connexion cellulaire. Étape 1 – Appuyez simplement une fois sur la touche d’augmentation du volume et relâchez-la. Ensuite, appuyez sur la touche de réduction du volume et relâchez-la à nouveau. Étape 2 – La partie suivante du processus consiste à maintenir le bouton sur le côté droit. Laissez l'iPhone finir de redémarrer. Activez les données cellulaires et vérifiez la vitesse du réseau. Vérifiez à nouveau Correctif 2 – Changer le mode de données Bien que la 5G offre de meilleures vitesses de réseau, elle fonctionne mieux lorsque le signal est plus faible

Les défis courants rencontrés par les algorithmes d'apprentissage automatique en C++ incluent la gestion de la mémoire, le multithread, l'optimisation des performances et la maintenabilité. Les solutions incluent l'utilisation de pointeurs intelligents, de bibliothèques de threads modernes, d'instructions SIMD et de bibliothèques tierces, ainsi que le respect des directives de style de codage et l'utilisation d'outils d'automatisation. Des cas pratiques montrent comment utiliser la bibliothèque Eigen pour implémenter des algorithmes de régression linéaire, gérer efficacement la mémoire et utiliser des opérations matricielles hautes performances.

Je pleure à mort. Le monde construit à la folie de grands modèles. Les données sur Internet ne suffisent pas du tout. Le modèle de formation ressemble à « The Hunger Games », et les chercheurs en IA du monde entier se demandent comment nourrir ces personnes avides de données. Ce problème est particulièrement important dans les tâches multimodales. À une époque où rien ne pouvait être fait, une équipe de start-up du département de l'Université Renmin de Chine a utilisé son propre nouveau modèle pour devenir la première en Chine à faire de « l'auto-alimentation des données générées par le modèle » une réalité. De plus, il s’agit d’une approche à deux volets, du côté compréhension et du côté génération, les deux côtés peuvent générer de nouvelles données multimodales de haute qualité et fournir un retour de données au modèle lui-même. Qu'est-ce qu'un modèle ? Awaker 1.0, un grand modèle multimodal qui vient d'apparaître sur le Forum Zhongguancun. Qui est l'équipe ? Moteur Sophon. Fondé par Gao Yizhao, doctorant à la Hillhouse School of Artificial Intelligence de l’Université Renmin.

La dernière vidéo du robot Optimus de Tesla est sortie, et il peut déjà fonctionner en usine. À vitesse normale, il trie les batteries (les batteries 4680 de Tesla) comme ceci : Le responsable a également publié à quoi cela ressemble à une vitesse 20 fois supérieure - sur un petit "poste de travail", en sélectionnant et en sélectionnant et en sélectionnant : Cette fois, il est publié L'un des points forts de la vidéo est qu'Optimus réalise ce travail en usine, de manière totalement autonome, sans intervention humaine tout au long du processus. Et du point de vue d'Optimus, il peut également récupérer et placer la batterie tordue, en se concentrant sur la correction automatique des erreurs : concernant la main d'Optimus, le scientifique de NVIDIA Jim Fan a donné une évaluation élevée : la main d'Optimus est l'un des robots à cinq doigts du monde. le plus adroit. Ses mains ne sont pas seulement tactiles

Récemment, le milieu militaire a été submergé par la nouvelle : les avions de combat militaires américains peuvent désormais mener des combats aériens entièrement automatiques grâce à l'IA. Oui, tout récemment, l’avion de combat IA de l’armée américaine a été rendu public pour la première fois, dévoilant ainsi son mystère. Le nom complet de ce chasseur est Variable Stability Simulator Test Aircraft (VISTA). Il a été personnellement piloté par le secrétaire de l'US Air Force pour simuler une bataille aérienne en tête-à-tête. Le 2 mai, le secrétaire de l'US Air Force, Frank Kendall, a décollé à bord d'un X-62AVISTA à la base aérienne d'Edwards. Notez que pendant le vol d'une heure, toutes les actions de vol ont été effectuées de manière autonome par l'IA ! Kendall a déclaré : "Au cours des dernières décennies, nous avons réfléchi au potentiel illimité du combat air-air autonome, mais cela a toujours semblé hors de portée." Mais maintenant,

L'apprentissage automatique est une branche importante de l'intelligence artificielle qui donne aux ordinateurs la possibilité d'apprendre à partir de données et d'améliorer leurs capacités sans être explicitement programmés. L'apprentissage automatique a un large éventail d'applications dans divers domaines, de la reconnaissance d'images et du traitement du langage naturel aux systèmes de recommandation et à la détection des fraudes, et il change notre façon de vivre. Il existe de nombreuses méthodes et théories différentes dans le domaine de l'apprentissage automatique, parmi lesquelles les cinq méthodes les plus influentes sont appelées les « Cinq écoles d'apprentissage automatique ». Les cinq grandes écoles sont l’école symbolique, l’école connexionniste, l’école évolutionniste, l’école bayésienne et l’école analogique. 1. Le symbolisme, également connu sous le nom de symbolisme, met l'accent sur l'utilisation de symboles pour le raisonnement logique et l'expression des connaissances. Cette école de pensée estime que l'apprentissage est un processus de déduction inversée, à travers les connaissances existantes.
