Les algorithmes d'apprentissage automatique basés sur des circuits quantiques paramétrés sont des candidats privilégiés pour des applications à court terme sur des ordinateurs quantiques bruyants. Dans cette direction, divers types de modèles d’apprentissage automatique quantique ont été introduits et étudiés de manière approfondie. Cependant, notre compréhension de la manière dont ces modèles se comparent entre eux et aux modèles classiques reste limitée.
Récemment, une équipe de recherche de l'Université d'Innsbruck, en Autriche, a identifié un cadre constructif qui capture tous les modèles standards basés sur des circuits quantiques paramétrés : le modèle quantique linéaire.
Les chercheurs montrent comment utiliser les outils de la théorie de l'information quantique pour cartographier efficacement les circuits de ré-téléchargement de données en une image plus simple d'un modèle linéaire dans l'espace quantique de Hilbert. De plus, les besoins en ressources expérimentalement pertinents de ces modèles sont analysés en termes de nombre de qubits et de quantité de données à apprendre. Des résultats récents basés sur l'apprentissage automatique classique démontrent que les modèles quantiques linéaires doivent utiliser beaucoup plus de qubits que les modèles de rechargement de données pour résoudre certaines tâches d'apprentissage, tandis que les méthodes du noyau nécessitent également beaucoup plus de points de données. Les résultats fournissent une compréhension plus complète des modèles d’apprentissage automatique quantique, ainsi que des informations sur la compatibilité des différents modèles avec les contraintes NISQ.
La recherche était intitulée « Apprentissage automatique quantique au-delà des méthodes du noyau » et a été publiée dans « Nature Communications » le 31 janvier 2023.
Lien papier : https://www.nature.co m/articles/s41467-023-36159-y
Intermédiaire Quantique (NISQ) À cette époque, plusieurs méthodes ont été proposées pour construire des algorithmes quantiques utiles compatibles avec de légères contraintes matérielles. La plupart de ces méthodes impliquent la spécification de circuits quantiques Ansatz, optimisés de manière classique pour résoudre des tâches de calcul spécifiques. Outre les solveurs de signature quantique variationnelle et les variantes d’algorithmes d’optimisation quantique approximative en chimie, les méthodes d’apprentissage automatique basées sur de tels circuits quantiques paramétrés constituent l’une des applications pratiques les plus prometteuses pour générer des avantages quantiques.
Les méthodes du noyau sont un type d'algorithme de reconnaissance de formes. Son objectif est de trouver et d'apprendre les relations mutuelles dans un ensemble de données. La méthode du noyau est un moyen efficace de résoudre les problèmes d'analyse de modèles non linéaires. Son idée principale est la suivante : premièrement, intégrer les données originales dans un espace de fonctionnalités de haute dimension approprié via un mappage non linéaire, puis utiliser un apprenant linéaire général pour de nouveaux modes d'analyse ; et le traitement dans l'espace.
Des travaux antérieurs ont fait de grands progrès dans cette direction en exploitant la connexion entre certains modèles quantiques et les méthodes du noyau de l'apprentissage automatique classique. De nombreux modèles quantiques fonctionnent en effet en codant les données dans un espace de Hilbert de grande dimension et en modélisant les propriétés des données en utilisant uniquement des produits internes évalués dans cet espace de fonctionnalités. C’est aussi ainsi que fonctionne la méthode nucléaire.
Sur la base de cette similarité, un codage quantique donné peut être utilisé pour définir deux types de modèles : (a) des modèles quantiques explicites, où les points de données de codage sont mesurés en fonction d'observables variationnels qui spécifient leurs étiquettes ; Modèle de noyau implicite, dans lequel un produit interne pondéré de points de données codés est utilisé pour attribuer des étiquettes. Dans la littérature sur l’apprentissage automatique quantique, l’accent est mis sur les modèles implicites.
Figure 1 : Le modèle d'apprentissage automatique quantique étudié dans ce travail. (Source : article)
Récemment, des progrès ont été réalisés dans les modèles dits de ré-téléchargement de données. Le modèle de ré-téléchargement des données peut être considéré comme une généralisation du modèle explicite. Cependant, cette généralisation rompt également la correspondance avec le modèle implicite, puisqu'un point de donnée x donné ne correspond plus à un point de codage fixe ρ(x). Les modèles de réupload de données sont strictement plus généraux que les modèles explicites et ne sont pas compatibles avec le paradigme du modèle du noyau. Jusqu'à présent, la question reste ouverte de savoir si certains avantages peuvent être obtenus à partir des modèles de ré-téléchargement de données avec la garantie des méthodes du noyau.
Dans ce travail, les chercheurs introduisent un cadre unifié pour les modèles quantiques explicites, implicites et de ré-upload de données.
Figure 2 : Famille de modèles en apprentissage automatique quantique. (Source : article)
Commencez par revoir le concept de modèles quantiques linéaires et en expliquant les modèles explicites et implicites en termes de modèles linéaires définis dans l'espace des fonctionnalités quantiques. Ensuite, des modèles de rechargement de données sont présentés et montrent que, bien que définis comme des généralisations de modèles explicites, ils peuvent également être implémentés par des modèles linéaires dans des espaces de Hilbert plus grands.
La figure ci-dessous donne une structure illustrative pour illustrer visuellement comment le mappage du nouveau téléchargement des données au modèle explicite est réalisé.
Figure 3 : Modèle explicite illustratif se rapprochant du circuit de ré-upload de données. (Source : Paper)
L'idée générale derrière cette structure est d'encoder les données d'entrée.
Passons maintenant à la structure principale, ce qui entraîne un nouveau téléchargement des données et un mappage précis entre les modèles explicites. Ici, en s'appuyant sur une idée similaire à la structure précédente, les données d'entrée sont codées sur le qubit auxiliaire, puis la porte de codage est implémentée sur le qubit de travail à l'aide d'opérations indépendantes des données. La différence ici est d'utiliser la téléportation de porte, un type d'informatique quantique basée sur des mesures, pour implémenter des portes de codage directement sur les qubits auxiliaires et les téléporter (via des mesures d'intrication) vers les qubits de travail lorsque cela est nécessaire.
Figure 4 : Cartographie exacte du modèle de retéléchargement de données vers un modèle explicite équivalent utilisant la téléportation fermée. (Source : article)
Les chercheurs ont démontré que les modèles quantiques linéaires peuvent décrire non seulement des modèles explicites et implicites, mais également des circuits de rechargement de données. Plus précisément, toute classe d'hypothèses de modèles de réupload de données peut être mappée à une classe équivalente de modèles explicites, c'est-à-dire des modèles linéaires avec une famille restreinte d'observables.
Ensuite, les chercheurs ont analysé plus rigoureusement les avantages des modèles explicites et de ré-téléchargement de données par rapport aux modèles implicites. Dans l'exemple, l'efficacité du modèle quantique dans la résolution de la tâche d'apprentissage est quantifiée par le nombre de qubits et la taille de l'ensemble d'apprentissage requis pour obtenir une perte attendue non triviale. La tâche d’apprentissage qui nous intéresse consiste à apprendre les fonctions paires et impaires.
Figure 5 : Apprendre à se séparer. (Source : article)
Un défi majeur dans l'apprentissage automatique quantique est de montrer que les méthodes quantiques discutées dans cet ouvrage peuvent offrir des avantages d'apprentissage par rapport aux méthodes classiques (standard).
Dans cette recherche, Huang et al. de Google Quantum Artificial Intelligence (https://www.php.cn/link/4dfd2a142d36707f8043c40ce0746761 ) Il est recommandé d'étudier les tâches d'apprentissage dans lesquelles la fonction objectif elle-même est générée par des modèles quantiques (explicites).
Semblable à Huang et al., les chercheurs ont effectué la tâche de régression en utilisant les données d'entrée de l'ensemble de données fashion-MNIST, où chaque exemple était une image en niveaux de gris de 28 x 28.
Figure 6 : Performance de régression de modèles explicites, implicites et classiques sur la tâche d'apprentissage "personnalisation quantique". (Source : Papier)
Observé : Les modèles implicites obtiennent systématiquement des pertes d'entraînement inférieures aux modèles explicites. Surtout pour les pertes non régularisées, le modèle implicite atteint une perte d’entraînement de 0. En revanche, en ce qui concerne les pertes de test qui représentent les pertes attendues, il existe une séparation nette à partir de n = 7 qubits, où le modèle classique commence à avoir des performances compétitives avec le modèle implicite, tandis que le modèle explicite les surpasse clairement tous les deux. . Cela suggère que la présence d’un avantage quantique ne doit pas être évaluée uniquement en comparant les modèles classiques avec les méthodes du noyau quantique, car les modèles explicites (ou de ré-téléchargement de données) peuvent également cacher de meilleures performances d’apprentissage.
Ces résultats nous donnent une compréhension plus complète du domaine de l'apprentissage automatique quantique et élargissent notre vision des types de modèles permettant d'obtenir des avantages d'apprentissage pratiques dans les mécanismes NISQ.
Les chercheurs estiment que la tâche d'apprentissage visant à prouver l'existence d'une séparation exponentielle d'apprentissage entre différents modèles quantiques est basée sur des fonctions paires et impaires, ce qui n'est pas une classe conceptuelle d'intérêt pratique pour l'apprentissage automatique. Cependant, les résultats de la limite inférieure peuvent également être étendus à d’autres tâches d’apprentissage avec des classes de concepts de grande dimension (c’est-à-dire constituées de nombreuses fonctions orthogonales).
Les méthodes du noyau quantique nécessitent nécessairement de nombreux points de données qui évoluent linéairement avec cette dimension, et comme nous le montrons dans les résultats, la flexibilité du circuit de ré-téléchargement des données et les capacités d'expression limitées du modèle explicite permettent d'économiser des ressources importantes. Explorer comment et quand ces modèles peuvent être adaptés à la tâche d’apprentissage automatique à accomplir reste une direction de recherche intéressante.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!