Grâce aux énormes progrès de l'apprentissage automatique et de l'informatique quantique, nous disposons désormais d'outils nouveaux et plus puissants pour collaborer de nouvelles manières avec les chercheurs de tous les secteurs et accélérer radicalement les progrès des découvertes scientifiques révolutionnaires.
Le thème du résumé de fin d'année de Google de cette année est "Sciences naturelles" L'auteur de l'article est John Platt, un scientifique exceptionnel de Google Research. Il est diplômé du California Institute of. La technologie en 1989.
Depuis que j'ai rejoint Google Research il y a huit ans, j'ai eu le privilège de faire partie d'une communauté de chercheurs talentueux qui se consacrent à l'application de techniques informatiques de pointe pour faire progresser les possibilités des sciences appliquées que l'équipe développe actuellement. explorer des sujets dans les sciences physiques et naturelles, allant de l'aide à l'organisation des informations protéiques et génomiques mondiales au profit de la vie des gens, à l'utilisation des ordinateurs quantiques pour améliorer notre compréhension de la nature de l'univers.
Utilisez l'apprentissage automatique pour résoudre les mystères de la biologieL'extraordinaire complexité de la biologie a fasciné d'innombrables chercheurs, de l'exploration des mystères du cerveau à l'exploration de la structure des protéines jusqu'au génome codant le langage de la vie. travaille avec des scientifiques d'autres organisations de premier plan à travers le monde pour relever de grands défis en matière de connectomique, de prédiction de la fonction des protéines et de génomique, et pour mettre les innovations à la disposition de la communauté scientifique au sens large.
Neurobiologie
En 2018, une application développée par Google explore la façon dont l'information voyage à travers les voies neuronales du cerveau du poisson zèbre, donnant un aperçu de la façon dont le poisson zèbre participe à des choses comme l'essaimage, des observations approfondies du comportement social .
Lien papier : https://www.nature.com/articles/s41592-018-0049-4
Grâce à la collaboration avec l'Institut Max Planck pour la biointelligence (Max Working with Chercheurs de l'Institut Planck pour l'intelligence biologique, les chercheurs ont utilisé des ordinateurs pour reconstruire des images au microscope électronique 3D d'une partie du cerveau d'un poisson zèbre.
Il s'agit également d'une étape importante dans l'utilisation de pipelines d'imagerie et de calcul pour cartographier les circuits neuronaux dans le cervelet, et une autre avancée dans le domaine de la connectomique.
La technologie impliquée dans ces travaux peut même être appliquée à des domaines au-delà des neurosciences. Par exemple, afin de résoudre le problème du traitement de grands ensembles de données connectomiques, les chercheurs de Google ont développé et publié TensorStore, une bibliothèque de logiciels open source C++ et Python. conçu spécifiquement pour stocker et manipuler des données à n dimensions, mais également adapté pour stocker de grands ensembles de données dans d'autres domaines.
Lien de code : https://github.com/google/tensorstore
En comparant le traitement du langage humain et les modèles de langage profond autorégressifs (DLM), les chercheurs utilisent l'apprentissage automatique pour illustrer Learn comment le cerveau humain remplit des fonctions aussi distinctives que le langage.
Lien papier : https://www.nature.com/articles/s41593-022-01026-4
Dans cette étude, Google a collaboré avec l'Université de Princeton et l'Université de New York Des chercheurs de la Grossman School of Medicine ont collaboré pour que les participants écoutent un podcast de 30 minutes pendant que leur activité cérébrale était enregistrée par électroencéphalographie corticale.
Les résultats enregistrés montrent que le cerveau humain et le DLM partagent des principes informatiques pour le traitement du langage, notamment la prédiction continue du mot suivant, l'intégration dépendante du contexte et le calcul de la surprise post-apparition basé sur la correspondance des mots, qui peuvent mesurer la surprise du cerveau humain pour un mot ( surprise) et corrélez le signal de surprise avec la façon dont le DLM prédit le mot.
Ces résultats fournissent de nouvelles conclusions sur le traitement du langage dans le cerveau humain et suggèrent que le DLM peut être utilisé pour révéler des informations précieuses sur les bases neuronales du langage.
Biochimie
L'apprentissage automatique a également permis des progrès significatifs dans la compréhension des séquences biologiques, les chercheurs tirant parti des progrès récents de l'apprentissage profond pour prédire avec précision la fonction des protéines à partir de séquences brutes d'acides aminés.
Lien papier : https://www.nature.com/articles/s41587-021-01179-w
Google s'est également associé à l'Institut européen de bioinformatique du Laboratoire européen de biologie moléculaire (EMBL- EBI) a travaillé en étroite collaboration pour évaluer soigneusement les performances du modèle et a ajouté des centaines de millions d'annotations fonctionnelles aux bases de données publiques sur les protéines UniProt, Pfam/interPro et MGnify. L'annotation humaine des bases de données de protéines peut être une tâche ardue et difficile. tâche C'est un processus lent, mais la méthode d'apprentissage automatique proposée par Google a réalisé un énorme bond en avant dans la vitesse d'annotation.
Par exemple, l'annotation Pfam a ajouté plus de volume que tous les autres efforts combinés au cours de la dernière décennie, et les millions de scientifiques du monde entier qui accèdent à ces bases de données chaque année peuvent désormais exploiter cette annotation pour la recherche.
Bien que la première ébauche du génome humain ait été publiée en 2003, elle était incomplète en raison des limitations techniques de la technologie de séquençage.
En 2022, le consortium Telomere-2-Telomer (T2T) a réalisé des progrès remarquables dans la résolution de ces régions auparavant inaccessibles, notamment 5 bras chromosomiques complets et près de 200 millions de nouvelles paires de bases de séquences d'ADN. Ces régions sont à la fois intéressantes et importantes pour questions de biologie humaine, d’évolution et de maladie.
L'appelant open source de variantes du génome de Google, DeepVariant, est l'un des outils utilisés par le Consortium T2T pour préparer la publication d'une séquence complète de 3,055 milliards de paires de bases du génome humain.
Lien papier : https://www.nature.com/articles/nbt.4235
Le consortium T2T utilise également la méthode open source de Google, DeepConsensus, pour fournir une lecture à long terme séquençage pour Pacific Biosciences L'instrument fournit une correction d'erreur sur l'appareil dans les dernières recherches de T2T sur les ressources pangénomiques complètes qui représentent l'étendue de la diversité génétique humaine.
Lien papier : https://www.nature.com/articles/s41587-022-01435-7.epdf
Application de l'informatique quantique aux nouvelles découvertes en physique
Quantum L'informatique en est encore à ses balbutiements lorsqu'il s'agit de promouvoir la découverte scientifique, mais elle a un grand potentiel, c'est pourquoi Google étudie les moyens d'améliorer les capacités de l'informatique quantique afin que l'informatique quantique puisse devenir un outil de découverte et de percées scientifiques. En collaborant avec des physiciens du monde entier, les chercheurs commencent à utiliser les ordinateurs quantiques existants pour créer des expériences de physique entièrement nouvelles. L'un des problèmes expérimentaux quantiques est le suivant : lorsqu'un capteur mesure un objet, un ordinateur doit traiter le capteur. données.Dans le processus de traitement traditionnel, les données du capteur doivent être converties en informations classiques avant le traitement.
Pour l'informatique quantique, les données quantiques des capteurs peuvent être directement traitées, et les données des capteurs quantiques peuvent être directement fournies aux algorithmes quantiques sans mesure, ce qui présentera de plus grands avantages que les ordinateurs traditionnels.
Lien papier : https://www.science.org/doi/10.1126/science.abn7293
Dans un article publié récemment par Google en collaboration avec des chercheurs de plusieurs universités Selon un article scientifique, les résultats expérimentaux montrent que tant qu'un ordinateur quantique est directement couplé à un capteur quantique et exécute un algorithme d'apprentissage, l'informatique quantique peut extraire des informations de beaucoup moins d'expériences que l'informatique classique.
Même sur les ordinateurs quantiques de taille moyenne actuellement immatures, le « machine learning quantique » peut produire des avantages exponentiels sur les ensembles de données.
Lien papier : https://arxiv.org/abs/2112.00778
Étant donné que les données expérimentales sont souvent le facteur limitant de la découverte scientifique, les algorithmes d'apprentissage automatique quantique ont le potentiel de complètement déverrouiller le quantum L'énorme puissance des ordinateurs est aggravée par le fait que les résultats de ces travaux sont également applicables à l'apprentissage des résultats de l'informatique quantique, tels que les résultats de simulations quantiques difficiles à extraire.
Même sans apprentissage automatique quantique, une application prometteuse des ordinateurs quantiques est l'exploration expérimentale de systèmes quantiques qui ne peuvent être observés ou simulés.
En 2022, l'équipe Quantum AI a utilisé cette méthode pour observer la première preuve expérimentale de plusieurs photons micro-ondes dans un état lié à l'aide de qubits supraconducteurs.
Lien papier : https://www.nature.com/articles/s41586-022-05348-y
Les photons nécessitent souvent des éléments non linéaires supplémentaires pour interagir, Google Les résultats de Les simulations informatiques quantiques de ces interactions ont surpris les chercheurs : ils pensaient que l’existence de ces états liés dépendait de conditions fragiles, mais ont plutôt découvert qu’ils étaient robustes même à des perturbations relativement fortes.
Étant donné le succès initial de Google dans l'application de l'informatique quantique pour réaliser des percées en physique, les chercheurs ont également bon espoir quant aux possibilités de cette technologie, qui permettra de futures découvertes révolutionnaires d'avoir un impact social aussi important que la création. du transistor ou du système de positionnement global.
L'informatique quantique en tant qu'outil scientifique est très prometteuse !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!