Combien de temps faut-il pour ajouter des sous-titres à une vidéo d'apprentissage ? 1 heure ? Très probablement, 30 secondes suffisent.
Vous souhaitez exporter des sous-titres vidéo en texte et les enregistrer image par image ? Une phrase suffira.
Pouvez-vous imaginer sur quoi reposent ces opérations ? La plupart des gens n'auraient peut-être pas imaginé que dans le passé, certaines opérations qui nécessitaient un logiciel d'édition professionnel long et laborieux pouvaient être effectuées en un seul clic dans Baidu Netdisk. De plus, à l'avenir, grâce à l'assistant « Yun Yiduo » de Baidu Netdisk, trouver des images, des résumés et des traductions pourra devenir l'affaire d'une seule phrase.
Wittgenstein disait que les frontières de ma langue sont les frontières de mon monde. Aujourd’hui, l’IA repousse les frontières du monde – avec l’aide du langage naturel humain.
L'assistant personnel intelligent du futur
Dans le film de science-fiction "Her", une scène est décrite : une IA virtuelle avec une voix charmante prend en charge la plupart du travail et des divertissements des gens, libérant non seulement leurs mains, mais aussi leurs pieds, réalisant véritablement normaliser le travail à domicile.
Au cours des dernières décennies, la plupart des descriptions de l'IA dans les films de science-fiction sont indissociables d'un seul mot : efficacité. Derrière cela se cache la vision ultime de la vie future dans le monde réel : des outils de productivité libérant l’humanité.
Il est presque certain que l'IA virtuelle de chaque film de science-fiction fonctionne pour les humains. Les robots de service de "Westworld" et les Tasi de "Interstellar" sont partout. Il reflète l'imagination du monde réel en matière d'IA, qui tourne toujours autour de sa fonction la plus fondamentale : le saut en efficacité.
Des moteurs à vapeur aux moteurs à combustion interne, de la numérisation à l'informatisation, le progrès social stimulé par la science et la technologie tourne toujours autour d'un saut d'efficacité, et derrière ce saut d'efficacité, ce qui se cache souvent, ce sont les besoins énormes et non satisfaits des personnes dans ce domaine. ère.
La raison pour laquelle cette vague d’IA déclenchée par chatGPT a balayé le monde en peu de temps est due à l’innovation technologique. La raison sous-jacente est en fait le désir extrême de la société d’évolution des outils de productivité.
Comme nous l'avons montré au début de cet article, les outils de productivité ont désormais commencé à fonctionner davantage comme de la science-fiction avec le soutien de l'IA. À l'avenir, Baidu Netdisk, combiné à la mise à niveau de grands modèles, satisfera également le grand désir de la société en matière d'outils de productivité. .
1 Compréhension de fichiers plus complexes
Dans le passé, lorsque nous avions besoin d'un résumé d'un rapport professionnel, nous ne pouvions le lire que page par page. S'il s'agissait d'un rapport en langue étrangère, nous devions peut-être utiliser un outil de traduction, ou nous devions également convertir le document. format. Les opérations ci-dessus nous ont obligés à effectuer les opérations ci-dessus dans un navigateur, un lecteur. Les allers-retours entre plusieurs logiciels tels que Word vous donneront non seulement le vertige, mais vous risquez également de commettre des erreurs lorsque vous êtes occupé.
La bonne nouvelle est qu'à l'avenir, ces tâches compliquées pourront être effectuées en un seul clic sur Baidu Cloud Disk.
Basé sur le grand modèle Wenxin, une fonction majeure que Baidu Cloud Disk implémentera va de la « lecture » à la « compréhension » des documents. Vous pouvez lui demander de rédiger pour vous un résumé de document, que ce soit en langue étrangère ou en chinois, pour vous aider à trier rapidement les connaissances des informations désordonnées.
Vous pouvez également sélectionner un certain paragraphe et le faire traduire pour vous, rapidement et efficacement.
Même la conversion de format peut être effectuée en une seule phrase.
En bref, à travers cet exemple, nous pouvons ressentir certains changements. Dans le passé, le fichier stocké sur le disque cloud n'était qu'un fichier, mais aujourd'hui, Baidu Cloud Disk peut aider les utilisateurs à comprendre les connaissances qu'il contient.
2 Recherche plus rapide d'images et de documents
Le Baidu Netdisk mis à niveau permet une recherche plus rapide d'images et de fichiers.
Par rapport à la recherche feuilletée traditionnelle, vous pouvez trouver les photos ou les fichiers souhaités en une seule phrase dans le nouveau Baidu Netdisk. Par exemple, "Aidez-moi à retrouver les photos de plats que j'ai prises récemment" ou la réponse plus compliquée "Photos du dîner de team building de l'entreprise l'année dernière" feront l'affaire.
Grâce à la capacité de grands modèles, Baidu Cloud Disk peut comprendre et analyser une sémantique plus complexe et trouver rapidement des fichiers cibles à l'aide de la technologie de reconnaissance d'image.
De plus, cette technologie ne s'arrête pas aux images et aux fichiers, la recherche de vidéos est également possible.
Par exemple, dans le matériel vidéo de Baidu Netdisk, vous souhaitez revoir les points de connaissances que vous avez appris la dernière fois, mais vous ne vous souvenez plus des minutes et des secondes ? Peu importe, vous pouvez directement demander un certain point de connaissance, et Baidu Netdisk fournira des réponses pertinentes en fonction du contenu vidéo et donnera l'emplacement du contenu correspondant dans la vidéo, ou vous pouvez directement localiser et accéder à l'emplacement correspondant. .
Actuellement, Baidu Netdisk Cloud est en test interne. Ouvrez le client PC Baidu Netdisk (dernière version) ou la version Web pour prendre rendez-vous et en faire l'expérience immédiatement.
Nous avons déjà dit que l'émergence d'une certaine technologie est souvent motivée par l'explosion concentrée des besoins humains à cette époque. L’invention du moteur à combustion interne permet d’aller plus loin et favorise les échanges commerciaux et culturels ; les données et l’informatisation sont l’équivalent de roues et de moteurs, permettant au savoir de voyager plus loin.
Lorsque les données se développent dans une certaine mesure, la redondance de la pile de connaissances rend difficile l'obtention de connaissances. Vraiment, essayer de trouver des informations précieuses, c'est comme chercher une aiguille dans une botte de foin. Ce problème devient de plus en plus grave à l'ère de l'information numérique. Le but de l’évolution des outils de productivité est de faciliter l’acquisition des connaissances.
Comment résoudre de nouveaux problèmes dans cette nouvelle ère, c'est le changement que nous voyons possible à l'ère de l'IA. C'est comme ajouter un navigateur à la roue et au moteur, permettant à moi d'utiliser tout le contenu et les données. Cela va de l'informatisation à la connaissance.
Intelligence explosive côté B
Cette vague d'IA profite non seulement aux individus, mais inclut également un grand nombre d'utilisateurs d'entreprise du côté B. Après tout, les entreprises ont des besoins de productivité plus ciblés et plus urgents.
Après la sortie de chatGPT, de nombreuses entreprises du secteur de la publicité ont annoncé qu'elles supprimeraient certains postes de rédaction de base et passeraient à AIGC ; certains peintres utilisent également des logiciels tels que Midjourney pour travailler pour eux.
Les utilisateurs d'entreprise qui se lancent sur le marché des disques réseau ont en fait deux types de besoins, l'un est le stockage et la transmission de données, et l'autre est la génération locale en un clic basée sur le stockage et la transmission.
Pour la première catégorie, il est courant que de nombreuses entreprises placent des documents, des contrats, des factures, du matériel, etc. sur le disque réseau pour la sauvegarde ou la transmission. Le problème de ce type de demande est que le temps passé à rechercher et à classer des fichiers volumineux est un travail difficile et sans valeur.
Basé sur le modèle Wenxin, à l'avenir, après la mise à niveau de Baidu Netdisk, une fonction de classification d'images plus intelligente sera ajoutée à la version entreprise, avec jusqu'à 57 catégories personnalisées plus adaptées à des fins bureautiques, telles que les billets d'entreprise, contrats commerciaux, matériaux de conception, etc., permettant une meilleure gestion et des requêtes plus rapides.
Semblable à la version personnelle, Baidu Skydisk Enterprise Edition sera également basée sur le modèle Wenxin et apportera des connaissances d'entreprise. Aidez les utilisateurs de l'entreprise à résumer, affiner, poser des questions et réponses et à traiter davantage le contenu des documents grâce à une interaction conversationnelle.
Par exemple, vous pouvez le laisser réfléchir à 10 noms de boissons rafraîchissantes, compléter un rapport basé sur un plan ou peaufiner le texte pour donner à l'article un aspect plus avancé, Baidu Netdisk peut tout faire.
En réponse au deuxième type de demande, le Baidu Netdisk mis à niveau a véritablement aidé des secteurs spécifiques à réaliser un gain d'efficacité dans un sens.
Par exemple, dans le secteur de la photographie, du suivi client au service après-vente, il faut en moyenne 15 salariés et 35 jours pour servir un client.
Le service de prise de vue et de sélection instantanée lancé par Baidu Netdisk a considérablement amélioré l'efficacité de l'industrie de la photographie.
Téléchargez immédiatement après avoir pris la photo, et avec l'aide de la retouche IA en un clic, de la mise en page automatique, de la génération de liens de disque réseau et d'autres opérations locales, une photo dans une organisation de photographie traditionnelle implique 13 étapes, dont la prise de photo, l'édition préliminaire, correction des couleurs, sélection des cartes, etc., avec une moyenne de 15 participants, l'ensemble du processus a été réduit de 5 jours à 15 minutes, le coût du service client unique a été réduit de 75 % et l'efficacité a été augmentée de plus de 30 %. fois.
De même, dans l'industrie du commerce électronique, le traitement multimodal intelligent de Baidu Netdisk ne sert pas seulement à affiner les portraits, mais également à remplacer l'arrière-plan requis pour les images via l'IA, en déduisant intelligemment les images puis en faisant correspondre la production de scènes correspondante. images de produits.
En fait, Baidu n'est pas le seul à proposer une technologie d'IA comme celle-ci pour des secteurs spécifiques, Adobe, Midjourney et même à avoir des sociétés spécialisées dans les modèles d'IA, mais il s'agit essentiellement de logiciels traditionnels, qui font partie de l'original. chaîne.
À l'avenir, Baidu Netdisk prendra en charge la production de modèles d'IA et d'affiches marketing, ce qui signifie réduire les barres de touches basées sur la génération locale en un clic, maximisant ainsi la productivité.
Un autre exemple est l'industrie des sciences de la vie. Par exemple, les entreprises de génétique doivent livrer des fichiers de séquençage aux hôpitaux, aux écoles ou aux instituts de recherche scientifique. Les données atteignent souvent des centaines de Go, voire 1 To. La solution de livraison de fichiers fournie par Baidu Netdisk. prend en charge la transmission de données au niveau de la To, peut aider les clients à fournir des fichiers surdimensionnés de manière pratique et sûre.
Disque réseau, la technologie favorise l'informatisation à la connaissance
Au cours des dix dernières années, l'industrie des disques réseau a connu deux étapes. Le premier est la numérisation, où les gens sont habitués à télécharger des fichiers locaux sur le cloud pour libérer et partager des ressources locales ; le second est l'informatisation, où les quantités massives de données accumulées sur les disques réseau ont donné naissance à de nouvelles demandes de la part des particuliers, des entreprises et même des utilisateurs. industries à utiliser efficacement les données.
Par exemple, les utilisateurs peuvent les appeler à tout moment lorsqu'ils en ont besoin. L'intérêt du disque réseau à ce stade est de fournir un répertoire ou un index capable de trouver des fichiers rapidement et efficacement.
Au cours des dix prochaines années, à mesure que l'informatisation deviendra de plus en plus avancée, les besoins des utilisateurs évolueront également en conséquence.
D'une part, la knowledgeisation est une tendance générale. L'IA trie les informations utiles en connaissances. Qu'elles soient immédiates ou passées, les utilisateurs peuvent les retrouver facilement et rapidement et les transformer en connaissances.
Qu'est-ce que l'intellectualisation ?
L'informatisation se caractérise par une compréhension et une discrétisation superficielles, et la connaissance est une collection d'informations, qui sont des données utiles obtenues en filtrant, affinant et traitant des informations pertinentes. Les connaissances sont basées sur le raisonnement et l'analyse, et de nouvelles connaissances peuvent également être générées.
L'intellectualisation de Baidu Netdisk peut être comprise comme offrant la capacité de comprendre, de mémoriser, de raisonner et de connecter des informations. Il agit comme le mercure et extrait l’or du sable doré.
Il y a trois ans, Baidu Netdisk portait un jugement sur l'avenir de l'industrie. On pense que les capacités des disques réseau seront actives dans les terminaux intelligents, notamment les téléphones mobiles, les haut-parleurs et les téléviseurs. Les utilisateurs pourront « télécharger des données vers le cloud à tout moment, n'importe où, ou présenter du contenu sur le terminal ». Dans le même temps, les utilisateurs seront plus disposés à exploiter et à traiter les données directement sur le disque réseau au lieu de les télécharger localement.
L’avancée actuelle dans la connaissance de Baidu Netdisk correspond à cette prédiction d’il y a trois ans.
Sur cette base, Baidu Netdisk pourra à l'avenir s'appuyer sur les connaissances pour construire le deuxième cerveau de Netdisk et devenir un assistant numérique personnel appartenant à tous.
Derrière cela, l’investissement à long terme de Baidu et l’innovation technologique sont indissociables.
Par exemple, pour la compréhension de texte, Baidu Netdisk utilise une technologie de grand modèle de pré-entraînement d'image, qui peut utiliser davantage d'informations contextuelles et améliorer l'efficacité et la précision grâce à des idées d'auto-supervision.
Un autre exemple est la compréhension des images. En s'appuyant sur le grand modèle Wenxin, Baidu Netdisk a réduit l'échelle du modèle, réduisant ainsi les coûts tout en augmentant l'efficacité. S'appuyant sur le grand modèle Wenxin, les solutions de Baidu Netdisk sont leaders dans 10 domaines sur 16 scénarios et ont été largement utilisées dans les reportages photo et les recherches d'images vidéo de Netdisk. Prend en charge la sémantique complexe et les capacités de recherche multimodales.
Il existe également une embellissement de portrait. En plus de fournir des effets d'embellissement de portrait de base cohérents avec les produits concurrents, tout en conservant l'effet, Baidu Netdisk compresse la taille de certains modèles de base à 100 Ko et réduit le temps d'inférence à 100 millisecondes. .
La dernière étape est la compréhension audio et vidéo. La reconnaissance vocale automatique (ASR) de Baidu Netdisk couvre des langues dans de nombreux pays, dont le chinois, l'anglais et le coréen, et sa reconnaissance et sa précision de traduction occupent également une position de leader dans l'industrie.
Fin
Reprenons l'exemple du début : « Westworld » et « Interstellar » sont tous deux des films de science-fiction, mais leurs conceptions de l'IA sont complètement opposées : le premier dépeint l'éveil de l'IA, tandis que le second décrit l'IA. à l'humanité.
L'IA dont nous pouvons faire l'expérience aujourd'hui comprend Baidu Netdisk, chatGPT, Midjourney, etc. Leurs formes existantes ou leurs orientations évolutives futures sont fondamentalement du même type, avec une collaboration intelligente et des avantages complémentaires pour obtenir de meilleurs résultats efficaces et plus précis. résultats du travail.
Baidu Netdisk combine l'IA pour réaliser la mémoire photographique et l'exportation, ce qui élargit les limites de notre langage, mais derrière cela se cache le processus évolutif des êtres humains qui s'améliorent constamment en créant des outils.
En même temps, les gens ne sont pas des IA. Les gens ont un langage et des connaissances, ainsi qu'une expérience et une perception. C'est notre monde plus vaste.
Si vous comparez le langage et la connaissance à « lire des milliers de livres », peut-être que l'IA peut le faire mieux que les humains.
Mais l'expérience et la perception « parcourent des milliers de kilomètres ». Cela ne fait pas simplement référence au voyage, mais au fait de vivre, d'expérimenter et de comprendre avec son cœur, ce qui ne peut être remplacé par l'IA.
Enfin, j'aimerais partager une phrase avec vous : l'IA est un outil, la vie est une expérience.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!