Aujourd'hui, la technologie de vision par ordinateur (CV) est à un point d'inflexion, avec des tendances majeures convergeant pour rendre la technologie cloud omniprésente dans les petits appareils d'IA de pointe optimisés pour des utilisations spécifiques et souvent alimentés par batterie.
Les progrès technologiques répondent à des défis spécifiques qui permettent à ces appareils d'exécuter des fonctions complexes de manière native dans des environnements contraints – à savoir la taille, la puissance et la mémoire – permettant à cette technologie d'IA centrée sur le cloud d'évoluer jusqu'à la périphérie. De nouveaux développements rendront la vision de l'IA à la périphérie omniprésente. .
La technologie CV est véritablement à la pointe et permet un niveau plus élevé d'interface homme-machine (IHM).
Les appareils sensibles au contexte connaissent non seulement l'utilisateur, mais également l'environnement dans lequel ils opèrent, le tout afin de prendre de meilleures décisions et de permettre des interactions automatisées plus utiles.
Par exemple, un ordinateur portable peut détecter visuellement quand un utilisateur est attentif et peut ajuster son comportement et sa politique d'alimentation en conséquence. Ceci est utile pour l'économie d'énergie (éteindre l'appareil lorsqu'aucun utilisateur n'est détecté) et la sécurité (détection des utilisateurs non autorisés ou des « rôdeurs » indésirables), et offre une expérience utilisateur plus fluide. En fait, en suivant les yeux des spectateurs (détection des spectateurs), la technologie peut alerter davantage les utilisateurs et masquer le contenu de l'écran jusqu'à ce qu'il soit possible de le faire en toute sécurité.
Autre exemple : un téléviseur intelligent peut détecter si quelqu'un regarde, puis il ajustera la qualité de l'image et du son en conséquence. Il peut s'éteindre automatiquement lorsque personne n'est présent pour économiser de l'énergie. Les systèmes de climatisation optimisent la puissance et le débit d’air en fonction de l’occupation de la pièce afin de réduire les coûts énergétiques.
Ces exemples et d’autres d’utilisation intelligente de l’énergie dans les bâtiments deviennent encore plus importants financièrement grâce au modèle de travail hybride du bureau à domicile.
Cette technologie ne se limite pas aux téléviseurs et aux PC, elle joue également un rôle essentiel dans la fabrication et d'autres utilisations industrielles, telles que la détection d'objets pour la supervision de la sécurité (c'est-à-dire les zones réglementées, les passages sécurisés, le respect des équipements de protection), la maintenance prédictive et le processus de fabrication. contrôle. L'agriculture est un autre secteur qui bénéficiera grandement des technologies de connaissance de la situation basées sur la vision : telles que l'inspection des cultures et le contrôle de la qualité.
Les progrès de l'apprentissage profond ont rendu possibles de nombreuses choses étonnantes dans le domaine de la vision par ordinateur. Beaucoup de gens ne savent même pas comment ils utilisent la technologie de vision par ordinateur dans leur vie quotidienne. Par exemple :
Classification d'images et détection d'objets : la détection d'objets combine la classification et la localisation pour identifier les objets dans une image ou une vidéo et spécifier leur emplacement dans l'image. Il applique la classification à différents objets et utilise des cadres de délimitation. CV fonctionne via les téléphones mobiles et peut être utilisé pour identifier des objets dans des images ou des vidéos.
Banque : CV est utilisé dans le contrôle de la fraude, la vérification d'identité, l'extraction de données et bien plus encore pour améliorer l'expérience client, améliorer la sécurité et augmenter l'efficacité opérationnelle.
Commerce de détail : le développement de systèmes de vision par ordinateur pour traiter ces données facilite la transformation numérique des industries du monde réel, telles que les caisses en libre-service.
Voitures autonomes : la vision par ordinateur est utilisée pour détecter et classer des objets (tels que des panneaux de signalisation ou des feux de circulation), créer des cartes 3D ou une estimation de mouvement et joue un rôle clé dans la réalisation des voitures autonomes.
La tendance omniprésente du traitement de vision de bord basé sur l'apprentissage automatique est évidente. Les coûts du matériel diminuent, la puissance de calcul s'améliore considérablement et de nouvelles méthodes facilitent la formation et le déploiement de modèles à petite échelle nécessitant moins de puissance et de mémoire. Tout cela réduit les obstacles à l’adoption et augmente l’utilisation de l’IA à la pointe de la technologie CV.
Mais même si nous voyons l’IA micro-edge devenir plus courante, il reste encore du travail à faire. Pour faire de l’informatique ambiante une réalité, nous devons répondre à des cas d’utilisation à long terme sur de nombreux segments de marché, ce qui peut créer des problèmes d’évolutivité.
Dans les produits de consommation, les usines, l'agriculture, la vente au détail et d'autres domaines, chaque nouvelle tâche nécessite des algorithmes différents et des ensembles de données uniques pour la formation. Les fournisseurs de solutions fournissent des outils et des ressources de développement supplémentaires pour créer des systèmes optimisés basés sur l'apprentissage automatique qui répondent aux exigences de cas d'utilisation spécifiques.
TinyML est un outil clé permettant d'activer tous les types d'IA à la périphérie. Il s'agit d'un moyen de développer des modèles d'apprentissage automatique légers et économes en énergie directement sur des appareils de pointe à l'aide d'architectures de modèles compacts et d'algorithmes d'optimisation.
TinyML permet au traitement de l'IA de s'effectuer localement sur l'appareil, réduisant ainsi le besoin d'une connectivité cloud constante. En plus de consommer moins d'énergie, les implémentations de TinyML peuvent réduire la latence, améliorer la confidentialité et la sécurité, et réduire les besoins en bande passante.
De plus, il permet aux appareils de pointe de prendre des décisions en temps réel sans dépendre fortement de l'infrastructure cloud, rendant l'IA plus accessible et plus pratique dans diverses applications telles que les appareils intelligents, les appareils portables et l'automatisation industrielle. Cela permet de combler les lacunes des fonctionnalités et permet aux entreprises d'IA de mettre à niveau les logiciels autour de leurs produits NPU en développant des exemples de modèles riches (« zoos modèles ») et un code de référence d'application.
Ce faisant, ils peuvent fournir une gamme plus large d'applications pour la longue traîne tout en garantissant le succès de la conception en optimisant les bons algorithmes pour le matériel cible dans le cadre de contraintes définies de coût, de taille et de puissance afin de répondre aux besoins spécifiques de l'entreprise.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!