Comment créer une application complète de vision par ordinateur en quelques minutes avec seulement deux fonctions Python-IA-php.cn

Table des matières

Créer des applications de vision par ordinateur

Pipeless Framework

Création d'une application de détection d'objets

Conclusion

Maison

Périphériques technologiques

Comment créer une application complète de vision par ordinateur en quelques minutes avec seulement deux fonctions Python

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Mar 12, 2024 pm 05:07 PM

python 计算机视觉

Comment créer une application complète de vision par ordinateur en quelques minutes avec seulement deux fonctions Python

Traducteur | Li Rui

Contrôleur | Chonglou

Cet article présente d'abord brièvement les exigences de base des applications de vision par ordinateur. Ensuite, Pipeless, un framework open source, est présenté en détail, qui offre une expérience de développement sans serveur pour la vision par ordinateur embarquée. Enfin, un guide détaillé étape par étape est fourni qui montre comment créer et exécuter une application simple de détection d'objets à l'aide de quelques fonctions Python et d'un modèle.

Créer des applications de vision par ordinateur

Une façon de décrire la « vision par ordinateur » est de la définir comme « le domaine de la reconnaissance et du traitement d'images qui utilise des caméras et des techniques algorithmiques ». Cependant, cette définition simple ne satisfait peut-être pas pleinement à la compréhension du concept par les gens. Par conséquent, afin de mieux comprendre le processus de création d’applications de vision par ordinateur, nous devons considérer les fonctionnalités que chaque sous-système doit implémenter. Le processus de création d'applications de vision par ordinateur implique plusieurs étapes clés, notamment l'acquisition d'images, le traitement d'images, l'extraction de caractéristiques, la reconnaissance d'objets et la prise de décision. Premièrement, les données d’image sont acquises via une caméra ou un autre dispositif d’acquisition d’images. Les images sont ensuite traitées à l'aide d'algorithmes, comprenant des opérations telles que le débruitage, l'amélioration et la segmentation pour une analyse plus approfondie. Au cours de l'étape d'extraction des caractéristiques, le système identifie les caractéristiques clés de l'image, telles que

Afin de traiter un flux vidéo de 60 ips en temps réel, chaque image doit être traitée en 16 millisecondes. Ceci est généralement réalisé grâce à des processus multithread et multi-traitement. Parfois, il est même nécessaire de commencer le traitement de l'image suivante avant que la précédente ne soit terminée pour garantir un traitement très rapide des images.

Pour les modèles d'intelligence artificielle, heureusement, il existe actuellement de nombreux excellents modèles open source, donc dans la plupart des cas, il n'est pas nécessaire de développer votre propre modèle à partir de zéro, il suffit d'affiner les paramètres pour répondre au cas d'utilisation spécifique. Ces modèles exécutent des inférences sur chaque image, effectuant des tâches telles que la détection d'objets, la segmentation, l'estimation de pose, etc.

• Runtime d'inférence : Le runtime d'inférence est responsable du chargement du modèle et de son exécution efficace sur différents appareils disponibles (GPU ou CPU).

Pour garantir que le modèle puisse s'exécuter rapidement pendant le processus d'inférence, l'utilisation du GPU est essentielle. Les GPU peuvent gérer des ordres de grandeur plus d'opérations parallèles que les CPU, en particulier lors du traitement de grandes quantités d'opérations mathématiques. Lors du traitement des images, vous devez prendre en compte l'emplacement mémoire où se trouve l'image. Vous pouvez choisir de la stocker dans la mémoire GPU ou dans la mémoire CPU (RAM). Cependant, la copie d'images entre ces deux mémoires différentes peut entraîner des opérations plus lentes, notamment lorsque la taille de l'image est grande. Cela signifie également que les choix de mémoire et la surcharge de transfert de données doivent être pris en compte pour obtenir un processus d'inférence de modèle plus efficace.

Le pipeline multimédia est un ensemble de composants qui extraient un flux vidéo d'une source de données, le divisent en images, puis l'utilisent comme entrée dans le modèle. Parfois, ces composants peuvent également modifier et reconstruire le flux vidéo pour le transfert. Ces composants jouent un rôle clé dans le traitement des données vidéo, garantissant que le flux vidéo peut être transmis et traité efficacement.

• Gestion des flux vidéo : les développeurs peuvent souhaiter que les applications soient capables de résister à l'interruption des flux vidéo, à la reconnexion, d'ajouter et de supprimer dynamiquement des flux vidéo, de gérer plusieurs flux vidéo simultanément, et bien plus encore.

Tous ces systèmes doivent être créés ou intégrés au projet et, par conséquent, le code doit être maintenu. Cependant, le problème rencontré est que vous finissez par conserver une grande quantité de code qui n'est pas spécifique à l'application, mais plutôt un sous-système qui entoure le code spécifique au cas réel.

Pipeless Framework

Pour éviter de créer tout ce qui précède à partir de zéro, vous pouvez utiliser le framework Pipeless à la place. Il s'agit d'un framework open source pour la vision par ordinateur qui permet certaines fonctionnalités spécifiques à un cas et est capable de gérer d'autres choses.

Le framework Pipeless divise la logique de l'application en "étapes", dont l'une est comme une micro-application d'un modèle unique. Une étape peut inclure un prétraitement, l'exécution d'une inférence à l'aide de l'entrée prétraitée et le post-traitement de la sortie du modèle pour une action. Vous pouvez ensuite enchaîner autant d'étapes que vous le souhaitez pour constituer une application complète, même en utilisant plusieurs modèles.

Pour fournir la logique de chaque étape, ajoutez simplement une fonction de code spécifique à l'application et Pipeless se charge de l'appeler en cas de besoin. C'est pourquoi Pipeless peut être considéré comme un framework qui offre une expérience de développement de type serveur pour la vision par ordinateur embarquée et fournit certaines fonctionnalités sans se soucier du besoin de sous-systèmes supplémentaires.

Une autre fonctionnalité intéressante de Pipeless est la possibilité d'automatiser le traitement des flux vidéo en ajoutant, supprimant et mettant à jour dynamiquement des flux vidéo via CLI ou API REST. Vous pouvez même spécifier une politique de redémarrage, indiquant quand le traitement du flux vidéo doit être redémarré, s'il doit être redémarré après une erreur, etc.

Enfin, pour déployer le framework Pipeless, il suffit de l'installer sur n'importe quel appareil et de l'exécuter avec vos fonctions de code, que ce soit dans une machine virtuelle de cloud computing ou en mode conteneurisé, ou directement dans un appareil edge tel que Nvidia Jetson, Raspberry, etc.

Création d'une application de détection d'objets

Voici un aperçu détaillé de la façon de créer une application de détection d'objets simple à l'aide du framework Pipeless.

La première étape est l'installation. Le script d'installation rend l'installation très simple :

Curl https://raw.githubusercontent.com/pipeless-ai/pipeless/main/install.sh | bash

Copier après la connexion

Maintenant, il faut créer un projet. Un projet Pipeless est un répertoire contenant des étapes. Chaque étape se trouve dans un sous-répertoire, et dans chaque sous-répertoire, un fichier contenant des hooks (fonctions de code spécifiques) est créé. Le nom fourni pour chaque dossier d'étape est le nom de l'étape qui doit être indiqué ultérieurement dans la boîte Pipeless lorsque vous souhaitez exécuter cette étape pour le flux vidéo.

pipeless init my-project --template emptycd my-project

Copier après la connexion

Ici, le modèle vide indique à la CLI de créer uniquement le répertoire, si aucun modèle n'est fourni, la CLI posera quelques questions pour créer la scène de manière interactive.

Comme mentionné ci-dessus, il faut désormais ajouter une étape au projet. Téléchargez un exemple de scène depuis GitHub à l'aide de la commande suivante :

wget -O - https://github.com/pipeless-ai/pipeless/archive/main.tar.gz | tar -xz --strip=2 "pipeless-main/examples/onnx-yolo"

Copier après la connexion

Cela créera un répertoire de scène onnx-yolo qui contient les fonctions de l'application.

Ensuite, vérifiez le contenu de chaque fichier d'étape, qui sont des hooks d'application.

Voici un fichier pré-process.py qui définit une fonction (hooks) qui accepte un cadre et une scène. Cette fonction effectue certaines opérations pour préparer les données d'entrée recevant les images RVB afin qu'elles correspondent au format attendu par le modèle. Ces données sont ajoutées à frame_data['interence_input'], qui sont les données que Pipeless transmettra au modèle.

def hook(frame_data, context):frame = frame_data["original"].view()yolo_input_shape = (640, 640, 3) # h,w,cframe = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)frame = resize_rgb_frame(frame, yolo_input_shape)frame = cv2.normalize(frame, None, 0.0, 1.0, cv2.NORM_MINMAX)frame = np.transpose(frame, axes=(2,0,1)) # Convert to c,h,winference_inputs = frame.astype("float32")frame_data['inference_input'] = inference_inputs... (some other auxiliar functions that we call from the hook function)

Copier après la connexion

Il y a aussi le fichier process.json qui indique quel runtime d'inférence Pipeless utiliser (runtime ONNX dans ce cas), où trouver le modèle qu'il doit charger, et certains de ses paramètres facultatifs, tels que comme fournisseur_d'exécution à utiliser, c'est-à-dire CPU, CUDA, TensorRT, etc.

{ "runtime": "onnx","model_uri": "https://pipeless-public.s3.eu-west-3.amazonaws.com/yolov8n.onnx","inference_params": { "execution_provider": "tensorrt" }}

Copier après la connexion

Enfin, le fichier post-process.py définit une fonction similaire à celle de pre-process.py. Cette fois, il accepte la sortie d'inférence que Pipeless stocke dans frame_data["inference_output"] et effectue l'opération d'analyse de cette sortie dans un cadre englobant. Plus tard, il dessine le cadre de délimitation sur le cadre et attribue finalement le cadre modifié à frame_data['modified']. De cette façon, Pipeless transmettra le flux vidéo fourni, mais avec des images modifiées, y compris des cadres de délimitation.

def hook(frame_data, _):frame = frame_data['original']model_output = frame_data['inference_output']yolo_input_shape = (640, 640, 3) # h,w,cboxes, scores, class_ids =  parse_yolo_output(model_output, frame.shape, yolo_input_shape)class_labels = [yolo_classes[id] for id in class_ids]for i in range(len(boxes)):draw_bbox(frame, boxes[i], class_labels[i], scores[i])frame_data['modified'] = frame... (some other auxiliar functions that we call from the hook function)

Copier après la connexion

La dernière étape consiste à démarrer Pipeless et à fournir un flux vidéo. Pour démarrer Pipeless, exécutez simplement la commande suivante dans le répertoire my-project :

pipeless start --stages-dir .

Copier après la connexion

Une fois exécuté, le flux vidéo de la webcam (v4l2) sera fourni et la sortie sera affichée directement sur l'écran. Il convient de noter qu'une liste des étapes que le flux vidéo exécute en séquence doit être fournie. Dans ce cas, ce n'est que l'étape onnx-yolo :

pipeless add stream --input-uri "v4l2" --output-uri "screen" --frame-path "onnx-yolo"

Copier après la connexion

Conclusion

Créer une application de vision par ordinateur est une tâche complexe car de nombreux facteurs et sous-systèmes doivent être implémentés autour d'elle. Avec un framework comme Pipeless, la mise en route ne prend que quelques minutes, ce qui vous permet de vous concentrer sur l'écriture de code pour des cas d'utilisation spécifiques. De plus, les « étapes » Pipeless sont hautement réutilisables et faciles à entretenir, la maintenance sera donc facile et pourra être répétée très rapidement.

Si vous souhaitez participer au développement de Pipeless, vous pouvez le faire via son dépôt GitHub.

Tiginal Titre: Créez une application complète de vision par ordinateur en quelques minutes avec seulement deux fonctions Python, auteur: Miguel Angel Cabrera

link: https: //www.php.cn/link/e26dbb5b1843bf566ea7ec757f3325c4

🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7476

Tutoriel CakePHP

1377

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

MySQL doit-il payer Apr 08, 2025 pm 05:36 PM

MySQL a une version communautaire gratuite et une version d'entreprise payante. La version communautaire peut être utilisée et modifiée gratuitement, mais le support est limité et convient aux applications avec des exigences de stabilité faibles et des capacités techniques solides. L'Enterprise Edition fournit une prise en charge commerciale complète pour les applications qui nécessitent une base de données stable, fiable et haute performance et disposées à payer pour le soutien. Les facteurs pris en compte lors du choix d'une version comprennent la criticité des applications, la budgétisation et les compétences techniques. Il n'y a pas d'option parfaite, seulement l'option la plus appropriée, et vous devez choisir soigneusement en fonction de la situation spécifique.

Comment utiliser MySQL après l'installation Apr 08, 2025 am 11:48 AM

L'article présente le fonctionnement de la base de données MySQL. Tout d'abord, vous devez installer un client MySQL, tel que MySQLWorkBench ou le client de ligne de commande. 1. Utilisez la commande MySQL-UROot-P pour vous connecter au serveur et connecter avec le mot de passe du compte racine; 2. Utilisez Createdatabase pour créer une base de données et utilisez Sélectionner une base de données; 3. Utilisez CreateTable pour créer une table, définissez des champs et des types de données; 4. Utilisez InsertInto pour insérer des données, remettre en question les données, mettre à jour les données par mise à jour et supprimer les données par Supprimer. Ce n'est qu'en maîtrisant ces étapes, en apprenant à faire face à des problèmes courants et à l'optimisation des performances de la base de données que vous pouvez utiliser efficacement MySQL.

MySQL ne peut pas être installé après le téléchargement Apr 08, 2025 am 11:24 AM

Les principales raisons de la défaillance de l'installation de MySQL sont les suivantes: 1. Problèmes d'autorisation, vous devez s'exécuter en tant qu'administrateur ou utiliser la commande sudo; 2. Des dépendances sont manquantes et vous devez installer des packages de développement pertinents; 3. Conflits du port, vous devez fermer le programme qui occupe le port 3306 ou modifier le fichier de configuration; 4. Le package d'installation est corrompu, vous devez télécharger et vérifier l'intégrité; 5. La variable d'environnement est mal configurée et les variables d'environnement doivent être correctement configurées en fonction du système d'exploitation. Résolvez ces problèmes et vérifiez soigneusement chaque étape pour installer avec succès MySQL.

Le fichier de téléchargement MySQL est endommagé et ne peut pas être installé. Réparer la solution Apr 08, 2025 am 11:21 AM

Le fichier de téléchargement mysql est corrompu, que dois-je faire? Hélas, si vous téléchargez MySQL, vous pouvez rencontrer la corruption des fichiers. Ce n'est vraiment pas facile ces jours-ci! Cet article expliquera comment résoudre ce problème afin que tout le monde puisse éviter les détours. Après l'avoir lu, vous pouvez non seulement réparer le package d'installation MySQL endommagé, mais aussi avoir une compréhension plus approfondie du processus de téléchargement et d'installation pour éviter de rester coincé à l'avenir. Parlons d'abord de la raison pour laquelle le téléchargement des fichiers est endommagé. Il y a de nombreuses raisons à cela. Les problèmes de réseau sont le coupable. L'interruption du processus de téléchargement et l'instabilité du réseau peut conduire à la corruption des fichiers. Il y a aussi le problème avec la source de téléchargement elle-même. Le fichier serveur lui-même est cassé, et bien sûr, il est également cassé si vous le téléchargez. De plus, la numérisation excessive "passionnée" de certains logiciels antivirus peut également entraîner une corruption des fichiers. Problème de diagnostic: déterminer si le fichier est vraiment corrompu

MySQL a-t-il besoin d'Internet Apr 08, 2025 pm 02:18 PM

MySQL peut s'exécuter sans connexions réseau pour le stockage et la gestion des données de base. Cependant, la connexion réseau est requise pour l'interaction avec d'autres systèmes, l'accès à distance ou l'utilisation de fonctionnalités avancées telles que la réplication et le clustering. De plus, les mesures de sécurité (telles que les pare-feu), l'optimisation des performances (choisissez la bonne connexion réseau) et la sauvegarde des données sont essentielles pour se connecter à Internet.

Comment optimiser les performances MySQL pour les applications de haute charge? Apr 08, 2025 pm 06:03 PM

Guide d'optimisation des performances de la base de données MySQL dans les applications à forte intensité de ressources, la base de données MySQL joue un rôle crucial et est responsable de la gestion des transactions massives. Cependant, à mesure que l'échelle de l'application se développe, les goulots d'étranglement des performances de la base de données deviennent souvent une contrainte. Cet article explorera une série de stratégies efficaces d'optimisation des performances MySQL pour garantir que votre application reste efficace et réactive dans des charges élevées. Nous combinerons des cas réels pour expliquer les technologies clés approfondies telles que l'indexation, l'optimisation des requêtes, la conception de la base de données et la mise en cache. 1. La conception de l'architecture de la base de données et l'architecture optimisée de la base de données sont la pierre angulaire de l'optimisation des performances MySQL. Voici quelques principes de base: sélectionner le bon type de données et sélectionner le plus petit type de données qui répond aux besoins peut non seulement économiser un espace de stockage, mais également améliorer la vitesse de traitement des données.

Solutions au service qui ne peuvent pas être démarrées après l'installation de MySQL Apr 08, 2025 am 11:18 AM

MySQL a refusé de commencer? Ne paniquez pas, vérifions-le! De nombreux amis ont découvert que le service ne pouvait pas être démarré après avoir installé MySQL, et ils étaient si anxieux! Ne vous inquiétez pas, cet article vous emmènera pour le faire face calmement et découvrez le cerveau derrière! Après l'avoir lu, vous pouvez non seulement résoudre ce problème, mais aussi améliorer votre compréhension des services MySQL et vos idées de problèmes de dépannage, et devenir un administrateur de base de données plus puissant! Le service MySQL n'a pas réussi et il y a de nombreuses raisons, allant des erreurs de configuration simples aux problèmes système complexes. Commençons par les aspects les plus courants. Connaissances de base: une brève description du processus de démarrage du service MySQL Service Startup. Autrement dit, le système d'exploitation charge les fichiers liés à MySQL, puis démarre le démon mysql. Cela implique la configuration

Comment optimiser les performances de la base de données après l'installation de MySQL Apr 08, 2025 am 11:36 AM

L'optimisation des performances MySQL doit commencer à partir de trois aspects: configuration d'installation, indexation et optimisation des requêtes, surveillance et réglage. 1. Après l'installation, vous devez ajuster le fichier my.cnf en fonction de la configuration du serveur, tel que le paramètre innodb_buffer_pool_size, et fermer query_cache_size; 2. Créez un index approprié pour éviter les index excessifs et optimiser les instructions de requête, telles que l'utilisation de la commande Explication pour analyser le plan d'exécution; 3. Utilisez le propre outil de surveillance de MySQL (ShowProcessList, Showstatus) pour surveiller la santé de la base de données, et sauvegarde régulièrement et organisez la base de données. Ce n'est qu'en optimisant en continu ces étapes que les performances de la base de données MySQL peuvent être améliorées.

See all articles