Construire une application robuste et évolutive signifie souvent gérer des tâches qui nécessitent plus qu'un seul serveur ou thread ne peut gérer efficacement. Qu'il s'agisse de traiter des images, d'envoyer des e-mails ou d'effectuer des calculs gourmands en données, transférer ces tâches vers une file d'attente de tâches est une bonne pratique. Pour Text2Infographic, mon générateur d'infographies alimenté par l'IA, le défi était clair : je devais gérer efficacement de nombreuses soumissions de travaux simultanées tout en conservant une expérience utilisateur fluide. Cela m'a amené à adopter Celery, une puissante file d'attente de tâches distribuées, et Supervisord, un système de gestion de processus, le tout déployé de manière transparente sur AWS Elastic Beanstalk en utilisant la puissance de .ebextensions.
Voici un guide étape par étape expliquant comment configurer un travailleur Celery avec Supervisord sur Elastic Beanstalk. Mais d’abord, décomposons les composants clés de cette configuration et pourquoi ils sont essentiels.
À la base, Celery est un système de file d'attente de tâches distribué qui vous permet de décharger des tâches fastidieuses vers des processus ou des serveurs séparés. Il est largement utilisé dans les applications Python pour exécuter des tâches en arrière-plan de manière asynchrone ou planifiée. Pour Text2Infographic, Celery était la solution parfaite pour gérer le processus informatique intensif de génération d'infographies personnalisées à partir des entrées de l'utilisateur.
Quelques avantages de l'utilisation du céleri :
Exécution asynchrone : les tâches peuvent s'exécuter en arrière-plan sans bloquer l'application principale.
Évolutivité : ajoutez facilement plus de travailleurs pour gérer une charge accrue.
Extensibilité : s'intègre à divers courtiers de messages comme RabbitMQ ou Redis.
Gérer manuellement des processus tels que les travailleurs de Celery peut devenir compliqué, en particulier lorsque vous avez besoin qu'ils redémarrent automatiquement après un crash ou pendant des déploiements. Supervisord est un système de contrôle de processus léger qui résout ce problème en gardant un œil sur vos processus et en garantissant qu'ils restent opérationnels.
Avec Supervisord, vous pouvez :
Redémarrez automatiquement les travailleurs Celery s'ils échouent.
Simplifiez la gestion des processus avec un seul fichier de configuration.
Enregistrez l'activité du processus pour un meilleur débogage et une meilleure surveillance.
AWS Elastic Beanstalk est un service entièrement géré qui automatise le déploiement, la mise à l'échelle et la gestion des applications. Il élimine une grande partie de la complexité de la gestion de l'infrastructure, permettant aux développeurs de se concentrer sur l'écriture du code plutôt que sur la configuration des serveurs. Elastic Beanstalk prend en charge divers environnements, des simples serveurs Web aux configurations plus complexes telles que les travailleurs Celery.
Pour Text2Infographic, l'évolutivité et la simplicité d'Elastic Beanstalk ont été inestimables. À mesure que la demande des utilisateurs fluctue, la possibilité de faire évoluer les instances de travail de manière dynamique garantit que les tâches sont traitées efficacement, même pendant les heures de pointe.
.ebextensions est une fonctionnalité d'Elastic Beanstalk qui vous permet de personnaliser votre environnement lors du déploiement. Avec les fichiers de configuration .ebextensions, vous pouvez :
Installez les logiciels et les dépendances nécessaires.
Configurez des services tels que les travailleurs Supervisord et Celery.
Ajoutez des variables d'environnement et gérez les autorisations.
Cela permet d'intégrer de manière transparente Celery et Supervisord dans votre déploiement Elastic Beanstalk sans intervention manuelle à chaque déploiement.
Text2Infographic est conçu pour aider les spécialistes du marketing et les créateurs de contenu à transformer les articles de blog en infographies époustouflantes. Chaque demande de génération d'infographie nécessite des calculs intensifs, impliquant une recherche thématique basée sur l'IA, une optimisation de la conception et une recherche de graphiques vectoriels. Pour maintenir une expérience utilisateur transparente, ces tâches doivent être confiées à un travailleur en arrière-plan capable de gérer plusieurs demandes simultanément. La gestion des tâches asynchrones et l’évolutivité de Celery en ont fait le choix évident.
Bien qu'Elastic Beanstalk puisse gérer les serveurs Web de manière native, il ne prend pas en charge les processus en arrière-plan tels que les travailleurs Celery. Entrez Superviseur. Il agit en tant que superviseur du processus de travail Celery, garantissant qu'il s'exécute en continu et redémarre automatiquement en cas d'échec. Cette fiabilité est cruciale pour traiter les demandes de génération d'infographies sans interruption.
Le décor étant planté, plongeons-nous dans les détails techniques de la configuration de Celery, Supervisord et eb_extensions sur Elastic Beanstalk afin de créer une file d'attente de tâches évolutive et efficace pour votre application.
Dans cette section, nous passerons en revue les fichiers .ebextensions requis pour configurer Celery avec Supervisord sur Elastic Beanstalk. Chaque étape est expliquée en détail, avec des conseils pour vous aider à éviter les pièges courants.
1. Installation de Supervisord
Fichier : 01_install_supervisord.config
Ce fichier installe Supervisord et configure un utilisateur non root pour exécuter les processus en toute sécurité.
commands: 01_install_pip: command: "yum install -y python3-pip" ignoreErrors: true 02_install_supervisor: command: "/usr/bin/pip3 install supervisor" 03_create_nonroot_user: command: "useradd -r -M -s /sbin/nologin nonrootuser || true" ignoreErrors: true
Explication :
Installer pip : Garantit que le gestionnaire de packages de Python est disponible.
Installer Supervisor : Utilise pip pour installer Supervisord, un gestionnaire de processus léger et puissant.
Créer un utilisateur non root : Ajoute un utilisateur restreint (utilisateur non root) sans shell de connexion ni répertoire personnel. L'exécution de processus en tant qu'utilisateur non root est une bonne pratique de sécurité.
? Astuce : Utilisez toujours ignoreErrors: true lorsque les commandes peuvent échouer lors de déploiements répétés. Cela garantit que votre déploiement n’échouera pas si l’utilisateur ou le package existe déjà.
2. Nettoyer les processus obsolètes
Fichier : 02_cleanup_existing_supervisord.config
Ce fichier gère le nettoyage des anciennes instances Supervisord et des fichiers de socket qui pourraient persister entre les déploiements.
commands: kill_existing_supervisord: command: "pkill supervisord || true" ignoreErrors: true remove_stale_socket: command: "rm -f /tmp/supervisor.sock" ignoreErrors: true
Explication :
Tuer le Supervisord existant : Garantit qu'aucun processus Supervisord parasite n'est en cours d'exécution. Le || true part garantit que cette commande ne générera pas d'erreurs si aucun processus n'est trouvé.
Supprimer le socket obsolète : Supprime tous les anciens fichiers de socket Supervisord, ce qui pourrait empêcher le démarrage de Supervisord.
? Conseil : Le nettoyage des sockets et des processus est essentiel dans des environnements comme Elastic Beanstalk, où les déploiements peuvent parfois laisser derrière eux des vestiges de configurations précédentes.
3. Configuration du céleri avec Supervisord
Fichier : 03_celery_configuration.config
Ce fichier crée le fichier de configuration Supervisord et démarre le processus de travail Celery.
files: "/etc/supervisord.conf": mode: "000644" owner: root group: root content: | [unix_http_server] file=/tmp/supervisor.sock chmod=0770 chown=root:nonrootuser [supervisord] logfile=/var/log/supervisord.log logfile_maxbytes=50MB logfile_backups=10 loglevel=info pidfile=/tmp/supervisord.pid nodaemon=false minfds=1024 minprocs=200 user=root [rpcinterface:supervisor] supervisor.rpcinterface_factory = supervisor.rpcinterface:make_main_rpcinterface [supervisorctl] serverurl=unix:///tmp/supervisor.sock [program:celery] command=celery -A application.celery worker --loglevel=INFO directory=/var/app/current autostart=true autorestart=true startsecs=10 stopwaitsecs=600 stdout_logfile=/var/log/celery_worker.log stderr_logfile=/var/log/celery_worker.err.log environment=PATH="/var/app/venv/staging-LQM1lest/bin:$PATH" user=nonrootuser
Explication :
Socket Unix pour le contrôle : La section unix_http_server crée un socket sécurisé pour interagir avec Supervisord.
Journalisation : Les journaux sont stockés dans /var/log/supervisord.log, avec une politique de rotation pour empêcher l'utilisation du disque de devenir incontrôlable.
Bloc programme céleri :
Commande : Exécute le travailleur Celery avec la configuration de l'application.
Démarrage et redémarrage automatique : Garantit que Celery démarre automatiquement lors du déploiement et redémarre en cas d'échec.
Journaux : Enregistre la sortie de Celery dans /var/log/celery_worker.log et /var/log/celery_worker.err.log.
Environnement : Garantit que l'environnement virtuel Python correct est utilisé.
? Conseil : Utilisez directory=/var/app/current pour pointer Supervisord vers le répertoire de déploiement de l'application, qui est mis à jour à chaque déploiement Elastic Beanstalk.
4. Démarrage de Supervisord
Fichier : 03_celery_configuration.config (suite)
container_commands: 01_start_supervisor: command: "supervisord -c /etc/supervisord.conf"
Explication :
Commandes de conteneur : Celles-ci s'exécutent après le déploiement de votre application mais avant que l'environnement ne soit marqué comme prêt. Démarrer Supervisord ici garantit que votre travailleur Celery est en cours d'exécution lorsque l'application sera mise en ligne.
? Conseil : Elastic Beanstalk traite les commandes du conteneur par ordre alphabétique, alors préfixez vos commandes avec des chiffres comme 01_ pour contrôler l'ordre d'exécution.
Débogage simplifié : Si quelque chose ne fonctionne pas, ajoutez une commande de conteneur temporaire pour imprimer les variables d'environnement ou répertorier le contenu du répertoire :
commands: 01_install_pip: command: "yum install -y python3-pip" ignoreErrors: true 02_install_supervisor: command: "/usr/bin/pip3 install supervisor" 03_create_nonroot_user: command: "useradd -r -M -s /sbin/nologin nonrootuser || true" ignoreErrors: true
Vérifiez les journaux dans /var/log/eb-activity.log.
Réutiliser les configurations communes : Stockez les extraits de configuration partagés dans un fichier YAML distinct, puis incluez-les dans plusieurs fichiers .ebextensions à l'aide de la directive include (non officiellement prise en charge).
Cette configuration garantit que vos collaborateurs Celery sont gérés efficacement avec Supervisord, évoluant parallèlement à votre application Elastic Beanstalk. Que vous gériez la génération d'infographies ou toute autre tâche en arrière-plan, cette approche offre fiabilité, évolutivité et tranquillité d'esprit.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!