Vous êtes-vous déjà demandé comment les performances de Polars Deltalake sur Azure se comparent à celles d'un ordinateur portable grand public ?
Non? Eh bien, je l'ai fait. Si j'ai éveillé votre curiosité, continuez à lire.
Voici les prétendants
Voir Tarifs pour une liste complète des forfaits de services d'application disponibles.
Le test mesure trois scénarios
Le code est exécuté via les points de terminaison de l'API REST :
Sur le HP EliteBook, j'ai utilisé func start pour lancer https://localhost:7071.
Pour publier sur Azure I, suivez les instructions de https://learn.microsoft.com/en-us/azure/azure-functions/create-first-function-cli-python
mettre en place l’environnement de développement nécessaire. Cela m'a permis de publier la fonction via
func azure functionapp publie function-hekori-learning-002.
J'ai utilisé Terraform pour configurer les ressources Azure dans la région Europe du Nord.
Voici un extrait de code montrant le code exécuté lors de la visite de https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read
@app.route(route="polars/azure/read", auth_level=func.AuthLevel.ANONYMOUS) def polars_azure_read(req: func.HttpRequest) -> func.HttpResponse: logging.info('Reading from delta table') tic = time.time() df = pl.read_delta(AZURE_STORAGE_PATH, storage_options=storage_options ) df = df.sql( "select sum(value) as sum, avg(value) as mean, count() as count, name from self group by name order by sum asc" ) toc = time.time() logging.info(f"Elapsed time {toc - tic:.2f} seconds") return func.HttpResponse( "Success from polars." + str(df) + '\n' + "Elapsed time " + str(toc - tic) + " seconds", status_code=200 )
Comme on peut le constater, le HP EliteBook est environ un ordre de grandeur plus rapide dans tous les scénarios.
C'est mon interprétation personnelle
Veuillez noter que la table delta a une petite taille de 3 commits et 2 fichiers parquet. C'est-à-dire que le moteur d'exécution mesure efficacement la surcharge d'accès aux fichiers depuis l'unité de calcul.
Si vous ❤️ cet article et que vous souhaitez voir plus de résultats de référence avec des ensembles de données plus importants pour le traitement hors noyau, donnez à cet article un ?
et t'abonner ? sur ma chaîne ???.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!