Appelez cjieba en utilisant le FFI de PHP

藏色散人
Libérer: 2023-04-09 16:36:02
avant
4139 Les gens l'ont consulté

Recommandé : "Tutoriel vidéo PHP"

phpjieba_ffi

Utilisez le test FFI de PHP 7.4 pour directement appelez cjieba La raison pour laquelle vous avez choisi CJieba pour la bibliothèque dynamique de segmentation de mots

est que FFI utilise la convention d'appel C. Si vous utilisez Cpp, vous devez le packager vous-même, puis extern C pour laisser le compilateur générer un. bibliothèque dynamique C standard.

Problèmes rencontrés

Défaut de segmentation

La variable C n'est pas initialisée

C est appelé directement Fonctions qui n'ont pas été initialisés par FFI sont appelés

Le jugement non nul nécessite l'utilisation de FFI::isNull($x)

Les tableaux sous forme de pointeurs ne peuvent pas être utilisés foreach

.

Boucle de tableau de forme de pointeur

En regardant le code C, nous avons constaté que la partie Cut est la suivante :

CJiebaWord* Cut(Jieba handle, const char* sentence, size_t len) {
  cppjieba::Jieba* x = (cppjieba::Jieba*)handle;
  vector<string> words;
  string s(sentence, len);
  x->Cut(s, words);
  
  CJiebaWord* res = (CJiebaWord*)malloc(sizeof(CJiebaWord) * (words.size() + 1));
  size_t offset = 0;
  for (size_t i = 0; i < words.size(); i++) {
    res[i].word = sentence + offset;
    res[i].len = words[i].size();
    offset += res[i].len;
  }
  if (offset != len) {
    free(res);
    return NULL;
  }
  res[words.size()].word = NULL;
  res[words.size()].len = 0;
  return res;
}
Copier après la connexion

Renvoie un pointeur de structure en C. langage, le nom du tableau est en fait l'adresse du pointeur de la première variable du tableau, elle peut donc être parcourue via l'opération d'adresse du pointeur ++ Et dans FFI ?

Pour ce tableau, j'ai d'abord utilisé une boucle foreach et j'ai directement signalé une erreur de segment. Plus tard, comme C, j'ai directement utilisé pointer++ et j'ai trouvé que c'était faisable. Je donne un coup de pouce à FFI ici car c'est le cas. peut également être utilisé directement.

Acquisition des résultats de segmentation de mots

Comme le montre le code ci-dessus, pour une segmentation de mot unique CJiebaWord, il ne s'agit pas de la segmentation de mots enregistrée, mais de la phrase + décalage, c'est-à-dire que le résultat de la segmentation du premier mot est définitivement une chaîne brute.

Dans la démo C, il est formaté par printf (. indique la largeur et l'alignement du champ), mais il n'existe pas de méthode similaire en PHP. Vous devez intercepter la chaîne substr($x->word, 0. , $x- >len)

  for (x = words; x->word; x++) {
    printf("%*.*s\n", x->len, x->len, x->word);
  }
Copier après la connexion

Exemple d'utilisation

Compiler la bibliothèque dynamique

make libjieba.so
Copier après la connexion

Exécuter

time php demo.php
Copier après la connexion

Exécuter la démo c

make demo
time ./demo
Copier après la connexion

Résultats

PHP
load: 0.00025701522827148
real    1m59.619s
user    1m56.093s
sys     0m3.517s
C
real    1m54.738s
user    1m50.382s
sys     0m4.323s
CPU 占用 基本都是 12%
Copier après la connexion

Vous pouvez constater qu'en utilisant FFI, la vitesse de PHP est fondamentalement la même que celle de C. Si vous avez une entreprise qui prend beaucoup de temps CPU, vous pouvez essayer d'utiliser d'autres langages (C/C++, golang, Rust, etc.) pour écrire puis exporter une bibliothèque dynamique C standard.

Utilisation de FFI

Avant FFI, où des appels système ou des appels SDK étaient requis, PHP devait développer des extensions, mais le développement d'extensions nécessitait non seulement une compréhension du langage C, il faut quand même comprendre le noyau PHP, ce qui est plus difficile. Maintenant c'est beaucoup plus pratique, vous pouvez directement utiliser FFI pour appeler la bibliothèque dynamique.

Extension étendue des macros

Par exemple, le SDK de Hikvision possède un grand nombre de macros gcc -E -P HCNetSDK.h -o HCNetSDK_unfold.h prend en charge la définition de type, la sensation libre de l'utiliser

Adresse originale : https://github.com/dwdcth/phpjieba_ffi

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
php
source:github.io
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal