Autres informations sur le code de vérification dans le didacticiel du code de vérification du développement PHP
Les codes de vérification empêchent généralement l'enregistrement des lots, et ils semblent difficiles à l'œil humain, sans parler d'une machine. Erxiang Baidu Tieba vous demande de saisir un code de vérification lorsque vous publiez sans devenir membre du barreau, probablement pour éviter des réponses anonymes à grande échelle. Actuellement, de nombreux sites Web utilisent la technologie des codes de vérification pour empêcher les utilisateurs d'utiliser des robots pour s'inscrire, se connecter automatiquement et envoyer du spam. Le soi-disant code de vérification consiste à générer une image à partir d'une série de nombres ou de symboles générés aléatoirement, et à ajouter des interférences à l'image, comme tracer au hasard quelques lignes droites et dessiner des points (pour empêcher l'OCR), et l'utilisateur peut identifier les informations du code de vérification à l'œil nu. Entrez le formulaire à soumettre pour la vérification du site Web. Une certaine fonction ne peut être utilisée qu'après une vérification réussie.
En règle générale, vous devez saisir les codes de vérification partout où vous enregistrez votre identifiant d'utilisateur et dans les principaux forums
Codes de vérification courants :
(1) Quatre chiffres et lettres, ils peuvent tous être des lettres ou tous des chiffres, une chaîne aléatoire de 4 chiffres, le code de vérification le plus original, l'effet de vérification est presque nul. Les utilisateurs du site Web CSDN utilisent le format GIF pour se connecter et utilisent couramment des codes de vérification d'image numérique aléatoires. Les personnages sur l'image sont assez corrects et l'effet de vérification est meilleur que le précédent.
(2) Les caractères chinois sont le dernier code de vérification actuellement enregistré. Il est généré aléatoirement et difficile à saisir, comme la page de réclamation QQ.
(3) L'application MS hotmail est au format BMP, nombres aléatoires + lettres anglaises majuscules aléatoires + pixels d'interférence aléatoires + positions aléatoires.
(4) Coréen ou japonais, il faut désormais taper en coréen pour s'inscrire sur MS sur Paopao HF, ce qui augmente la difficulté.
(5) L'enregistrement Gmail de Google est au format JPG, lettres anglaises aléatoires + couleurs aléatoires + positions aléatoires + longueurs aléatoires.
(6) Les autres forums majeurs sont au format XBM et le contenu est aléatoire.
(7) Code de vérification de la publicité : il suffit de saisir une partie du contenu dans la publicité. Sa caractéristique est qu'il peut apporter un revenu supplémentaire au site Web et également rafraîchir les utilisateurs.
(8) Code de vérification de la question : Le code de vérification de la question est principalement renseigné sous forme de question et réponse. Il est plus facile à identifier et à saisir que le code de vérification modulaire. Le système peut générer des questions telles que « 1+2= ? » auxquelles les utilisateurs doivent répondre. Bien entendu, ces questions sont générées de manière aléatoire. Un autre type de code de vérification de question est un code de vérification de question basé sur du texte, comme la génération de la question « Quel est le nom complet de la Chine ? » Bien sûr, certains sites Web fournissent également des réponses rapides ou des réponses directes après la question
<. 🎜> 4.Autres fonctions du code de vérification : Empêcher l'enregistrement malveillant Presque tous les forums formels exigent que le code de vérification soit saisi lors de l'inscription. Ceci afin d'empêcher les personnes qui spamment des publicités d'utiliser. machines d'enregistrement pour s'inscrire de manière malveillante. Cette invention originaire de l'Université Carnegie Mellon aux États-Unis est appelée CAPTCHA (test de Turing entièrement automatisé pour distinguer les humains et les ordinateurs), car les personnes inscrites doivent identifier le texte désordonné sur l'image, et cette tâche Seul un véritable humain peut l'accomplir. Il y a des centaines de millions d'utilisateurs d'Internet dans le monde. Pour un individu, les quelques secondes nécessaires pour identifier un texte sont insignifiantes, mais si le pouvoir de tous les utilisateurs d'Internet est exploité, des projets inimaginables et énormes peuvent être réalisés, et c'est ce qui se passe. aux États-Unis C'est ce que fait un groupe de recherche de la CMU à Pittsburgh, en Pennsylvanie. L'équipe a été chargée par une organisation à but non lucratif appelée « Internet Archives » de convertir un grand nombre de livres et de manuscrits anciens en textes électroniques via un logiciel OCR (reconnaissance optique de caractères) pour faciliter le stockage et les requêtes informatiques. Cependant, en raison de la mauvaise qualité du manuscrit original, le mauvais ordinateur lisait mal un mot tous les dix mots numérisés. La seule solution était une vérification manuelle, et un tel travail n'était évidemment pas capable d'être effectué par une seule personne ou un groupe. Par conséquent, la CMU a conçu un système puissant appelé reCAPTCHA pour permettre à leurs ordinateurs de demander de l’aide aux humains. La méthode spécifique consiste à envoyer des images de texte numérisées qui ne peuvent pas être reconnues par le logiciel OCR aux principaux sites Web du monde entier pour remplacer les images de code de vérification d'origine ; une fois que les utilisateurs de ces sites Web ont correctement identifié ces mots, leurs réponses seront renvoyées à la CMU.Afin d'améliorer la précision des utilisateurs dans l'identification du texte, il leur est souvent demandé d'identifier deux mots, dont l'un a une réponse déjà connue. De cette façon, un utilisateur qui identifie correctement le mot avec la réponse est susceptible d'identifier également correctement l'autre mot. Parfois, CMU soumettra également un mot non reconnu à différents utilisateurs. S'ils obtiennent la même réponse, alors la réponse est définitivement correcte.
Depuis que de nombreux sites Web populaires, tels que Facebook, Twitter et StumbleUpon, etc., ont adopté reCAPTCHA, la CMU peut traiter environ un million de mots par jour. Cependant, au rythme actuel, on estime qu’il faudra 400 ans pour numériser tous les textes fournis par Internet Archive.