La diversité du Big Data amène les données à être divisées en trois structures de données, à savoir : 1. Les données structurées, qui sont des données logiquement exprimées et mises en œuvre par une structure de table bidimensionnelle 2. Les données non structurées Ce sont des données ; dont la structure des données est irrégulière ou incomplète, n'a pas de modèle de données prédéfini et n'est pas pratique à représenter par des tableaux logiques bidimensionnels dans la base de données 3. Données semi-structurées ;
L'environnement d'exploitation de ce tutoriel : système Windows 7, ordinateur Dell G3.
La diversité du Big Data amène à diviser les données en trois structures de données : les données structurées, les données non structurées et les données semi-structurées.
Données structurées
Les données structurées sont également appelées données de ligne. Ce sont des données logiquement exprimées et implémentées par une structure de table bidimensionnelle. . Suivez strictement les spécifications de format et de longueur des données, et stockez-les et gérez-les principalement via des bases de données relationnelles.
Le balisage des données structurées permet aux sites Web de mieux s'afficher dans les résultats de recherche. Après le balisage des données structurées, le site Web peut bien afficher des extraits Web riches dans les résultats de recherche.
Les moteurs de recherche prennent tous en charge le balisage de données structurées standard pour offrir aux utilisateurs une meilleure expérience en ligne. Les balises de microdonnées dans les pages Web peuvent aider les moteurs de recherche à comprendre les informations contenues dans les pages Web, ce qui permet aux moteurs de recherche d'identifier plus facilement les catégories et d'en déterminer la pertinence.
Dans le même temps, les microdonnées structurées peuvent permettre aux moteurs de recherche de fournir un résumé plus riche des résultats de recherche, c'est-à-dire des informations détaillées qui aident les utilisateurs dans leurs requêtes spécifiques, leur permettant de voir des informations importantes sur vos produits directement dans le résultats de recherche. Par exemple : le prix du produit, le nom, l'état des stocks (si le produit est en stock), les notes et commentaires des évaluateurs, etc. peuvent tous être consultés directement dans le résumé des résultats de recherche.
Ces extraits enrichis aident les utilisateurs à comprendre si le site Web est pertinent par rapport au contenu de leur recherche, ce qui peut aider à obtenir plus de clics sur la page.
Par exemple, dans les résultats de recherche, davantage de notes par étoiles, de nombre d'avis, de prix et d'autres facteurs sont affichés, ce qui augmente sans aucun doute le professionnalisme du site Web et améliore la confiance des clients dans le site Web. le taux de clics et le taux de conversion du site Web.
Données non structurées
Contrairement aux données structurées, ce sont des données non structurées qui ne conviennent pas pour être représentées par des tables de base de données bidimensionnelles.
Les données non structurées sont des données dont la structure des données est irrégulière ou incomplète, n'ont pas de modèle de données prédéfini et ne sont pas pratiques à représenter par des tables logiques bidimensionnelles dans une base de données.
Comprend tous les formats de documents bureautiques, XML, HTML, divers rapports, images et audio, informations vidéo, etc. Les bases de données qui prennent en charge les données non structurées utilisent des mécanismes de champs à valeurs multiples, de champs uniques et de champs de longueur variable pour créer et gérer des éléments de données, et sont largement utilisées dans la récupération de texte intégral et dans divers domaines de traitement d'informations multimédia
Données semi-structurées
données semi-structurées. Lors de la conception d'un système d'information, le stockage des données sera certainement impliqué. Généralement, nous sauvegarderons les informations du système dans une base de données relationnelle désignée. Nous classerons les données par entreprise, concevrons les tableaux correspondants, puis enregistrerons les informations correspondantes dans les tableaux correspondants. Par exemple, si nous construisons un système d'entreprise et devons enregistrer les informations de base sur les employés : numéro de poste, nom, sexe, date de naissance, etc., nous créerons un tableau du personnel correspondant.
Mais toutes les informations du système ne peuvent pas correspondre aux champs d'un tableau.
Le modèle de données semi-structuré occupe une position unique dans le système de base de données :
(1) Il s'agit d'un modèle de données adapté à l'intégration de bases de données, c'est-à-dire adapté à la description des données contenues dans deux bases de données ou plus contenant des données similaires dans des schémas différents.
(2) Il s'agit d'un modèle de base de service de balisage pour le partage d'informations sur le Web.
Le modèle structurel des données semi-structurées est attaché ou mélangé aux données elles-mêmes, et les données elles-mêmes décrivent leur modèle structurel correspondant. Plus précisément, les données semi-structurées présentent les caractéristiques suivantes :
(1) La structure des données est auto-descriptive. Structure et données fusionnent, et il n'est pas nécessaire de faire la distinction entre « métadonnées » et « données générales » dans la recherche et les applications (les deux ne font plus qu'un).
(2) Complexité de la description de la structure des données. La structure est difficile à intégrer dans les divers cadres de description existants, et il est difficile de la comprendre et de la saisir clairement dans des applications pratiques.
(3) Nature dynamique de la description de la structure des données. Les modifications des données entraînent généralement des modifications du modèle structurel, et le modèle de structure global a une structure dynamique.
Les modèles de données conventionnels tels que le modèle E-R, le modèle relationnel et le modèle objet sont exactement à l'opposé des caractéristiques ci-dessus, ils peuvent donc devenir des modèles de données structurés. Par rapport aux données structurées, la composition des données semi-structurées est plus complexe et incertaine, elles ont donc une plus grande flexibilité et peuvent s'adapter à un plus large éventail de besoins d'application.
Pour plus d'articles connexes, veuillez visiter le Site Web PHP chinois ! !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!