Le Big Data fait référence à un ensemble de données qui ne peuvent pas être capturées, gérées et traitées avec des outils logiciels conventionnels dans un certain laps de temps. Elles nécessitent de nouveaux modèles de traitement pour disposer d'un pouvoir décisionnel plus fort, d'une découverte d'informations et d'une optimisation des processus. capacités d’information massives, à forte croissance et diversifiées. Caractéristiques : grand volume, haute vitesse, variété, faible densité de valeur, authenticité.
Le Big Data, terme de l'industrie informatique, fait référence à un ensemble de données qui ne peuvent pas être capturées, gérées et traitées dans un certain laps de temps à l'aide d'outils logiciels conventionnels. , sont des actifs d'information massifs, à forte croissance et diversifiés qui nécessitent de nouveaux modèles de traitement pour disposer d'un pouvoir décisionnel plus fort, de capacités de découverte d'informations et d'optimisation des processus.
Dans « L'ère du Big Data » écrit par Victor Meier-Schoenberg et Kenneth Cukier, le big data fait référence à l'utilisation de toutes les données au lieu de raccourcis tels que l'analyse aléatoire (enquête par échantillonnage). Les caractéristiques 5V du big data (proposées par IBM) :
Volume (grande quantité) : Énorme quantité de données
Le stockage centralisé/l'informatique centralisée ne peut plus gérer le une énorme quantité de données.
La quantité de données augmente de façon exponentielle : les capteurs des tremblements de terre, des diagraphies de puits et des plates-formes pétrolières génèrent plus de données en un mois que tous les films du monde réunis.
Sina Weibo compte plus de 250 millions d'utilisateurs, avec un pic de plusieurs centaines de millions de messages par jour.
Variété : Diversité des données non structurées
Texte/image/vidéo/document, etc., telles que la surveillance de la température distribuée (DTS) microsismique, électromagnétique et par fibre optique.
Vitesse (haute vitesse) : croissance rapide des données
Énorme base d'utilisateurs/grand nombre d'appareils/temps réel massif/croissance exponentielle des données.
Valeur (faible densité de valeurs) : La valeur des données
Chaque appareil de forage dispose de 40 000 capteurs, mais généralement seulement 10 % des données sont utilisées.
L'investissement dans chaque plate-forme de forage en eau profonde peut atteindre 150 millions de dollars. L'utilisation efficace de toutes les données est très critique, liée à la sécurité et à l'optimisation des opérations.
Vercity (authenticité) : authenticité des données
Pour plus d'articles connexes, veuillez visiter le Site Web PHP chinois ! !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!