ホームページ よくある問題 『ビッグデータ時代』という本に出てくるビッグデータとは何を意味するのでしょうか?

『ビッグデータ時代』という本に出てくるビッグデータとは何を意味するのでしょうか?

Feb 14, 2022 am 11:44 AM
ビッグデータ

書籍「ビッグデータ時代」におけるビッグデータとは、「すべてのデータまたはすべてのデータ」を指し、「巨大データ」とも呼ばれます。これは、膨大な量のデータを指します。ソフトウェア ツールは、企業がより前向きなビジネス上の意思決定を行えるよう、合理的な時間内で情報を取得、管理、処理、整理することができます。

『ビッグデータ時代』という本に出てくるビッグデータとは何を意味するのでしょうか?

このチュートリアルの動作環境: Windows 7 システム、Dell G3 コンピューター。

書籍『ビッグデータ時代』におけるビッグデータとは、「すべてのデータ、またはすべてのデータ」を指します。

ビッグデータ (ビッグデータ) または膨大な量のデータとは、現在の主流では適切な時間内に取得、管理、管理することができないほど大量のデータを指します。ソフトウェア ツール: 情報を処理および整理して、企業がより前向きなビジネス上の意思決定を行えるようにします。

Victor Meyer-Schoenberg と Kenneth Cukier 著「ビッグデータの時代」では、ビッグデータとは、ランダム分析 (サンプリング調査) などの近道を使わずにすべてのデータを利用することを指します。データ: ボリューム、速度、多様性、および値。

ビッグ データの概念の発展の歴史:

「ビッグ データ」という用語への最初の言及は、オープン ソース プロジェクト Nutch of に遡ります。アパッチ組織。当時、ビッグ データは、Web 検索インデックスを更新するために同時にバッチ処理または分析する必要がある大規模なデータ セットを表すために使用されていました。 Google MapReduce と Google File System (GFS) のリリースにより、ビッグ データはもはや大量のデータを記述するためだけでなく、データの処理速度もカバーするようになりました。

1980 年にはすでに、有名な未来学者アルビン トフラーが著書『第三の波』の中でビッグ データを「第 3 の波のカデンツァ」として熱狂的に賞賛しました。

しかし、2009 年頃から、インターネット情報技術業界では「163 ビッグデータ」という言葉がよく使われるようになりました。米国インターネット データ センターは、インターネット上のデータは毎年 50%、2 年ごとに 2 倍ずつ増加し、現在、世界中のデータの 90% 以上が近年生成されたものであると指摘しています。また、データとは単に人々がインターネット上に公開する情報だけを指すのではなく、世界中の産業機器や自動車、電力メーターなどには無数のデジタルセンサーが設置されており、位置、動き、振動、温度、湿度などの情報を計測し、伝達しています。物質の変化によっても、大量のデータ情報が生成されます。

ビッグ データの概念構造:

ビッグ データは、現在の段階に至るまでのインターネットの発展の現れまたは特徴にすぎません。神話する必要はありません。クラウドコンピューティングに代表される技術革新を背景に、本来収集や利用が難しかったこれらのデータが容易に活用されるようになり、あらゆる分野での継続的な革新により、ビッグデータは徐々に多くのデータを生み出します。人間にとっての価値。

第二に、ビッグデータを体系的に認識したい場合は、それを包括的かつ慎重に分解する必要があります。3 つのレベルから始めます:

最初のレベルは理論であり、理論は認識です。それを知る唯一の方法であり、広く認識され普及しているベースラインでもあります。ビッグデータの特徴の定義からビッグデータ業界の全体像と特徴を理解し、ビッグデータの価値の議論からビッグデータの貴重性を深く分析し、ビッグデータの発展傾向を洞察します。ビッグデータのプライバシーという特別かつ重要な問題からスタートし、人間とデータの間の長期的なゲームをある観点から検証します。

第 2 レベルはテクノロジーです。テクノロジーはビッグデータの価値を具体化する手段であり、進歩の基礎です。クラウドコンピューティング、分散処理技術、ストレージ技術、認識技術のそれぞれの発展から、ビッグデータの収集、処理、保存、結果形成までの全プロセスを解説します。

3 番目のレベルは実践であり、実践はビッグ データの究極の価値の表現です。インターネットビッグデータ、政府ビッグデータ、企業ビッグデータ、個人ビッグデータの4つの側面から、ビッグデータが示した美しい光景と今後の実現の青写真を解説します。

ビッグ データの概念の特徴:

従来のデータ ウェアハウス アプリケーションと比較して、ビッグ データ分析には、大量のデータと複雑なクエリと分析という特徴があります。 「Journal of Computer Science」に掲載された記事「Architecting Big Data: Challenges, Current Status and Prospects」では、ビッグデータ分析プラットフォームに必要ないくつかの重要な機能を列挙し、現在の主流の実装プラットフォームである並列データベース、MapReduce、ハイブリッドを分析しています。両者をベースにアーキテクチャを分析・整理し、それぞれの長所と短所を指摘するとともに、各方向の研究状況と著者のビッグデータ解析への取り組みを紹介し、今後の研究を展望する。

ビッグ データの 4 つの「V」または特性には 4 つのレベルがあります。まず、データの量が膨大です。 TB レベルから PB レベルまで、第 2 に、データの種類が豊富です。上記のウェブログ、ビデオ、写真、地理的位置情報など。 3つ目は、処理速度が速く、1秒ルールによりさまざまなデータから価値の高い情報を素早く取得できる点で、これも従来のデータマイニング技術とは根本的に異なります。第 4 に、データが適切に活用され、正確かつ正確に分析されている限り、高い価値の利益がもたらされます。業界では、ボリューム、多様性、速度、価値の 4 つの「V」に要約されています。

ビッグデータは、ある意味、最先端のデータ分析テクノロジーです。つまり、さまざまなデータから価値のある情報を迅速に得ることができるのがビッグデータ技術です。これを理解することは非常に重要であり、それがこのテクノロジーの潜在力を非常に多くのビジネスにもたらす原動力となっています。

ビッグデータの概念の使用:

ビッグデータは、ビッグデータテクノロジー、ビッグデータエンジニアリング、ビッグデータサイエンス、ビッグデータアプリケーションなどの分野に分類できます。今、人々が最も話題にしているのは、ビッグデータ テクノロジーとビッグ データ アプリケーションです。工学と科学の問題はまだ真剣に受け止められていません。ビッグデータエンジニアリングは、ビッグデータの計画、構築、運用、管理の体系的なエンジニアリングを指します。ビッグデータサイエンスは、ビッグデータネットワークの開発と運用におけるビッグデータの法則と自然活動および社会活動との関係の発見と検証に焦点を当てます。 。

モノのインターネット、クラウド コンピューティング、モバイル インターネット、車両のインターネット、携帯電話、タブレット、PC、地球の隅々に広がるさまざまなセンサーはすべて、データ ソースまたは伝送手段です。

例としては、ウェブログ、RFID、センサー ネットワーク、ソーシャル ネットワーク、ソーシャル データ (社会のデータ革命のおかげ)、インターネットのテキストとファイル、インターネット検索インデックス、通話詳細の記録、天文学、大気科学、ゲノミクスなどがあります。 、生物地球化学、生物学、およびその他の複雑および/または学際的な科学研究、軍事偵察、医療記録、写真アーカイブ、ビデオアーカイブ、および大規模な電子商取引。

ビッグデータの役割

一般企業にとって、ビッグデータの役割は主にデータの分析と活用と二次加工開発の2つの側面に反映されます。プロジェクト。西進情報のビッグデータを分析することで、隠されたデータを掘り出すだけでなく、これらの隠されたメッセージを物理的な販売を通じて顧客ベースの向上に活用することもできます。データの二次展開については、ネットワークサービス事業などで活用されることが多く、その情報を集約・分析することで、お客様のニーズに合わせたパーソナライズされた企画を立案したり、新たな広告・マーケティング手法を創出したりすることができます。ビッグデータ分析を通じて製品とサービスを組み合わせるのは偶然ではなく、これを実現した人がデータ時代のリーダーとなることがよくあります。

要約すると、ビッグデータの応用は時代の進歩を示すだけでなく、人々がより深い探求を行うよう促すことにもなります。また、ビッグデータの研究には、上記の内容に加えて、ビッグデータの3つの特徴である大規模、高速、データの多様性を理解する必要があります。これら 3 つの側面を研究することにより、データの性質を観察することが容易になるだけでなく、ソフトウェア処理プラットフォームの効果的な動作にも役立ちます。

関連知識の詳細については、FAQ 列をご覧ください。

以上が『ビッグデータ時代』という本に出てくるビッグデータとは何を意味するのでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

PHPのビッグデータ構造処理スキル PHPのビッグデータ構造処理スキル May 08, 2024 am 10:24 AM

ビッグ データ構造の処理スキル: チャンキング: データ セットを分割してチャンクに処理し、メモリ消費を削減します。ジェネレーター: データ セット全体をロードせずにデータ項目を 1 つずつ生成します。無制限のデータ セットに適しています。ストリーミング: ファイルやクエリ結果を 1 行ずつ読み取ります。大きなファイルやリモート データに適しています。外部ストレージ: 非常に大規模なデータ セットの場合は、データをデータベースまたは NoSQL に保存します。

C++開発経験の共有:C++ビッグデータプログラミングの実践経験 C++開発経験の共有:C++ビッグデータプログラミングの実践経験 Nov 22, 2023 am 09:14 AM

インターネット時代においてビッグデータは新たなリソースとなり、ビッグデータ分析技術の継続的な向上に伴い、ビッグデータプログラミングの需要がますます高まっています。広く使用されているプログラミング言語として、ビッグ データ プログラミングにおける C++ の独自の利点がますます顕著になってきています。以下では、C++ ビッグ データ プログラミングにおける私の実践的な経験を共有します。 1. 適切なデータ構造の選択 適切なデータ構造を選択することは、効率的なビッグ データ プログラムを作成する上で重要です。 C++ には、配列、リンク リスト、ツリー、ハッシュ テーブルなど、使用できるさまざまなデータ構造があります。

2024 年の AEC/O 業界の 5 つの主要な開発トレンド 2024 年の AEC/O 業界の 5 つの主要な開発トレンド Apr 19, 2024 pm 02:50 PM

AEC/O(Architecture, Engineering & Construction/Operation)とは、建設業界における建築設計、工学設計、建設、運営を提供する総合的なサービスを指します。 2024 年、AEC/O 業界は技術の進歩の中で変化する課題に直面しています。今年は先進技術の統合が見込まれ、設計、建設、運用におけるパラダイムシフトが到来すると予想されています。これらの変化に対応して、業界は急速に変化する世界のニーズに適応するために、作業プロセスを再定義し、優先順位を調整し、コラボレーションを強化しています。 AEC/O 業界の次の 5 つの主要なトレンドが 2024 年の主要テーマとなり、より統合され、応答性が高く、持続可能な未来に向けて進むことが推奨されます: 統合サプライ チェーン、スマート製造

58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 58 ポートレート プラットフォームの構築におけるアルゴリズムの適用 May 09, 2024 am 09:01 AM

1. 58 Portraits プラットフォーム構築の背景 まず、58 Portraits プラットフォーム構築の背景についてお話ししたいと思います。 1. 従来のプロファイリング プラットフォームの従来の考え方ではもはや十分ではありません。ユーザー プロファイリング プラットフォームを構築するには、複数のビジネス分野からのデータを統合して、ユーザーの行動や関心を理解するためのデータ マイニングも必要です。最後に、ユーザー プロファイル データを効率的に保存、クエリ、共有し、プロファイル サービスを提供するためのデータ プラットフォーム機能も必要です。自社構築のビジネス プロファイリング プラットフォームとミドルオフィス プロファイリング プラットフォームの主な違いは、自社構築のプロファイリング プラットフォームは単一のビジネス ラインにサービスを提供し、オンデマンドでカスタマイズできることです。ミッドオフィス プラットフォームは複数のビジネス ラインにサービスを提供し、複雑な機能を備えていることです。モデリングを提供し、より一般的な機能を提供します。 2.58 中間プラットフォームのポートレート構築の背景のユーザーのポートレート 58

Go言語にビッグデータフレームワークがない理由と解決策についてのディスカッション Go言語にビッグデータフレームワークがない理由と解決策についてのディスカッション Mar 29, 2024 pm 12:24 PM

今日のビッグデータ時代において、データの処理と分析はさまざまな産業の発展を支える重要な役割を果たしています。 Go言語は、開発効率が高くパフォーマンスに優れたプログラミング言語として、ビッグデータ分野で徐々に注目を集めています。しかし、Go 言語は Java や Python などの他の言語と比較してビッグ データ フレームワークのサポートが比較的不十分であり、一部の開発者に問題を引き起こしていました。この記事では、Go 言語にビッグ データ フレームワークが存在しない主な理由を調査し、対応する解決策を提案し、具体的なコード例で説明します。 1.Go言語

AI、デジタルツイン、ビジュアライゼーション...2023 Yizhiwei 秋の製品発表会のハイライト! AI、デジタルツイン、ビジュアライゼーション...2023 Yizhiwei 秋の製品発表会のハイライト! Nov 14, 2023 pm 05:29 PM

Yizhiweiの2023年秋の新製品発表会は無事終了しました!カンファレンスのハイライトを一緒に振り返りましょう! 1. インテリジェントで包括的なオープン性がデジタルツインの生産性を高める Kangaroo Cloud の共同創設者で Yizhiwei の CEO である Ning Haiyuan 氏は開会の挨拶で次のように述べました: 「3 つのコア機能」「インテリジェントで包括的なオープン性」という 3 つのコアキーワードに焦点を当て、さらに「デジタルツインを生産力にする」という開発目標を提案しました。 2. EasyTwin: より使いやすい新しいデジタル ツイン エンジンを探索します。 1. 0.1 から 1.0 まで、デジタル ツイン フュージョン レンダリング エンジンを探索し続け、成熟した 3D 編集モード、便利なインタラクティブ ブループリント、大規模なモデル アセットを備えたより良いソリューションを実現します。

入門ガイド: Go 言語を使用したビッグデータの処理 入門ガイド: Go 言語を使用したビッグデータの処理 Feb 25, 2024 pm 09:51 PM

オープンソースのプログラミング言語として、Go 言語は近年徐々に注目を集め、使用されるようになりました。そのシンプルさ、効率性、強力な同時処理機能によりプログラマーに好まれています。ビッグ データ処理の分野でも、Go 言語は大きな可能性を秘めており、大量のデータを処理し、パフォーマンスを最適化し、さまざまなビッグ データ処理ツールやフレームワークとうまく統合できます。この記事では、Go 言語によるビッグデータ処理の基本的な概念とテクニックをいくつか紹介し、具体的なコード例を通して Go 言語の使用方法を示します。

C++ テクノロジーでのビッグ データ処理: インメモリ データベースを使用してビッグ データのパフォーマンスを最適化するには? C++ テクノロジーでのビッグ データ処理: インメモリ データベースを使用してビッグ データのパフォーマンスを最適化するには? May 31, 2024 pm 07:34 PM

ビッグ データ処理では、インメモリ データベース (Aerospike など) を使用すると、データがコンピュータ メモリに保存され、ディスク I/O ボトルネックが解消され、データ アクセス速度が大幅に向上するため、C++ アプリケーションのパフォーマンスが向上します。実際のケースでは、インメモリ データベースを使用した場合のクエリ速度が、ハードディスク データベースを使用した場合よりも数桁速いことが示されています。