ユーザー ログ データの大規模なバッチを統計的にフィルタリングする方法
たとえば、100 万人のユーザー
テーブルは次のようにデザインされました:
表aは100Wユーザーの基本情報です(uidは一意です)
uid、名前、地域、サービスプロバイダー....
表 b 各ユーザーは約 100 個のデータ、つまり 100W*100=1 億個のデータを持っています。各データ内容は(ユーザーID、開店時間、閉店時間)
uid,time1,time2
uid,time1,time2
...
要件: 24 時間のユーザー数をカウントし、特定の地域および特定のサービス プロバイダーに従って 24 時間のユーザー数をカウントできること。例を挙げると、どういう意味ですか。