[置顶] 如何在Mongodb集合中统计去重之后的数据-mysql チュートリアル-php.cn

ホームページ

データベース

mysql チュートリアル

[置顶] 如何在Mongodb集合中统计去重之后的数据

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 02:50 PM

mongodb 重複を削除するデータ統計上にピンで留める集める

比方说我们有个Mongodb集合，以这个简单的集合为例，我们需要集合中包含多少不同的手机号码，首先想到的应该就是使用distinct关键字， db.tokencaller.distinct('Caller').length 如果想查看具体的而不同的手机号码，那么可以省略后面的length属性，因为 db

比方说我们有个Mongodb集合，

以这个简单的集合为例，我们需要集合中包含多少不同的手机号码，首先想到的应该就是使用distinct关键字，
db.tokencaller.distinct('Caller').length
如果想查看具体的而不同的手机号码，那么可以省略后面的length属性，因为db.tokencaller.distinct('Caller')返回的是由所有去重手机号码组成的数组。

但是，这种方式对于所有情况都是满足的嘛？并不如此，如果要统计的集合记录数较大，如千万级别的，那么在这么统计的时候往往会报10044错误，提示信息“exception : distinct too big , 16mb cap”. 后面我们将通过其他方式进行解决。
另外一种方式可以使用runCommand结合distinct进行使用，
db.runCommand({"distinct":"tokencaller","key":"Caller"})

可见在values上显示了去重之后的手机号码，，看结果是一个Json格式的，于是尝试了下看看能不能取出values的大小，因为如果对于大数据量的集合来说，直接显示去重的号码明显不合适，于是尝试了下面的写法：

发现是可以的，于是对大数据量使用了这种方式看看是否能取出结果，发现不存在length属性，想了想应该跟mongodb的客户端版本有关系吧，还待验证！！！
两种方式都不行，于是试了下mapReduce方式，具体如下：

然后我们会发现，他会将查询出来的结果输出到一个称为“callerstatis”的结合，如下所示：

然后使用db.callerstatis.count()就可以知道有多少不同的手机号码了。
使用这种方式，我们同样在大数据量的集合上试了一下，可惜还是失败了！！！！（桑心T_T)，如果有谁有好的方法，麻烦也告诉我一下，小的感激不尽啊^_^

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7433

CakePHP チュートリアル

1359

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

Related knowledge

Nodejsとvuejsの違い Apr 21, 2024 am 04:17 AM

Node.js はサーバー側の JavaScript ランタイムであり、Vue.js は対話型ユーザーインターフェイスを作成するためのクライアント側の JavaScript フレームワークです。 Node.js はバックエンドサービス API 開発やデータ処理などのサーバー側開発に使用され、Vue.js はシングルページアプリケーションや応答性の高いユーザーインターフェイスなどのクライアント側開発に使用されます。

iPhoneのセルラーデータインターネット速度が遅い：修正 May 03, 2024 pm 09:01 PM

iPhone のモバイルデータ接続に遅延や遅い問題が発生していませんか?通常、携帯電話の携帯インターネットの強度は、地域、携帯ネットワークの種類、ローミングの種類などのいくつかの要因によって異なります。より高速で信頼性の高いセルラーインターネット接続を実現するためにできることがいくつかあります。解決策 1 – iPhone を強制的に再起動する場合によっては、デバイスを強制的に再起動すると、携帯電話接続を含む多くの機能がリセットされるだけです。ステップ 1 – 音量を上げるキーを 1 回押して放します。次に、音量小キーを押して、もう一度放します。ステップ 2 – プロセスの次の部分は、右側のボタンを押し続けることです。 iPhone の再起動が完了するまで待ちます。セルラーデータを有効にし、ネットワーク速度を確認します。もう一度確認してください修正 2 – データモードを変更する 5G はより優れたネットワーク速度を提供しますが、信号が弱い場合はより適切に機能します

超知性の生命力が覚醒する！しかし、自己更新 AI の登場により、母親はデータのボトルネックを心配する必要がなくなりました。 Apr 29, 2024 pm 06:55 PM

世界は狂ったように大きなモデルを構築していますが、インターネット上のデータだけではまったく不十分です。このトレーニングモデルは「ハンガーゲーム」のようであり、世界中の AI 研究者は、データを貪欲に食べる人たちにどのように餌を与えるかを心配しています。この問題は、マルチモーダルタスクで特に顕著です。何もできなかった当時、中国人民大学学部のスタートアップチームは、独自の新しいモデルを使用して、中国で初めて「モデル生成データフィード自体」を実現しました。さらに、これは理解側と生成側の 2 つの側面からのアプローチであり、両方の側で高品質のマルチモーダルな新しいデータを生成し、モデル自体にデータのフィードバックを提供できます。モデルとは何ですか? Awaker 1.0 は、中関村フォーラムに登場したばかりの大型マルチモーダルモデルです。チームは誰ですか?ソフォンエンジン。人民大学ヒルハウス人工知能大学院の博士課程学生、ガオ・イージャオ氏によって設立されました。

アメリカ空軍が初のAI戦闘機を公開し注目を集める！大臣はプロセス全体を通じて干渉することなく個人的にテストを実施し、10万行のコードが21回にわたってテストされました。 May 07, 2024 pm 05:00 PM

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機（VISTA）で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランクケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

テスラのロボットは工場で働く、マスク氏：手の自由度は今年22に達する！ May 06, 2024 pm 04:13 PM

テスラのロボット「オプティマス」の最新映像が公開され、すでに工場内で稼働可能となっている。通常の速度では、バッテリー（テスラの4680バッテリー）を次のように分類します：公式は、20倍の速度でどのように見えるかも公開しました - 小さな「ワークステーション」上で、ピッキング、ピッキング、ピッキング：今回は、それがリリースされたハイライトの1つビデオの内容は、オプティマスが工場内でこの作業を完全に自律的に行い、プロセス全体を通じて人間の介入なしに完了するというものです。そして、オプティマスの観点から見ると、自動エラー修正に重点を置いて、曲がったバッテリーを拾い上げたり配置したりすることもできます。オプティマスのハンドについては、NVIDIA の科学者ジムファン氏が高く評価しました。オプティマスのハンドは、世界の 5 本指ロボットの 1 つです。最も器用。その手は触覚だけではありません

Llama 70B を実行するシングルカードはデュアルカードより高速、Microsoft は FP6 を A100 オープンソースに強制導入 Apr 29, 2024 pm 04:55 PM

FP8 以下の浮動小数点数値化精度は、もはや H100 の「特許」ではありません。 Lao Huang は誰もが INT8/INT4 を使用できるようにしたいと考え、Microsoft DeepSpeed チームは NVIDIA からの公式サポートなしで A100 上で FP6 の実行を開始しました。テスト結果は、A100 での新しい方式 TC-FPx の FP6 量子化が INT4 に近いか、場合によってはそれよりも高速であり、後者よりも精度が高いことを示しています。これに加えて、エンドツーエンドの大規模モデルのサポートもあり、オープンソース化され、DeepSpeed などの深層学習推論フレームワークに統合されています。この結果は、大規模モデルの高速化にも即座に影響します。このフレームワークでは、シングルカードを使用して Llama を実行すると、スループットはデュアルカードのスループットの 2.65 倍になります。 1つ

2024年のQSランキングを公開！コンピューターサイエンスのMITがリストを独占、清華大学が11位、北京大学が15位

2024QS 分野別世界大学ランキングはこちら！全体としては、2023 年からの変化はほとんどありません。公式ウェブサイトの情報によると、2024QS 主題別世界大学ランキングは 55 の下位部門と 5 つの主要学術分野をカバーしています。合計 1,559 の大学がランキングに参加し、そのうち 64 大学が今年の新人大学です (つまり、2023 年のランキングには登場しません)。この 64 大学のうち、本当に初めて登場する大学が 14 校あります。その中には中国科学院大学も含まれます。洗練された科目によると、音楽は今年度から新設された科目です。さらに、データサイエンスと人工知能のランキングも拡大され、新たに 51 の大学がランキングに追加されました。全体リストの上位 5 位は、マサチューセッツ工科大学、ケンブリッジ大学、オックスフォード大学、ハーバード大学です。

Open-Sora の包括的なオープンソースアップグレード: 16 秒のビデオ生成と 720p 解像度をサポート Apr 25, 2024 pm 02:55 PM

Open-Sora は、オープンソースコミュニティで密かに更新され、最大 720p の解像度で最大 16 秒のビデオ生成をサポートし、テキストから画像へ、テキストからビデオへ、画像からビデオへの変換を処理できます。あらゆるアスペクト比のビデオ間の処理や、無限に長いビデオの生成ニーズにも対応します。試してみましょう。横画面のクリスマス雪景色を生成し、B サイトに投稿してから縦画面を生成し、Douyin を使用して 16 秒のビデオを生成します。これで、誰もが脚本に夢中になる生活を送ることができます。ガイダンス GitHub: https://github.com/hpcaitech/Open-Sora さらにすごいのは、Open-Sora は、最新のモデルアーキテクチャ、最新のモデルの重み、マルチタイム/解像度/長期を含め、依然としてすべてオープンソースであるということです。

See all articles