mongodb - spark集群中每个节点都有一个独立数据库，可以实现分布式统计计算吗？

Question

我将spark搭建在两台机器上，其中一台即是master又是slave，另一台是slave，两台机器上均装有独立的mongodb数据库。我的主程序让它们统计自身数据库的内容，然后将结果汇总到一台服务器上的数据库里。目前代码是...

PHP中文网 · Answer

自分で質問して答えてください。理由は次のとおりです:

リーリー

このコード行は、ドライバーがデータベースを読み取り、修飾されたデータを RDD にロードすることを意味します。以前の設定では 127.0.0.1 が入力として使用されるため、データはドライバーの mongodb から読み取られます。ドライバはマスター上にあるので、読み込まれるデータは当然マスター上のデータになります。