JavaScript mapreduce工作原理简析_基础知识
谷歌在2003到2006年间连续发表了三篇非常有影响力的文章,分别是2003年在SOSP上发布的GFS,2004年在OSDI上发布的MapReduce,以及2006年在OSDI上发布的BigTable。GFS是文件系统相关的,其对后来的分布式文件系统设计具有指导意义;MapReduce是一种并行计算的编程模型,用于作业调度;BigTable是一个用于管理结构化数据的分布式存储系统,构建在GFS、Chubby、SSTable等Google技术之上。相当多的Google应用使用了这三种技术,比如Google Search、Google Earth和Google Analytics等等。因此这三种技术并称为谷歌技术”三宝”。今天,D瓜哥班门弄斧,对MapReduce来个”庖丁解牛”!
MapReduce简介
MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一
个Map函数处理一个基于key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然后
再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。
一图胜千言,下面我们用一张图来说明一下MapReduce:
编程实践
常言道:”实践出真知” 。是骡子是马,拉出来遛遛才知道。所以,如果真的想搞懂这个原理,还是亲自写代码实践一下才是硬道理。
最近和几个朋友一起学习JavaScript,所以就比较关注JavaScript。昨天上网瞎逛时,惊奇地发现,竟然有牛人使用JavaScript实现了MapReduce算法。然后转过来和大家分享,同时再加上我自己的一些狗尾续貂的介绍,希望有助于大家理解MapReduce。具体代码实现如下:
var Job = {
//待处理的数据
data : [
"We are glad to see you here. This site is dedicated to",
"poetry and to the people who make poetry possible",
"poets and their readers. FamousPoetsAndPoems.com is",
"a free poetry site. On our site you can find a large",
"collection of poems and quotes from over 631 poets",
"Read and Enjoy Poetry",
"I, too, sing America",
"I am the darker brother",
"They send me to eat in the kitchen",
"When company comes",
"But I laugh",
"And eat well",
"And grow strong",
"Tomorrow",
"Ill be at the table",
"When company comes",
"Nobodyll dare",
"Say to me",
"Eat in the kitchen",
"Then",
"Besides",
"Theyll see how beautiful I am",
"And be ashamed",
"I, too, am America"
],
//将数据中的每行字符串用空格分隔开,
//并"重组"成诸如{key: 单词, value: 1}格式的对象,返回对象数组
map : function(line) {
var splits = line.split(" ");
var temp = [];
for(var i=0; i
}
return temp;
},
//计算每个单词在"数据"(data)中出现的次数
reduce : function(allSteps) {
var result = {};
for(var i=0; i
result[step.key] = result[step.key] ? (result[step.key] + 1) : 1;
}
return result;
},
//初始化,同时是运行的入口。
init : function() {
var allSteps = [];
for(var i=0; i
allSteps = allSteps.concat(Job.map(Job.data[i]));
}
//美中不足,这里不能多线程调用Job.reduce函数??
var result = Job.reduce(allSteps)
console.log(JSON.stringify(result));
}
}; // Job
//开始执行
Job.init();
复制这些代码,直接粘贴到浏览器的控制台(Console)中,或者放到一个HTML文件中,用浏览器打开,就可以在控制台输出中,看到效果如下:
美中不足
这篇文章发布出来之后,就有网友“咆哮”:“一个连多线程都没有的js 搞什么MapReduce啊?”其实,这个问题,D瓜哥也发现了。在看到这个代码的解释后,D瓜哥就纳闷JavaScript不是单进程吗?怎么还能模拟MapReduce?在认真阅读代码,单步调试之后,更加印证了D瓜哥的看法。(关于D瓜哥的疑问已经在代码中注释出来。)
不过,再想一下,这些并不影响我们去理解MapReduce的原理。这只是个单进程,最基础的版本。先理解了这个,再去整个多线程的也许就更容易理解了。
未完待续
其实,D瓜哥现在考虑在这个例子的基础上,用Java实现一个多线程版本,那样模拟的MapReduce更逼真。等D瓜哥把一些问题思考清楚之后,就把代码发出来。敬请期待!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Solana Blockchain und SOL Token Solana ist eine Blockchain-Plattform, die sich auf die Bereitstellung hoher Leistung, Sicherheit und Skalierbarkeit für dezentrale Anwendungen (dApps) konzentriert. Als nativer Vermögenswert der Solana-Blockchain werden SOL-Token hauptsächlich zur Zahlung von Transaktionsgebühren, zur Verpfändung und zur Teilnahme an Governance-Entscheidungen verwendet. Die einzigartigen Merkmale von Solana sind die schnellen Transaktionsbestätigungszeiten und der hohe Durchsatz, was es zu einer bevorzugten Wahl bei Entwicklern und Benutzern macht. Durch SOL-Tokens können Nutzer an verschiedenen Aktivitäten des Solana-Ökosystems teilnehmen und gemeinsam die Entwicklung und den Fortschritt der Plattform vorantreiben. So funktioniert Solana Solana nutzt einen innovativen Konsensmechanismus namens Proof of History (PoH), der in der Lage ist, Tausende von Transaktionen effizient zu verarbeiten.

SpringDataJPA basiert auf der JPA-Architektur und interagiert mit der Datenbank über Mapping, ORM und Transaktionsmanagement. Sein Repository bietet CRUD-Operationen und abgeleitete Abfragen vereinfachen den Datenbankzugriff. Darüber hinaus nutzt es Lazy Loading, um Daten nur bei Bedarf abzurufen und so die Leistung zu verbessern.

VET Coin: Blockchain-basiertes IoT-Ökosystem VeChainThor (VET) ist eine auf Blockchain-Technologie basierende Plattform, die darauf abzielt, den Bereich Internet der Dinge (IoT) zu verbessern, indem sie die Glaubwürdigkeit von Daten gewährleistet und einen sicheren Transfer von Wertschöpfungsketten und Geschäftsprozessen ermöglicht . VET Coin ist der native Token der VeChainThor-Blockchain und hat die folgenden Funktionen: Transaktionsgebühren bezahlen: VET Coins werden zur Zahlung von Transaktionsgebühren im VeChainThor-Netzwerk verwendet, einschließlich Datenspeicherung, Ausführung intelligenter Verträge und Identitätsprüfung. Governance: VET-Token-Inhaber können an der Governance von VeChainThor teilnehmen, einschließlich der Abstimmung über Plattform-Upgrades und Vorschläge. Anreize: Berufsbildungsmünzen werden verwendet, um Prüfern im Netzwerk Anreize zu bieten, die sicherzustellen

ShibaInu Coin: Von Hunden inspirierte Kryptowährung ShibaInu Coin (SHIB) ist eine dezentrale Kryptowährung, die vom legendären Shiba Inu-Emoji inspiriert ist. Die Kryptowährung wurde im August 2020 eingeführt und soll eine Alternative zu Dogecoin im Ethereum-Netzwerk sein. Funktionsprinzip SHIB-Coin ist eine digitale Währung, die auf der Ethereum-Blockchain basiert und dem ERC-20-Token-Standard entspricht. Es nutzt einen dezentralen Konsensmechanismus, Proof of Stake (PoS), der es Inhabern ermöglicht, ihre SHIB-Tokens einzusetzen, um Transaktionen zu verifizieren und dafür Belohnungen zu verdienen. Hauptmerkmale Riesiges Angebot: Der anfängliche Bestand an SHIB-Münzen beträgt 1.000 Billionen Münzen und ist damit eine der größten im Umlauf befindlichen Kryptowährungen. Niedrige Preise

Polygon: Eine multifunktionale Blockchain, die das Ethereum-Ökosystem aufbaut. Polygon ist eine multifunktionale Blockchain-Plattform auf Basis von Ethereum, früher bekannt als MaticNetwork. Sein Ziel ist es, die Skalierbarkeits-, hohen Gebühren- und Komplexitätsprobleme im Ethereum-Netzwerk zu lösen. Polygon bietet Entwicklern und Benutzern durch die Bereitstellung von Skalierbarkeitslösungen ein schnelleres, günstigeres und einfacheres Blockchain-Erlebnis. So funktioniert Polygon: Sidechain-Netzwerk: Polygon erstellt ein Netzwerk aus mehreren Sidechains. Diese Sidechains laufen parallel zur Ethereum-Hauptkette und können große Transaktionsvolumina verarbeiten, wodurch der gesamte Netzwerkdurchsatz erhöht wird. Plasma-Framework: Polygon nutzt das Plasma-Framework, das

AR Coin: Digitale Währung basierend auf Augmented-Reality-Technologie AR Coin ist eine digitale Währung, die Augmented-Reality-Technologie nutzt, um Benutzern die Erfahrung der Interaktion mit digitalen Inhalten zu bieten und es ihnen zu ermöglichen, immersive Erlebnisse in der realen Welt zu schaffen. Wie es funktioniert AR Coin basiert auf den folgenden Schlüsselkonzepten: Augmented Reality (AR): AR-Technologie überlagert digitale Informationen mit der realen Welt und ermöglicht Benutzern die Interaktion mit virtuellen Objekten. Blockchain: Blockchain ist eine Distributed-Ledger-Technologie zur Aufzeichnung und Überprüfung von Transaktionen. Es bietet Sicherheit und Transparenz für AR-Münzen. Smart Contracts: Smart Contracts sind in der Blockchain gespeicherte Codes, die zur Automatisierung bestimmter Vorgänge verwendet werden. Sie spielen eine entscheidende Rolle bei der Erstellung und Verwaltung von AR-Münzen. Der Arbeitsablauf von AR-Münzen ist wie folgt: Erstellen Sie einen AR-Körper

Beam Coin: Datenschutzorientierte Kryptowährung Beam Coin ist eine datenschutzorientierte Kryptowährung, die für sichere und anonyme Transaktionen entwickelt wurde. Es nutzt das MimbleWimble-Protokoll, eine Blockchain-Technologie, die die Privatsphäre der Benutzer verbessert, indem sie Transaktionen zusammenführt und die Adressen von Absendern und Empfängern verbirgt. Das Designkonzept von Beam Coin besteht darin, Benutzern eine digitale Währungsoption bereitzustellen, die die Vertraulichkeit von Transaktionsinformationen gewährleistet. Durch die Übernahme dieses Protokolls können Benutzer Transaktionen mit größerem Vertrauen durchführen, ohne befürchten zu müssen, dass ihre persönlichen Daten verloren gehen. Durch diese Funktion zum Schutz der Privatsphäre verbessert das MimbleWimble-Protokoll die Privatsphäre durch: Zusammenführen von Transaktionen: Es kombiniert mehrere Transaktionen

Algorand: Eine Blockchain-Plattform, die auf dem rein byzantinischen Konsensprotokoll basiert. Algorand ist eine Blockchain-Plattform, die auf dem rein byzantinischen Konsensprotokoll basiert und darauf abzielt, effiziente, sichere und skalierbare Blockchain-Lösungen bereitzustellen. Die Plattform wurde 2017 von MIT-Professor Silvio Micali gegründet. Funktionsprinzip Der Kern von Algorand liegt in seinem einzigartigen rein byzantinischen Konsensprotokoll, dem Algorand-Konsens. Dieses Protokoll ermöglicht es Knoten, in einer vertrauenswürdigen Umgebung einen Konsens zu erzielen, selbst wenn sich bösartige Knoten im Netzwerk befinden. Der Algorand-Konsens erreicht dieses Ziel durch eine Reihe von Schritten. Schlüsselgenerierung: Jeder Knoten generiert ein Paar öffentlicher und privater Schlüssel. Vorschlagsphase: Ein zufällig ausgewählter Knoten schlägt eine neue Zone vor
