为什么 Dropbox 等大型服务使用 Python 作为主要语言,即使它的效率比其他编译型语言低几个数量级?
回复内容:
任何“XXX语言太慢”的观念都是以偏概全。应用程序分很多种,CPU bound, I/O bound, Memory bound, 等等。如果你的程序属于I/O bound,即使你把整个程序换成手工优化过的C,速度不会有本质提升。
对于Dropbox来说,其业务逻辑不复杂,性能瓶颈显然在I/O. 除了我估计判重时的 SHA 运算量比较大,但 CPython 的一大优势便是很容易使用 C 写模块,找到 hot spot 后再用 C 来写也不迟。"Premature optimization is the root of all evil."
既然如此,使用一种性能稍差但易读易写、生态系统完善、跨平台、迭代迅速的语言便是顺理成章的了。
更何况,Guido, Python 的作者,已经被 Dropbox 挖走了。
Python的确比compiled languages(编译型语言)慢几个数量级,但这只与受CPU限制的应用有关。
Dropbox主要受磁盘和网络约束。因此,使用编译型语言并不会明显加快Dropbox,因为大部分时间都花在读写数据而不是计算上。
解释型语言的优点在于开发速度,这也是为什么大多数网站都用解释型语言作开发。当这些缺点被边缘化时,程序员从这些优点上受益。
参考资料:
William Ting's answer to Python (programming language): How can some really large services (like Dropbox) afford to use Python as a primary language, if it's one to two orders of magnitude slower than other, compiled languages? 大型服务使用 Python 作为主要语言的,我知道比较有名的是 Dropbox,YouTube,Quora 和知乎。其实分析Dropbox和YouTube为啥使用 Python意义并不大,因为Dropbox的文件同步和 YouTube 的在线视频这种核心的功能,我相信都不是用 Python 来完成的。
反而分析 Quora 和知乎为什么采用 Python 作为主要语言,相对更加准确一些,Quora为什么使用Python,我引用Quora创始人Adam D'Angelo和Charlie Cheever在Quora上的现身说法,知乎为什么使用Python,还请知乎的大牛们现身说法一下。
Adam 在回答中提到,他当初从 Facebook 离职创办 Quora,首先就排除了 PHP,因为作为 Facebook 前 CTO 的他深知PHP 所带来的痛苦;他也考虑过C#,Java,甚至小众的Scala,OCaml 和Haskell,排除C#是不想受限于微软的协议栈,Java 需要的开发周期更长,同时找到熟手较难。最后选择 Python 的原因其实很简单:Adam和另一个创始人Charlie对于 Python 都比较熟悉!
从后面多年的使用情况来看,Adam非常庆幸当初自己的选择:所有的员工都很高兴使用 Python,不管以前的主要语言是什么;Tornado等框架的推出,让更新等实时服务有了好的去处;PyPy可能在不久的将来让 Python 性能有一次大的提升,在这个理想实现之前,Quora性能敏感的后端代码都是使用C++编写的。Charlie也补充说Django, Pylons等好的框架让他们获益颇多,Python 和 Javascript 的数据结构非常和谐,以及邮件服务,任务队列等优秀的第三方库。
引用出处:
Quora Infrastructure: Why did Quora choose Python for its development? 我记得有句话是这么说的:
一只木桶盛水的多少,并不取决于桶壁上最高的那块木块,而恰恰取决于桶壁上最短的那块
还有一句话是这么说的:
一条铁链的承重量是由它最脆弱的那一环决定的
对了,这里还有一个图,我觉得最恰当不过了:

结合上面大家的回答,题主应该明白了吧 现在大型系统很少用单纯一种语言写出来。。每种语言有每种语言的特色和适用环境。
企业会根据具体的使用环境(IO密集还是计算密集、开发效率等)来为不同的组件选择不同的语言。
对于那些对效率要求极高,但很少改动的地方用编译型语言。对开发效率要求极高,三天两头就要加入新功能的组件来说,上线所需的“时间成本”要比为了提升速度所需的“硬件投入”要值钱得多。
使用解释型语言的主要环境就是在“以(硬件占地)空间换(开发)时间”的一种经济的行为。。 对于这样逻辑相对简单,要求的是大并发量的网络运用,语言本身的性能影响并不显著,更多的瓶颈在于IO性能上,所以用什么语言区别并不是特别大,那么使用快速开发,快速迭代,快速部署的语言,比用C这样追求性能的语言,在开发效率和整体成本上更合适。 关键是IO速度慢 也就显不出python慢了 Dropbox这种客户端使用到的算法部分使用了C EXT,甚至其UI库wxwidget也是Python套的壳,速度瓶颈的地方都是C代码,所以还好。
至于服务器端,Dropbox的情况不太清楚,例如Quora已经全面转Cython以承受更大的负载,我想Dropbox服务器端也不可能纯Python来实现。 初期上线就是看谁更敏捷 曾经看过dropbox开发者的几篇博文。他们采用python的主要原因是可以比较简单的实现跨平台,而且开发速度快,进而实现快速上线的目的。 你可以用谷歌搜索一下dropbox的技术栈,会找到我说的博文的。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

Linux终端中查看Python版本时遇到权限问题的解决方法当你在Linux终端中尝试查看Python的版本时,输入python...

本文解释了如何使用美丽的汤库来解析html。 它详细介绍了常见方法,例如find(),find_all(),select()和get_text(),以用于数据提取,处理不同的HTML结构和错误以及替代方案(SEL)

Python的statistics模块提供强大的数据统计分析功能,帮助我们快速理解数据整体特征,例如生物统计学和商业分析等领域。无需逐个查看数据点,只需查看均值或方差等统计量,即可发现原始数据中可能被忽略的趋势和特征,并更轻松、有效地比较大型数据集。 本教程将介绍如何计算平均值和衡量数据集的离散程度。除非另有说明,本模块中的所有函数都支持使用mean()函数计算平均值,而非简单的求和平均。 也可使用浮点数。 import random import statistics from fracti

本文比较了Tensorflow和Pytorch的深度学习。 它详细介绍了所涉及的步骤:数据准备,模型构建,培训,评估和部署。 框架之间的关键差异,特别是关于计算刻度的

本文讨论了诸如Numpy,Pandas,Matplotlib,Scikit-Learn,Tensorflow,Tensorflow,Django,Blask和请求等流行的Python库,并详细介绍了它们在科学计算,数据分析,可视化,机器学习,网络开发和H中的用途

本文指导Python开发人员构建命令行界面(CLIS)。 它使用Typer,Click和ArgParse等库详细介绍,强调输入/输出处理,并促进用户友好的设计模式,以提高CLI可用性。

在使用Python的pandas库时,如何在两个结构不同的DataFrame之间进行整列复制是一个常见的问题。假设我们有两个Dat...

文章讨论了虚拟环境在Python中的作用,重点是管理项目依赖性并避免冲突。它详细介绍了他们在改善项目管理和减少依赖问题方面的创建,激活和利益。
