在考虑学java还是python之前先来说说二者的应用领域。
Python的主要应用方向:
1、科学计算
随着NumPy,SciPy,Matplotlib,Enthoughtlibrarys等众多程序库的开发,Python越来越适合于做科学计算、绘制高质量的2D和3D图像。和科学计算领域最流行的商业软件Matlab相比,Python是一门通用的程序设计语言,比Matlab所采用的脚本语言的应用范围更广泛,有更多的程序库的支持。虽然Matlab中的许多高级功能和toolbox目前还是无法替代的,不过在日常的科研开发之中仍然有很多的工作是可以用Python代劳的。
2、网络爬虫
也称网络蜘蛛,是大数据行业获取数据的核心工具。没有网络爬虫自动地、不分昼夜地、高智能地在互联网上爬取免费的数据,那些大数据相关的公司恐怕要少四分之三。能够编写网络爬虫的编程语言有不少,但Python绝对是其中的主流之一,其Scripy爬虫框架应用非常广泛。
3、数据分析
在大量数据的基础上,结合科学计算、机器学习等技术,对数据进行清洗、去重、规格化和针对性的分析是大数据行业的基石。Python是数据分析的主流语言之一。
4、人工智能
Python在人工智能大范畴领域内的机器学习、神经网络、深度学习等方面都是主流的编程语言,得到广泛的支持和应用。
java的主要应用方向:
1、企业级应用
这是目前Java应用最广泛的一个领域,几乎一枝独秀。包括各种行业应用,企业信息化,也包括电子政务等,领域涉及:办公自动化OA,客户关系管理CRM,人力资源HR,企业资源计划ERP、知识管理KM、供应链管理SCM、企业设备管理系统EAM、产品生命周期管理PLM、面向服务体系架构SOA、商业智能BI、项目管理PM、营销管理、流程管理WorkFlow、财务管理……等等几乎所有你能想到的应用。
2、嵌入式设备及消费类电子产品
包括无线手持设备、智能卡、通信终端、医疗设备、信息家电(如数字电视、机顶盒、电冰箱)、汽车电子设备等都是近年以来热门的Java应用领域,尤其是手机上的Java应用程序和Java游戏,更是普及。
接下来简单对比一下python和java:
静态语言和动态语言:
静态语言:
java, c, c++, go等
强类型语言(静态类型语言)是指需要进行变量/对象类型声明的语言,一般情况下需要编译执行。强类型语言是一旦变量的类型被确定,就不能转化的语言。
动态语言:
python, javascript, php, ruby等
弱类型语言(动态类型语言)是指不需要进行变量/对象类型声明的语言,一般情况下不需要编译(但也有编译型的)。动态类型语言是在运行时确定数据类型的语言。变量使用之前不需要类型声明,通常变量的类型是被赋值的那个值的类型。
弱类型语言则反之,一个变量的类型是由其应用上下文确定的。
静态语言优势:
由于类型的强制声明,使得IDE有很强的代码感知能力,故,在实现复杂的业务逻辑、开发大型商业系统、以及那些生命周期很长的应用中,依托IDE对系统的开发很有保障;
由于静态语言相对比较封闭,使得第三方开发包对代码的侵害性可以降到最低;
动态语言优势:
在静态语言中的一些高级概念,如java中的反射以及基于反射实现的AOP, 这些概念对java初学者以及只有一两年工作经验的人来说,这几个概念是很难理解的,更不用说如何去自己实现。如果大家使用过AOP的话就会明白这几个概念从理解到熟练使用是比较难的, 而且开发效率会比较低,尽管同学可能会说“其实使用起来还是很简单啊”, 那可能是因为你没有用过动态语言中的装饰器。
动态语言中对于java中的AOP这种概念直接使用装饰器就可以完成而且是python语言本身的一部分。并不像java中还需要引入第三方来完成。
python能轻松完成这些正是由于python是一门动态语言, 动态语言的特性使得大家去自己控制整个类的初始化以及动态去改变对象变的异常简单, 这些特性使得动态语言的灵活性远远超过静态语言。
解释型语言和编译型语言
这里的解释执行是相对于编译执行而言的。我们都知道,使用C/C++之类的编译性语言编写的程序,是需要从源文件转换成计算机使用的机器语言,经过链接器链接之后形成了二进制的可执行文件。运行该程序的时候,就可以把二进制程序从硬盘载入到内存中并运行。
python的执行过程和Java是类似的:
python解释器将源代码转换为字节码,然后再由python解释器来执行这些字节码。
一个具体的python程序执行过程:
- 执行python程序后,将会启动 Python 的解释器,然后将python程序编译成一个字节码对象 PyCodeObject。
- 在运行期间,编译结果也就是 PyCodeObject 对象,只会存在于内存中,而当这个模块的 Python 代码执行完后,就会将编译结果保存到了 pyc 文件中,这样下次就不用编译,直接加载到内存中。pyc 文件只是 PyCodeObject 对象在硬盘上的表现形式。
- 这个 PyCodeObject 对象包含了 Python 源代码中的字符串,常量值,以及通过语法解析后编译生成的字节码指令。PyCodeObject 对象还会存储这些字节码指令与原始代码行号的对应关系,这样当出现异常时,就能指明位于哪一行的代码。
Java也是先编译成字节码,再去执行
解释器,java很特殊,java是需要编译的,但是没有直接编译成机器语言,而是编译成字节码,然后在Java虚拟机上用解释的方式执行字节码。Python也使用了类似的方式,先将python编译成python字节码,然后由一个专门的python字节码解释器负责解释执行字节码。
Python中的GIL
GIL的全称是Global Interpreter Lock(全局解释器锁)来源是python设计之初的考虑,为了数据安全所做的决定。
在Python多线程下,每个线程的执行方式:
1、获取GIL
2、执行代码直到sleep或者是python虚拟机将其挂起。
3、释放GIL
可见,某个线程想要执行,必须先拿到GIL,我们可以把GIL看作是“通行证”,并且在一个python进程中,GIL只有一个。拿不到通行证的线程,就不允许进入CPU执行。
而每次释放GIL锁,线程进行锁竞争、切换线程,会消耗资源。并且由于GIL锁存在,python里一个进程永远只能同时执行一个线程(拿到GIL的线程才能执行),这就是为什么在多核CPU上,python的多线程效率并不高。
每个进程有各自独立的GIL,互不干扰,这样就可以真正意义上的并行执行,所以在python中,多进程的执行效率优于多线程(仅仅针对多核CPU而言)。
由于 GIL 的存在,Python 的多线程性能十分低下,无法发挥多核 CPU 的优势,性能甚至不如单线程。因此如果你想用到多核 CPU,一个建议是使用多进程或者协程。
Python垃圾回收
在讲到垃圾回收的时候,通常会使用引用计数的模型,这是一种最直观,最简单的垃圾收集技术。Python 同样也使用了引用计数,但是引用计数存在这些缺点:
1、频繁更新引用计数会降低运行效率
2、引用计数无法解决循环引用问题
Python 在引用计数机制的基础上,使用了主流垃圾收集技术中的标记——清除和分代收集两种技术。
以上内容仅供参考!
推荐Python视频教程:python视频教程
推荐Java视频教程:JAVA视频教程
以上是已学php再学java还是python?的详细内容。更多信息请关注PHP中文网其他相关文章!