刚学完python,正好以后打算从事机器学习,数据挖掘方面的学习!请教大家有没有用python做这方面的例子和资源啊?想熟悉一下!练练手!
回复内容:
可以下载机器学习包scikit-learn: machine learning in Python
。包括了大部分机器学习的算法及例子。
Kaggle Competition Past Solutions
--补充via评论区@None--
Solutions from past competitions
这个网站收集了Kaggle很多比赛的很多代码(包括很多Rank非常高的solution),其中有很多都是Python写的----这大概是最好的Python做机器学习/数据挖掘实战的例子了吧。
学会使用library可能还不够,数据清洗、Feature Engineering等一样非常重要。看看实战吧~
P.S. 这个站点“last update at 2014/06/27”...有点久远,不过也够了吧...
如果想实现复杂的算法,核心部分还是需要用c++/c这种语言来写, python适合写跟application直接打交道的那一层。
Kaggle Blogs
@顾默林提到的sklearn是真的利器,而且它的doc很完整,可以当做一份的机器学习大纲看了,其他的了解过的还有 pyML
,PyBrain
,matlab,opencv也有python的接口吧。
sklearn,一直在更新,常用的算法基本上比较全
pyML,两年没更新了,有一些sklearn中没有的算法
MDP,有少量算法可用
orange,做data mining的
sage,matlab替代品,win下使用虚拟机在linux中运行.没怎么用过
最主要的,学好numpy,和matplotlib,这两个是基础!!!
看书从《机器学习实战》开始,然后差不多可以入门英文的了
《机器学习实战》
可以看集体智慧编程,网上有pdf