初学python和机器学习,想知道怎样才能达到自己独立编写程序的能力?
我正在学习python。以前大学学过一点C.但是只能应付考试的水平。现在从事零售业,但是确实太热爱计算机和编程。买了一本python学习手册和一本python核心编程在看。但是把字符串,字典,列表看完以后感觉很困惑。因为虽然上面的习题都能做,但是不知道怎样用这些来构建一个程序很多代码和函数定义都一知半解,即使明白算法的运作原理但是却无法独立不看书写出属于自己的代码。只能单纯照着书上的代码写。我想知道怎样才能将这些知识转变成能够自己写出属于自己的代码的能力。我想以后从事机器学习或者数据挖掘的工作。
回复内容:
先把Python练好,第一遍过完教程之后,可以从生活中拿一些小需求来练手,找一些别人的代码看看,尝试重写一遍。知乎上相关的问题可以关注一下:Python 有哪些一千行左右的经典练手项目? - 编程
你是如何自学 Python 的? - 调查类问题
Python 的练手项目有哪些值得推荐? - 编程
在学Python期间,可以看看机器学习或数据挖掘的书,比如:
在数据分析、挖掘方面,有哪些好书值得推荐? - 书籍推荐
如何系统地学习数据挖掘? - 数据挖掘
然后慢慢试着实现一些算法,参加阿里的天池比赛或kaggle练练手,就算入门了吧,再想办法找个相关的工作,慢慢的就能进入大道了 有部分从事机器学习,科学计算的研究生,编程不大会,直接上python 第三方库,硬写代码,会碰到很多困难,建议补补基础知识。
自己能不能写代码解决问题,是衡量有没有学会编程的方法。
建议不能只学语法,需要学习计算思维,编程思路,解决问题的方法。
请看黄哥本人写的文章
如何捅破python编程的那层纸
article/pythonstudy.md at master · pythonpeixun/article · GitHub
剪刀石头布小习题三种语言python2、php、go代码
article/jdstb.md at master · pythonpeixun/article · GitHub
一段小代码说明@property装饰器的用法
一段小代码说明@property装饰器的用法
如何捅破python编程的那层纸之二
如何捅破python编程的那层纸之二
如何捅破python编程的那层纸之三
如何捅破python编程的那层纸之三
黄哥python远程视频培训班
article/index.md at master · pythonpeixun/article · GitHub
黄哥python培训试看视频播放地址
article/python_shiping.md at master · pythonpeixun/article · GitHub 推荐给你一本书《集体智慧编程》。
里面所有的例子都是用python写的,由浅入深,不要看一遍就过,把所有的代码敲一遍,你会从中学到很多东西。
相对于python,这本书给我的感觉更像是你需要的那种思想,利用编程解决问题的那种思想。
最后说一句,在你成长的过程中或许会受到质疑,不要去理会,做自己想做的事,你的成功就是消灭质疑最有力的武器。
加油 不是打击你自信心
在中国,想做机器学习这一行的,基本都要研究生
而且你都工作了,只能社招,阿里大数据竞赛可能你就参加不了
面试时候,面试官问你个快速排序,二叉树什么的,估计你就写不出来
面试官再问你,操作系统啊,计算机网络啊,海量数据啊等等知识,你觉得你该怎么应对呢
既然是机器学习,起码面试时候会来几个推导一下机器学习数学过程吧,然后再扯一点统计学概率论什么的,再问几个C++或者Java知识也不为过吧,然后再聊聊现在很热的Hadoop/Spark/Storm等等
如果你想去小公司做数据挖掘机器学习当我没说(但是小公司去做机器学习基本直接从大公司挖人过来的),想去中等或者大公司的话,我觉得除非你在KDD或者Kaggle上做出很好的成绩了,否则,还是准备考研把,或者就平时想想就算了吧(毕竟全中国在做和数据挖掘相关岗位的人也不多,岗位需求也不大)
最后建议,真的很喜欢Python和机器学习的话,去做个数据运营挺不错的 用python写一写机器学习实战里面的代码,了解一些简单的聚类分类算法原理,能写kmeans,朴素贝叶斯啥的就行了,因为这些都有第三方库,如果不做数据量太大的话直接用sklearn这个库,特别方便。如果数据量大的话要分布式的话我只用mapreduce写过不分布式也有很多现成的库,所以机器学习算法这方面主要是要懂原理,知道每个算法怎么去应用。
分类的算法那么多,遇到具体数据集应该用那种就需要理解每种算法的原理和联系,比如遇到非正态分布的数据分类时用LDA不可以,遇到离散数据分类时可能用决策树,这些都不是绝对的,哪个好用哪个。机器学习算法那么多,想了解所有的太困难,每个大类了解一些基础的baseline,用到哪块再具体研究。比如推荐系统这方面,基础的算了解之后,做比赛发现仍然不能出好的效果,因为数据预处理是很重要的,无论在比赛还是在项目中,而数据预处理就要用到很多很多机器学习算法。
至于工作里面,不是很了解,但是经过实习3个月了解到的就是,机器学习用的不多,多的是找规则,筛选数据,无穷无尽。。。 你的水平连Python的门都没入,建议不要想着写程序,机器学习,先把Py语法弄懂,一些OOP语言的特性熟练以后再去做打算。 你刚把列表字典看完,路还远着呢,可以看看慕课网教程,每个知识点都有习题 感觉好像是没有任何基础,都不知道该从哪里说起了。
你可以用sklearn,先在小规模数据上应用机器学习算法试试。
或者你可以看看《机器学习实战》和《集体编程智慧》 重在练习,可以上checkio做题,挺适合初学者的,难度适中,完成一道题后,看看别人的答案,还是挺有收获的。

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

2小时内可以学会Python的基本编程概念和技能。1.学习变量和数据类型,2.掌握控制流(条件语句和循环),3.理解函数的定义和使用,4.通过简单示例和代码片段快速上手Python编程。

要从 Redis 读取队列,需要获取队列名称、使用 LPOP 命令读取元素,并处理空队列。具体步骤如下:获取队列名称:以 "queue:" 前缀命名,如 "queue:my-queue"。使用 LPOP 命令:从队列头部弹出元素并返回其值,如 LPOP queue:my-queue。处理空队列:如果队列为空,LPOP 返回 nil,可先检查队列是否存在再读取元素。

启动 Redis 服务器的步骤包括:根据操作系统安装 Redis。通过 redis-server(Linux/macOS)或 redis-server.exe(Windows)启动 Redis 服务。使用 redis-cli ping(Linux/macOS)或 redis-cli.exe ping(Windows)命令检查服务状态。使用 Redis 客户端,如 redis-cli、Python 或 Node.js,访问服务器。

Redis 内存大小设置需要考虑以下因素:数据量及增长趋势:估算存储数据的大小和增长率。数据类型:不同类型(如列表、哈希)占用内存不同。缓存策略:全缓存、部分缓存和淘汰策略会影响内存使用。业务峰值:预留足够内存应对流量高峰。

Python适合数据科学、Web开发和自动化任务,而C 适用于系统编程、游戏开发和嵌入式系统。 Python以简洁和强大的生态系统着称,C 则以高性能和底层控制能力闻名。

**Redis内存配置的核心参数是 maxmemory,它限制 Redis 可使用内存量。当超过此限制时,Redis 根据 maxmemory-policy 执行淘汰策略,有:noeviction(直接拒绝写入)、allkeys-lru/volatile-lru(按LRU淘汰)、allkeys-random/volatile-random(随机淘汰)、volatile-ttl(按过期时间淘汰)。其他相关参数包括 maxmemory-samples(LRU采样数量)、rdb-compression

Redis持久化会额外占用内存,RDB在生成快照时临时增加内存占用,AOF在追加日志时持续占用内存。影响因素包括数据量、持久化策略和Redis配置。要减轻影响,可合理配置RDB快照策略、优化AOF配置、升级硬件和监控内存使用情况。此外,在性能和数据安全之间寻求平衡至关重要。

要从 Redis 中读取数据,可按以下步骤执行:1. 连接到 Redis 服务器;2. 使用 get(key) 获取键的值;3. 若需字符串值,解码二进制值;4. 使用 exists(key) 检查键是否存在;5. 使用 mget(keys) 获取多个值;6. 使用 type(key) 获取数据类型;7. Redis 还有其他读取命令,例如:获取匹配模式的所有键、使用游标迭代键和对键的值进行排序。
