朋友做了好几年的爬虫,期间写过各种稀奇古怪的爬虫,作为副业多多少少挣了二十几万,也总结了一些知识。

1、最典型的就是找爬虫外包活儿。

这个真是体力活,最早是在国外各个freelancer网站上找适合个人做的小项目,看见了就赶紧去bid一下,把价格标得死死的,由于是挣dollar,别人标几百刀,我就标几十刀,价格战。就是这样做些体力活,不过有个问题是我们跟老美时差是12小时,刚好是颠倒的,他们白天干活的时候,我们刚好是凌晨,所以在回复他们信息时就很延迟,另外又加上有阿三来竞争,那个bid价格惨目忍睹,做了半年多就放弃了。

国内有猪八戒,A5,程序员客栈等外包平台,如果是一个人的话,你只能接到一些小活做做。大活都是一个团队才能接下,甲方要的时间又紧,一个人做不下来。

2、爬数据做网站

那会儿开始接触运营,了解到一些做流量,做网盟挣钱的一些方法。挺佩服做运营的热,觉得鬼点子挺多的(褒义),总是会想到一些做流量的方法,但是他们就是需要靠技术去帮忙实现,去帮忙抓数据,那会我就在思考我懂做网站,抓数据都没问题,只要我能融汇运营技巧,就可以靠个人来挣钱钱了,于是就学习了一些SEO,和做社群的运营方法。开始抓数据,来做网站挣钱,每个月有小几千块钱,虽然挣得不多,但做成之后不需要怎么维护,也算是有被动收入了。

做网站挣网盟的好处是,只要网站有流量就有网盟收入,不需要你花时间去接广告这些。能做到每天数万IP的话,每年的网盟收入也能有数万,乃至数十万RMB。

这里抓数据做网站不是去做垃圾网站,也不是去非法抓取内容。我不建议去抓有内容版权的网站,这样你容易进去蹲几年。我说的是结构化数据,数据整合,把原本分散在各个地方无版权的数据抓取过来,抽取整合成完整的信息,提供给用户,这样对用户是增益。因为原本信息是分散在各处的,需要用户在不同渠道,不同网站上查看。典型的诸如企业工商信息,这些信息是公开的,没有版权。

Python、爬虫技术干货分享

3、做公众号/自媒体/独立博客

学Python,写爬虫的人越来越多,很多又是非计算机科班出身。所以把用Python写爬虫这一块的需求撑大了,但凡工作上的实践经验多一点,其实是有很多可以写的经验总结的。

不要认为一定要输出多么高深的内容,才能写公众号,做博客。其实写太技术了没有人看,刚才我也说了,大部分受众是非计算机科班的,他们需要的是你能较为简单易懂的说明白怎么上手,怎么入门,有一些小程序,演示示例来练手。所以写的内容要接地气,推广公号相对还是容易,几个公号主做下互推,做做送书活动,就有基础的关注量了。其它就取决于你写文章的勤奋程度和内容是否吸引人了。

如果你跟我一样看准了Python,想自学Python,我整理的一份Python的学习资料,你完全可以拿去用,会节约很多时间,也能解决很多在学习中遇到的难题。

① 2000多本Python电子书(主流和经典的书籍应该都有了)
② Python标准库资料(最全中文版)
③ 项目源码(四五十个有趣且经典的练手项目及源码)
④ Python基础入门、爬虫、web开发、大数据分析方面的视频(适合小白学习)
⑤ Python所有知识点汇总(可以弄清楚Python的所有方向和技术)

利用爬虫我们可以获取大量的价值数据,从而获得感性认识中不能得到的信息,比如:

知乎:爬取优质答案,为你筛选出各话题下最优质的内容。

淘宝、京东:抓取商品、评论及销量数据,对各种商品及用户的消费场景进行分析。

安居客、链家:抓取房产买卖及租售信息,分析房价变化趋势、做不同区域的房价分析。

拉勾网、智联:爬取各类职位信息,分析各行业人才需求情况及薪资水平。

爬虫是入门Python最好的方式,没有之一。Python有很多应用的方向,比如后台开发、web开发、科学计算等等,但爬虫对于初学者而言更友好,原理简单,几行代码就能实现基本的爬虫,学习的过程更加平滑,你能体会更大的成就感。

掌握基本的爬虫后,你再去学习Python数据分析、web开发甚至机器学习,都会更得心应手。因为这个过程中,Python基本语法、库的使用,以及如何查找文档你都非常熟悉了。


如果你依然在迷茫,可以加入我们的Python学习扣qun:893865338,看看前辈们是如何学习的。交流经验。从基础的python脚本到web开发、爬虫、django、数据挖掘等,零基础到项目实战的资料都有整理。送给每一位python的小伙伴!分享一些学习的方法和需要注意的小细节。也感谢每一位愿意读我文章的人,对于创作我也是一个刚入门的,也在不断学习中。创作是一件非常值得持续投入的事情,因为你们每一次的支持都是对我极大的肯定!

更多推荐

用Python爬虫做副业,大学生可以月入10000嘛?