作者:量子位
链接:https://www.zhihu/question/23902574/answer/922634999
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
 

这里有一本长达81页的CV成长指南,能给萌新无微不至的关怀:

从装Python、装OpenCV、入门深度学习,到人脸识别、目标检测、语义分割等等各种应用,都有进阶路线,里面包含了教程、案例、注意事项。甚至怎样把算法部署到树莓派之类的硬件上,也能找到经验。

 

 

推特发出12小时,已经有1200人点了赞。作者名叫Adrian Rosebrock,是个经常出产教程的宝藏男子。

萌新的你,想要成长为一名合格的老司机,请马克这份指南。

然后,来看里面的内容到底有多丰富:

事无巨细

为了避免“从入门到放弃”的惨剧,在你成为老司机的路上,这份指南给每一步都做了安排。

从目录看,大致分为两部分,左边一列是基础,右边一列是应用:

 

 

先看左边的基础装备:

· 应该从哪开始呢
· 深度学习
· 人脸应用
· 图像文字识别 (OCR)
· 目标检测
· 目标追踪
· 实例分割和语义分割

第一章“应该从哪开始呢”,是OpenCV的进阶路线:

是安装Python和OpenCV (初) ,是理解命令行arguments (初) ,是用示例学OpenCV (初) ,是自己搭个OpenCV小项目 (初) ,是做更高级的OpenCV项目 (中) ,是在CV的大世界里,选择自己的小方向 (中) 。

每一步都有需要注意的事项,还有必要的教程资源。

比如,怎样安装OpenCV最简单,为什么不要用Windows,做项目的过程中有哪些常见错误类型要避免。

有些步骤,还会分成多个小步骤,每个小步又有作者的温馨建议。比如,这是第五步:

 

 

当这个章节的六步完成之后,还有一步叫“What to Next”,除了告诉大家下面应该做什么,也有一些额外的教程资源提供。

第二章“深度学习”,是算法的进阶路线,内容比第一章更丰盛,有12步:

是构建深度学习环境 (初) ,是训练自己的第一个网络 (初) ,是理解CNN (初) ,是搭个自己的图像数据集 (中) ,是在自己的数据集上训练一个CNN (中) ,是调整学习率 (中) ,是数据扩增 (中) ,是特征提取和微调预训练网络 (中) ,是视频分类 (高) ,是多输入和多输出网络 (高) ,十一是改进自己的网络 (高) ,十二是AutoML和AutoKeras。

依然,每一步都提供了详细的指引,有过往成功案例为你保驾。比如,这是第十二步:

 

 

第三章“人脸应用”开始,就是在各种具体任务当中用到的算法了。

检测人脸,检测关键点,识别人脸,提升算法的准确率……也把前两章的进阶路线,贯彻进了任务里。

在这一章,作者Adrian Rosebrock频繁出镜:

 

 

第四章-第七章,文字识别、目标检测、目标追踪、实例分割和语义分割,与第三章同理,此处便不详述。

作者继续高密度出镜:

 

接下来看右边一列,是帮你走进现实的:

· 嵌入的和物联网用的CV
· 树莓派上的CV
· 医学领域的CV
· 搞搞视频
· 图片搜索引擎
· 大神采访,案例研究 (与教程) ,成功故事

比如,怎样把自己的算法,放进树莓派里,放进冰箱里,放进脑子里,都有详尽的玩法。

作者依然在出镜:

 

 

除此之外,还有各种成功前辈的采访,里面有一些成功案例 (或附带教程) ,是初学者可以借鉴的经验:

 

 

除了技术上的建议,这些资料也可当做美味的鸡汤,鼓舞着你一路走向人参巅峰。

传送门

万事俱备,大家可以开始修炼了。

顺便回答一下这个问题:作者说的81页,这个数到底是怎么来的。

Start Here with Computer Vision, Deep Learning, and OpenCV - PyImageSearch​www.pyimagesearch

 

 

====================================

 

作者:MurphyWan
链接:https://www.zhihu/question/23902574/answer/269793453
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
 

自学了一段时间计算机视觉(Computer Vision),下文简称:CV。内容以基本概念为主,形式以看书为主,跟着敲代码为辅。

起因:因工作中会涉及到交通物流风险管理、出险理赔材料审查等内容,会涉及到大量人工介入审阅照片、视频的环节。而随着素材量的增加将来需要大量的人力来处理,导致成本高,效率低、易出错。
思考:能否通过某种技术进行照片、视频内容的审查,从而消化一定的工作量,同时提升效率?带着这样的问题,我们锁定了CV技术。

这里非常简单地谈谈自己近一年的学习体会,算是入门者说吧。

1、首先明确CV都会在哪些领域里使用,即用途是什么?

以下是笔者在今年1月中旬于硅谷参加AI世界前沿大会时拍摄的OpenCV作者Bradski大神的演讲ppt照片(能看得清内容)。

从上图可以看出,CV或者说OpenCV用途十分广泛。那么问题来了,你确认你要学的东西在未来的学习或者工作中可以派上用处吗?如果答案是Yes。就继续往下看。

 

2、CV是啥?

如果用一句话来解释CV,那么可能是研究让机器像人一样具有能够“看”的能力,并在必要的时候给予合适的反馈(输出:比如看图说话,看视频说话 )。

 

3、学什么?从哪里开始学?

从斯坦福大学李飞飞教授的CS231n课程中可以看到,需要有一些基础,以便更好的学习CV。截屏如下:

上图可以看到,需要我们具备一些知识:

1)编程基础:Python和C++。个人理解,用Python快速实现算法;用C++实战,实时性能强。
2)数学基础:高数,线性代数、基础概率与统计
3)机器学习基础

3-1)如果你对以上内容都有一定的基础,那么恭喜你,对于入门CV,你有了好的开始。

 

3-2)推荐几本比较好的书籍:

1、《计算机视觉:模型、学习和推理》

入门基础书籍,讲得很清楚。我在看,非常好的与机器学习结合的CV入门书籍。英文好的同学,建议看Prince的原本彩图书籍。 官网《英文原版彩图PDF版本》下载链接

2、《Learning OpenCV》

实战经典。推荐理由:OpenCV作者Bradski大神的书。学习CV的人是无法绕开OpenCV的。

3、《Python计算机视觉编程》

如果你有一定的Python基础,笔者强烈推荐看这本书,把CV的基本概念和算法结合代码实战,讲得比较清楚。入门佳作。它不是一上来就用OpenCV库,使得入门者容易忽视很多基础的概念算法。

4、《计算机视觉:算法与应用》

不建议入门者看。宝典型,大而全。典型的工具书。作者是Richard Szeliski,CV界大牛,图像拼接奠基人。

5、《 Multiple View Geometryin Computer Vision 》,中文版名《CV中的多视图几何》

据说是玩3D必看的一本书,包括AR/VR。很多CV专家都推荐。

 

3-3)视频学习,当然是斯坦福大学李飞飞教授的CS231N课程(需要扶梯),这是一门结合深度学习的CV教学视频。经典!

3-4)目前结合深度学习的CV是发展方向之一,有空可以看看花书。

 

4、OpenCV、TensorFlow、Caffe

这些个,咱们现在一个都绕不开。
多上手,多练吧。

 

5、国际顶尖的CV会议,扫扫论文的摘要、看看报告视频。(如果确定深度研究,就仔细看。否则,个人觉得了解下就好。)

 

于2017年12月3日凌晨 0:45

编辑于 2017-12-03

 

 

 

====================================

 

作者:读芯术
链接:https://www.zhihu/question/23902574/answer/799869508
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
 

到底学了哪些知识,计算机视觉才算是入门了?

敲重点,划黑板!

请将下面的网站的slides看完,辅助slides中提到的书的章节,应该可以入门了,1-2个月时间即可。

当然如果有相应的数学和图像基础,有机器学习,深度学习基础可以更容易理解哦~

 

以下课程,均为斯坦福计算机视觉实验室的。

实验室主页:http://vision.stanford.edu/

 

CS 131 Computer Vision: Foundations and Applications:

http://vision.stanford.edu/teaching/cs131_fall1415/schedule.html

 

CS231A Computer Vision: from 3D reconstruction to recognition:

http://cvgl.stanford.edu/teaching/cs231a_winter1415/schedule.html

 

CS231n: Convolutional Neural Networks for Visual Recognition

http://vision.stanford.edu/teaching/cs231n/

 

以上三门课就可以入门了,当然还有很多其他高等级的课,可以去实验室主页看看。

资料不宜贪多,谢绝其他资料干扰,安心的把这些lectures看完。然后就可以上手做项目和看论文了。论文才是王道。

更多推荐

计算机视觉应该怎样入门?