在人工智能时代下,机器学习、深度学习、大数据分析与处理、云计算等新技术的提出极大地促进了Python语言的发展,2017年IEEE Spectrum 发布的编程语言交互式排行榜上,Python独占榜首。Python以面向对象、容易学习、跨平台以及由此产生的低维护成本,深受Python爱好者喜欢并获得好评。

正是基于此,教育部高等学校计算机类教学指导委员会计划举办本次Python课程高级研修班,这次培训班的内容既有Python课程的的深度介绍,也有以Python为工具进行比较前沿的数据分析、爬虫的开发。

一、课程目标

  • 掌握Python语言基础和编程方法,以及Python与其他语言的异同。
  • 以Web新闻页面的采集、内容提取、处理及分析为应用案例和主线,掌握互联网大数据处理的关键技术和整个处理流程,使得参加培训的教师具备互联网大数据处理技术的知识体系。
  • 学习掌握Web页面采集的爬虫技术架构及其Python实现方法,学习Web信息提取的技术原理,并掌握利用若干开源框架进行Web提取的方法。使参加培训的教师可以开设Web大数据采集的专业核心课程,并具备互联网大数据处理技术相关课程的实验设计能力。

二、课程内容及时间安排

2018113日(星期六)

08:30-09:10

开幕式

单元 1:Python语言基础与梳理

09:10-11:10

介绍Python语言变量、数据类型、列表、字典、元组、函数、类及文件操作

介绍开发环境、主要的编程方法

介绍C、Java等经典语言与Python语言的异同,梳理语言发展的一些特征规律

11:10-11:50

上机实践(基础编程)

单元 2:Web数据采集技术

14:00-16:30

介绍Web数据采集技术原理,包括基本架构、Web连接、URL处理、爬行策略、Robots协议、Cookie等技术

以新闻信息采集为例,介绍Web页面采集的Python实现方法

16:30-17:30

上机实践(采集新闻网站的科技类、财经类、体育类的HTML页面)

2018114日(星期日)

单元 3:Web信息提取技术

9:00-11:00

介绍Web信息提取技术原理,包括信息提取的目标、DOM树、基于树结构的提取技术、基于统计方法的方法

Python实现方法,包括若干个开源框架及使用方法、比较和选择

11:00-11:50

上机实践(对新闻页面进行内容提取,生成文本集)

单元 4:数据分析技术

14:00-16:30

介绍数据处理技术的原理,包括词汇切分、词性识别、停用词过滤、人名识别等

数据分析与实现:词频统计、主题建模、基于Tensorflow进行CNN新闻分类等

可视化:工具、Python实现

16:30-17:30

上机实践(对Web信息提取的文本集进行处理和分析)

会议结束

实操训练

本次培训设有四个现场实操辅导训练项目,以帮助参加培训的教师更好地掌握培训内容,提升实战技能,为后续课程开设做充分准备。

C站(CSDN)能力认证中心

更多推荐

上海市培训机构python