参考资料:Python网络爬虫与信息提取(北京理工大学慕课)


正则表达式

regular expression
regex
RE

正则表达式是用来简洁表达一组字符串的表达式

正则表达式的优势:简洁。


下面给出一些正则表达式的例子:


正则表达式的作用:

  • 通用的字符串表达框架
  • 简洁表达一组字符串的表达式
  • 针对字符串表达“简洁”和“特征”思想的工具
  • 判断某字符串的特征归属

正则表达式在文本处理中十分常用:

  • 表达文本类型的特征(病毒、入侵等)
  • 同时查找或替换一组字符串
  • 匹配字符串的全部或部分

正则表达式主要应用在字符串匹配中。


正则表达式的使用:

  • 编译:将符合正则表达式语法的字符串转换成正则表达式特征。

我们也可以认为,编译后的特征与一组字符串是对应的,而编译之前的正则表达式只是一个符合正则表达式语法的单一字符串,但并不是真正意义上的正则表达式

更多推荐

【正则表达式】{0} ——正则表达式的概念