Python爬虫：处理html实体编码

编程开发更新时间:2023-04-30 03:53:16

Python处理HTML实体编码

python2

import HTMLParser  

char = r"&#12345;"  
http_parser = HTMLParser.HTMLParser();  
uChar = http_parser.unescape(char);

python3

from html import unescape

s = u'position.php?&amp;start=10#a" id="next">下一页</a>'

print(s)

print(unescape(s))

"""
position.php?&amp;start=10#a" id="next">下一页</a>
position.php?&start=10#a" id="next">下一页</a> 
"""

参考： Python处理HTML实体编码

更多推荐

Python爬虫：处理html实体编码

本文发布于:2023-04-30 02:42:00，感谢您对本站的认可！

本文链接:https://www.52dianzi.com/category/article/da9ff1e5bf46e7a9a911a114189b82fe.html

爬虫实体 Python html

上一篇：用户资料填写html,css,怎么保存网页中用户填写的内容？_html/css_WEB-ITnose
下一篇：返回列表

发布评论取消回复

评论列表（有 0 条评论）

Python爬虫：处理html实体编码

python2

python3

发布评论取消回复

最近发表

热门文章

标签列表

Python爬虫：处理html实体编码

python2

python3

相关文章

发布评论取消回复

最近发表

热门文章

标签列表