热门
最新
红包
立Flag
投票
同城
我的
发布
你问我答
CSDN App 扫码分享
评论
点赞
打赏
- 复制链接
- 举报
下一条:
# import requests# import re# from bs4 import BeautifulSoup# # 正则表达式可以模糊查询# kv = {'user-agent': 'Chrome/10'}# r = requests.get('https://mp.weixin.qq.com/s/Wi67iA3ZwY3o5X9ekRpD2w', timeout=30, headers=kv)# r.encoding = r.apparent_encoding# demo = r.text# soup = BeautifulSoup(demo, "html.parser") #html.parser解释器## # print(soup.prettify())# # print(soup.find_all(['a','b']))#<>find_all(name,attrs,recursive,string,**kwargs),name表示标签名;attrs:对标签属性值的检索字符串,可标注属性检索 recursive:是否对子孙全部检索,布尔值# # for link in soup.find_all('a'): <>...</>中字符串区域的检索字符串# # print(link.get('href'))## # for tag in soup.find_all(re.compile('b')):# 表示所有的都进行搜查# # print(tag.name)# print(soup.find_all(id='link1'))# 查找id为Link1,[]表示没有