这是我加入csdn的1005天,一年前疫情由于打游戏打腻了,开始自学python研究爬虫,这是我的第一个爬虫:
纪念那没人指导的开始,终是熬过来了。
import parselimport requestsurl = "http://www.xingchenxs.com/read/60131-155513834.html"req = requests.get(url)req.encoding = 'utf-8'print("响应码", req.status_code)# 获取文本内容html = req.textprint(html)sel = parsel.Selector(html)print(sel)title = sel.css('.title h1::text').extract_first()print(title)contents = sel.css('.content div::text').extract()contents2 = []for content in contents: contents2.append(content.strip())print(contents)print(contents2)print("\n".join(contents2))# 将内容写入文本with open(title + '.txt', mode='w', encoding='utf-8') as f: f.write("\n".join(contents2)) f.writable()

目前已经自学:
爬虫基础 js逆向 app爬虫 各种自动化工具
python基础算法 Django fastapi flask 常用抓包工具
前后端分离,js 前端 基于pandas的算法基础,
下一个小目标,auto.js和什么呢,学什么好呢,好纠结呀,唉,
有大佬推荐吗?
- 复制链接
- 举报
发个照片庆祝一下吧