正则表达示
贪婪匹配与非贪婪匹配个人理解:
贪婪匹配从左到右匹配,从最后一个满足条件的字符开始匹配
非贪婪匹配从左到右匹配,从第一个满足条件的字符开始匹配
贪婪匹配≈反向匹配??? 匹配line字段时规则也是从后往前匹配

非贪婪匹配≈正向匹配 从左边开始匹配,正向匹配


- \s 匹配空格,\S匹配非空格 只代表一个字符,通常用\S+
- \w 匹配[a-zA-Z0-9_] \W与之相反,异:小w不能匹配 空格 等字符
- \d 匹配数字
- [^] 取反的意思
- 匹配汉字
python新建虚拟环境





项目根目录新建main文件在pycharm中启动爬虫




第三方库手动下载地址


找官方文档,举一反三

