慕课网实战课-畅销3年的Python分布式爬虫课程-原版提取


正则表达示

贪婪匹配与非贪婪匹配个人理解:

贪婪匹配从左到右匹配,从最后一个满足条件的字符开始匹配

非贪婪匹配从左到右匹配,从第一个满足条件的字符开始匹配

贪婪匹配≈反向匹配??? 匹配line字段时规则也是从后往前匹配

非贪婪匹配≈正向匹配 从左边开始匹配,正向匹配

  1. \s 匹配空格,\S匹配非空格 只代表一个字符,通常用\S+
  2. \w 匹配[a-zA-Z0-9_] \W与之相反,异:小w不能匹配 空格 等字符
  3. \d 匹配数字
  4. [^] 取反的意思
  5. 匹配汉字

python新建虚拟环境

项目根目录新建main文件在pycharm中启动爬虫

第三方库手动下载地址

找官方文档,举一反三

xpath基础语法


文章作者: cunsha
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 cunsha !
  目录