正则在爬虫领域使用很广泛,用来把网页中有价值的文本提取出来。这个提取技术就是用正则匹配。
我感觉正则匹配就是类型匹配,当你能认识清楚字符里面所有包含的类型和结构,那么你写出正则也就不难了。如何认识清楚文本中会有什么类型,看如下链接
https://www.zhihu.com/question/48219401/answer/742444326
在这篇文章中,我建议你认识好 这些基本的:

  • 1.元字符
  • 2.限定符
  • 3.分组
  • 4.条件或

认识完这些基础类型之后,写正则还是有点难,
建议跟着如下链接,把里面的练习都做一下,我包你会有新的感悟
https://juejin.im/post/6844903648309297166
把练习都做完后,一些正常难度的(初、中级)的正则你都能写了。

高级或进阶,自行学习吧。
https://deerchao.cn/tutorials/regex/regex.htm#regexoptions


工具

拥有一个好的调试工具,会让你能方便快捷的调试你的正则语句,这种及时的反馈感很重要,特别是新手的你。

bbedit下载地址
https://apps.apple.com/cn/story/跟-bbedit-学正则表达式/id1485320067

使用截图:

内容来源于网络如有侵权请私信删除

文章来源: 博客园

原文链接: https://www.cnblogs.com/mysticbinary/p/13411176.html

你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!