常用正则表达式 - 起点终站

我们应该感谢相遇,无论结局是喜是悲....
常用正则表达式
  • 首页 > 教程小结
  • 作者:起点终站
  • 2016年8月15日 23:46 星期一
  • 浏览:21251
  • 字号:
  • 评论:0
  • 正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE)是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。

    正则表达式是一个查询的字符串,它包含一般的字符和一些特殊的字符,特殊字符可以扩展查找字符串的能力,正则表达式在查找和替换字符串的作用不可忽视,它能很好提高工作效率。

    正则表达式用于字符串处理、表单验证等场合,实用高效。开发人员或运维人员很得力的文本编辑器要数editplus了,这个软件支持正则表达式,使用正则表达式进行编辑文本经常可以帮助你完成很多工作。这里我就给大家介绍几种editplus常用正则表达式的使用方法,以备不时之需。

    常用正则表达式

    【1】正则表达式应用——替换指定内容到行尾

    ① 在替换对话框,查找内容里输入“abc.*”

    ② 同时勾选“正则表达式”复选框,然后点击“全部替换”按钮

    其中,符号的含义如下:

    “.” =匹配任意字符

    “*” =匹配0次或更多

    注意:其实就是正则表达式替换,这里只是把一些曾经提出的问题加以整理,单纯从正则表达式本身来说,就可以引申出成千上万种特例。

    【2】正则表达式应用——数字替换

    希望把

    asdadas123asdasdas456asdasdasd789asdasd

    替换为:

    asdadas[123]asdasdas[456]asdasdasd[789]asdasd

    解决:

    [0-9][0-9][0-9] → [\0\1\2]

    如果是任意数字串,则“[0-9]*[0-9]”

    【3】正则表达式应用——删除每一行行尾的指定字符 

    比如

    12345 1265345

    2345

    需要删除每行末尾的“345”

    解决:

    345$ → 空

    如果是行首,则前面加“^”

    【4】正则表达式应用——替换带有半角括号的多行

    几百个网页中都有下面一段代码,我想把它们都去掉,可是找了很多search & replace的软件,都是只能对“一行”进行操作。

    EditPlus 打开几百个网页文件还是比较顺畅的,所以完全可以胜任这个工作。

    解决

    在 Editplus 中使用正则表达式,由于“(”、“)”被用做预设表达式(或者可以称作子表达式)的标志,所以需要使用 \ 转义。

    【5】正则表达式应用——删除空行

    ^[ \t]*\n → 空

    注意\t前有空格符。空格符是空行的一个组成成分。 

    另一种方法:[\n]+ → \n

    【6】正则表达式应用——中间包含文字替换

    如果要替换中间包含某文字的一行,例如包含yahoo,则可使用如下表达式匹配一行内容

     ^.*yahoo.*

    【7】正则表达式应用——中间不包含文字替换

    如果要替换中间不包含某文字的一行,例如不包含yahoo,则可使用如下表达式匹配一行内容

    ^(?!.*yahoo).*

    【8】查找url并提取

    www.baidu.com">http://www.baidu.com

    解决:

    ()  → \1

    (http://.*) →\1

    总结:EditPlus对正则表达式的支持有限,不支持 重复频度 的定义,如:{3}、{3,}、{3,6}...

    下面列出EditPlus查找或替换时支持的元字符:

    表达式    说明

    \t      制表符.

    \n      新行.

    .      匹配任意字符.

    |      匹配表达式左边和右边的字符. 例如, "ab|bc" 匹配 "ab" 或者 "bc".

    []      匹配列表之中的任何单个字符. 例如, "[ab]" 匹配 "a" 或者 "b". "[0-9]" 匹配任意数字.

    [^]     匹配列表之外的任何单个字符.例如, "[^ab]" 匹配 "a" 和 "b" 以外的字符. "[^0-9]" 匹配任意非数字字符.

    *      其左边的字符被匹配任意次(0次,或者多次). 例如 "be*" 匹配 "b", "be" 或者 "bee".

    +      其左边的字符被匹配至少一次(1次,或者多次). 例如 "be+" 匹配 "be" 或者 "bee" 但是不匹配 "b".

    ?      其左边的字符被匹配0次或者1次. 例如 "be?" 匹配 "b" 或者 "be" 但是不匹配 "bee".

    ^      其右边的表达式被匹配在一行的开始.例如 "^A" 仅仅匹配以 "A" 开头的行.

    $      其左边的表达式被匹配在一行的结尾. 例如 "e$" 仅仅匹配以 "e" 结尾的行.

    ()      影响表达式匹配的顺序,并且用作表达式的分组标记.

    \      转义字符. 如果你要使用 "\" 本身, 则应该使用 "\\".

      您阅读这篇文章共花了:  
    本文作者:起点终站      文章标题: 常用正则表达式
    本文地址:https://blog.hellozwh.com/?post=170
    版权声明:若无注明,本文皆为“起点终站”原创,转载请保留文章出处。
    • blogger
    返回顶部| 首页| 手气不错| 网站地图| sitemap| 装逼生成器| 站长介绍|

    Copyright © 2016-2019 起点终站 闽ICP备16011094号-1