小众软件官方论坛

请教一个巢式括号字符串正则表达式的写法

highwind (highwind) 2022 年2 月 15 日 12:43 1

前提：已知ii，u和x都是未知内容。

请教如何从字符串 <uuuu<uuiixx>xxxxxx>如何摘除中间（也就是距离ii最近，套嵌最深的）<uuiixx>的字符串得到<uuuuxxxxxx>

谢谢各位大佬啦，因为python的re正则都是贪婪模式，非贪婪的？只能找到后面最近的，不太会整

Hoothin 2022 年2 月 15 日 12:49 2

(<[^<]+)<[^>]+>(.*)

highwind (highwind) 2022 年2 月 15 日 14:33 3

谢谢大佬，不过这个好像不太ok？，这里面似乎没有体现出ii的寻找匹配呀？

highwind (highwind) 2022 年2 月 15 日 23:11 5

谢谢呀，这种我试过，但是你看在python里面
` import re

a = “<uuuxuxxxxx>”

re.sub(r"<.+?ii.+?>", “”, a) `

结果是这样的：

'uxxxxx>' 它对左边似乎还是贪婪的。

Hoothin 2022 年2 月 15 日 23:18 6

我上面那个是匹配巢式的，

(.*)<[^<]+ii[^>]+>(.*)

匹配ii用这个，注意这两个都是靠分组来提取的

Betty (羚羊挂角) 2022 年2 月 16 日 00:52 7

请教一下，什么是“巢式括号”啊？搜了一下，第一个结果就是这个帖子

dog (荒废千年) 2022 年2 月 16 日 00:53 8

可能是长得跟巢上面那三个笔画一样哈哈哈哈哈哈~

dog (荒废千年) 2022 年2 月 16 日 02:39 11

支持零宽断言的话就很好弄了：
<(?=[^<]+ii)([^<>]+)(?<=ii[^>]+)>
替换为空

lmingzhi (lmingzhi) 2022 年2 月 16 日 02:41 12

可以试试：

其中 .*? 表示非贪婪匹配所有的字符。

import re
for astr in (
    '<uuuu<uuiixx>xxxxxx>',
    '<abc>',
    '<uuuu<uuixx>xxxxxx>'
    ):
    asub = re.sub(r'(<.*?)(<.*?ii.*?>)(.*>)', r'\1\3', astr)
    print(astr, asub)

output:

<uuuu<uuiixx>xxxxxx> <uuuuxxxxxx>
<abc> <abc>
<uuuu<uuixx>xxxxxx> <uuuu<uuixx>xxxxxx>

highwind (highwind) 2022 年2 月 16 日 03:05 14

就是括号外面套括号哈

dog (荒废千年) 2022 年2 月 16 日 03:10 15

nested 翻译成嵌套比较好
我还以为巢式是巢字头上的巛，还想着挺形象，哈哈哈哈

话题		回复	浏览量	活动
万能的网友，求助正则表达式规则问题求助	9	1235	2023 年5 月 11 日
如何用正则表达式实现文档指定部分的文本替换？问题求助 windows , 文本处理	16	3332	2022 年6 月 2 日
求助：在一txt文档中如何用正则表达式表达匹配问题求助	9	869	2014 年8 月 31 日
如何用正则表达式匹配/后面有内容的字符串问题求助 javascript	20	1669	2022 年3 月 5 日
请教emeditor的一个正则问题求助	10	3287	2020 年5 月 8 日