PowerShell正则表达式(十四)搜索和移除重复的单词


怎样才能移除文本中多余的单词。这里,仍旧可以再次使用空格。模式可以这样定义:
“\b(\w+)(\s+\1){1,}\b”
模式会搜索一个单词(以“\b”定位),它由一个单词组成(字符“\w” 和限定符“+”),白空格紧随以后(字符“\s”和限定符“?”)。该模式中,白空格字符和将要被替换的单词必须至少出现一次(至少一次或者更多次,使用限定符“{1,}”)。整个模式会被第一次出现的反向引用给替换掉,也就是位于第一个的单词。

"太多 太多 的话 我还没有说, 太多 太多 太多 的理由值得你留下" -replace "\b(\w+)(\s+\1){1,}\b", '$1'
#太多 的话 我还没有说, 太多 的理由值得你留下
本文链接: https://www.pstips.net/find-and-remove-duplicate-word.html
请尊重原作者和编辑的辛勤劳动,欢迎转载,并注明出处!

关于 Mooser Lee

我是一个Powershell的爱好者,创建了PowerShell中文博客,热衷于Powershell技术的搜集和分享。本站部分内容来源于互联网,不足之处敬请谅解,并欢迎您批评指正。

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注