PowerShell 文本处理实例(四) 之 提取CSV文件中的域名


有一个CSV文件,其中包含了成千上万的URL链接,每个链接都可能是完整路径包含了文件夹,变量等。希望提取出其中的域名以便于进行深度分析。
我的CSV文件只有一列:

"https://www.pstips.net/diff-with-currentculture-and-currentuiculture.html"
"https://www.pstips.net/tag/powershell-v3"
"https://www.pstips.net/powershell-download-files.html"
"http://www.notelee.com/cs0012-the-type-system-object-is-defined-in-an-assembly-that-is-not-referenced.html"
"http://www.notelee.com/scom-create-wmi-perf-rule.html"
"http://www.lonsoon.com/2013/04/94.html"
"http://www.lonsoon.com/2013/05/101.html"

期望的输出结果:

www.pstips.net
www.pstips.net
www.pstips.net
www.notelee.com
www.notelee.com
www.lonsoon.com
www.lonsoon.com

分析:可以利用Import-csv命令,因为csv文件没有标题,需要临时指定标题。然后利用.NET中的类System.Uri

PS> Import-Csv .\file.csv -Header "link" | foreach { ( [uri]($_.link) ).Host }
×用微信扫描并分享
本文链接: https://www.pstips.net/processing-text-4.html
请尊重原作者和编辑的辛勤劳动,欢迎转载,并注明出处!

关于 Mooser Lee

我是一个Powershell的爱好者,创建了PowerShell中文博客,热衷于Powershell技术的搜集和分享。本站部分内容来源于互联网,不足之处敬请谅解,并欢迎您批评指正。

发表评论

电子邮件地址不会被公开。 必填项已用*标注