有一个CSV文件,其中包含了成千上万的URL链接,每个链接都可能是完整路径包含了文件夹,变量等。希望提取出其中的域名以便于进行深度分析。
我的CSV文件只有一列:
"https://www.pstips.net/diff-with-currentculture-and-currentuiculture.html" "https://www.pstips.net/tag/powershell-v3" "https://www.pstips.net/powershell-download-files.html" "http://www.notelee.com/cs0012-the-type-system-object-is-defined-in-an-assembly-that-is-not-referenced.html" "http://www.notelee.com/scom-create-wmi-perf-rule.html" "http://www.lonsoon.com/2013/04/94.html" "http://www.lonsoon.com/2013/05/101.html"
期望的输出结果:
www.pstips.net www.pstips.net www.pstips.net www.notelee.com www.notelee.com www.lonsoon.com www.lonsoon.com
分析:可以利用Import-csv命令,因为csv文件没有标题,需要临时指定标题。然后利用.NET中的类System.Uri
PS> Import-Csv .\file.csv -Header "link" | foreach { ( [uri]($_.link) ).Host }
本文链接: https://www.pstips.net/processing-text-4.html
请尊重原作者和编辑的辛勤劳动,欢迎转载,并注明出处!
请尊重原作者和编辑的辛勤劳动,欢迎转载,并注明出处!
Import-Csv data.txt -header url | foreach { $($_.url -split “/”)[2] }