PowerShell 文本处理实例(五) 将爱词霸的生词本导入到海词


本文目录

背景

个人感觉我在办公室访问爱词霸的在线词典速度比海词的在线词典快,但是呢,海词的在线词典广告少,清爽,并且稍显专业。另外那个可爱的域名dict.cn(没有赞助,这不是广告,我也不是水军),我也真心喜欢。可是爱词霸用了一段时间,生词本中记录了一些生词,我想把它导入到海词的生词本中去。

需求

导入海词生词本的格式很简单:每个单词为一行的文本文件即可。而从爱词霸中导出的生词本格式如下:

1  flawlessly
adv.无瑕地,完美地
陌生

2  whom
pron.(who的宾格)谁
陌生

3  preceding
adj.(时间或地点上)在先的,在前的,前面的  前述的  上述的

v.在…之前发生(或出现)  走在…前面  先于  “precede”的现在分词
陌生

所以目标很明确,从上面文本文件中提取主单词即可。

分析

  • 每个单词前面有序号。
  • 单词与序号之间有空格,空格数目不等。
  • 序号和单词独占一行。

这些特征信息就够了。

脚本

Get-Content .\iciba.txt | 
  where { $_ -match "^\d{1,}\b*(?<word>.*)"} | 
  foreach { $Matches.word.Trim() }

输出

flawlessly
whom
preceding
expressly
本文链接: https://www.pstips.net/processing-text-5.html
请尊重原作者和编辑的辛勤劳动,欢迎转载,并注明出处!

关于 Mooser Lee

我是一个Powershell的爱好者,创建了PowerShell中文博客,热衷于Powershell技术的搜集和分享。本站部分内容来源于互联网,不足之处敬请谅解,并欢迎您批评指正。

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注