本文目录
背景
个人感觉我在办公室访问爱词霸的在线词典速度比海词的在线词典快,但是呢,海词的在线词典广告少,清爽,并且稍显专业。另外那个可爱的域名dict.cn(没有赞助,这不是广告,我也不是水军),我也真心喜欢。可是爱词霸用了一段时间,生词本中记录了一些生词,我想把它导入到海词的生词本中去。
需求
导入海词生词本的格式很简单:每个单词为一行的文本文件即可。而从爱词霸中导出的生词本格式如下:
1 flawlessly adv.无瑕地,完美地 陌生 2 whom pron.(who的宾格)谁 陌生 3 preceding adj.(时间或地点上)在先的,在前的,前面的 前述的 上述的 v.在…之前发生(或出现) 走在…前面 先于 “precede”的现在分词 陌生
所以目标很明确,从上面文本文件中提取主单词即可。
分析
- 每个单词前面有序号。
- 单词与序号之间有空格,空格数目不等。
- 序号和单词独占一行。
这些特征信息就够了。
脚本
Get-Content .\iciba.txt | where { $_ -match "^\d{1,}\b*(?<word>.*)"} | foreach { $Matches.word.Trim() }
输出
flawlessly whom preceding expressly
本文链接: https://www.pstips.net/processing-text-5.html
请尊重原作者和编辑的辛勤劳动,欢迎转载,并注明出处!
请尊重原作者和编辑的辛勤劳动,欢迎转载,并注明出处!