如何批量去除TXT文本中“章节字数:1752 更新时间:07-09-16 09:49”这样的段落?
发布网友
发布时间:2022-05-11 21:01
我来回答
共2个回答
热心网友
时间:2023-10-20 09:42
可以看出这个问题要求删除不固定的文字,Replace Pioneer善于处理这类问题:
* 如果你要删除的代码是固定内容的多行句子,你就可以用单引号阔起来作为被替换内容(可以多行),即'章节字数:1752 更新时间:07-09-16 09:49'
* 如果你要删除的代码不是固定的句子,但有某种规律,那就需要你自己找到规律,比如代码都以start开始end结束,就可以把start.*?end作为搜索字符,以你的为例可能是:章节字数:.*?更新时间:.*?..:..
具体操作:
1.ctrl-o打开文件
2.ctrl-h打开替换对话框
在search for pattern下面输入:
章节字数:.*?更新时间:.*?..:..(注:表示被替换内容,支持多行)
在replace with pattern 下面不填表示替换成空
3.点击Replace即可
如需批量处理多个文件,则在第3步点击Batch...(批量),然后在打开的对话框中,点击pick files选择多个文件,最后点击batch replace即可。
如果你的网页文件是utf-8或unicode等等,你还需要提前在Tools->Encoding菜单选择合适的编码方式。
Replace Pioneer 下载地址:http://www.mind-pioneer.com, http://www.download.com
Replace Pioneer 目前没有汉化版,但是支持中文文档完全没有问题。
参考资料:www.mind-pioneer.com
热心网友
时间:2023-10-20 09:42
复制(章节字数:1752 更新时间:07-09-16 09:49)这段,然后编辑--使用替换功能,选择全部替换,替换为那里为空,就删除了