标题: 全文件删除汉字和指定字符之外的字符
[打印本页]
作者: youaoyi
时间: 2008-9-7 00:23
标题: 全文件删除汉字和指定字符之外的字符
遇到这么一个麻烦的问题:
很多 TXT 文件,一个文本几十兆,
每个文本中存在不同的、未知的字符需要删除。(用“_”替换也可以)
所有TXT文档需要保留的内容是:
“汉字”:.................
“英文”:A/a - Z/z
“数字”:0-9, 十六位代码30至39
“|” :文本中的分割符,十六位代码7C
“.”:表示金额的小数位,十六位代码 2E
“-”:表示日期中间的横线,十六位代码 2D
换行符 :十六位代码为 0D0A
除了上述以外, 其它的所有字符全部删除,肯请高手出手协助。
[
Last edited by youaoyi on 2008-9-7 at 12:33 AM ]
作者: youaoyi
时间: 2008-9-7 00:28
没有上传样本的
原因1是:原文本过大
原因2是:已经找到不保留字符的我已经使用
@change 1.txt /from "&H0D5C0D0A" /to "&H5F" 这样的命令替换掉了
而没有找到问题的文本,我也不清楚它们里面有没有含有上述需保留的字符以外的字符,确实很难找.....
作者: youaoyi
时间: 2008-9-7 14:22
删除“|”“-”“.”英文、数字之外的所有单字符是不是可以?