Board logo

标题: 全文件删除汉字和指定字符之外的字符 [打印本页]

作者: youaoyi     时间: 2008-9-7 00:23    标题: 全文件删除汉字和指定字符之外的字符

遇到这么一个麻烦的问题:

很多 TXT 文件,一个文本几十兆,  

每个文本中存在不同的、未知的字符需要删除。(用“_”替换也可以)

所有TXT文档需要保留的内容是:

“汉字”:.................
“英文”:A/a - Z/z
“数字”:0-9, 十六位代码30至39
  “|” :文本中的分割符,十六位代码7C
   “.”:表示金额的小数位,十六位代码 2E
   “-”:表示日期中间的横线,十六位代码 2D
换行符 :十六位代码为 0D0A

除了上述以外, 其它的所有字符全部删除,肯请高手出手协助。

[ Last edited by youaoyi on 2008-9-7 at 12:33 AM ]
作者: youaoyi     时间: 2008-9-7 00:28
没有上传样本的

原因1是:原文本过大  

原因2是:已经找到不保留字符的我已经使用
         @change 1.txt /from "&H0D5C0D0A" /to "&H5F" 这样的命令替换掉了
         而没有找到问题的文本,我也不清楚它们里面有没有含有上述需保留的字符以外的字符,确实很难找.....
作者: youaoyi     时间: 2008-9-7 14:22
删除“|”“-”“.”英文、数字之外的所有单字符是不是可以?