中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 会员 | 搜索 | 上传 | 帮助 »
中国DOS联盟论坛 » DOS批处理 & 脚本技术(批处理室) » 全文件删除汉字和指定字符之外的字符
作者:
标题: 全文件删除汉字和指定字符之外的字符 上一主题 | 下一主题
youaoyi
初级用户





积分 154
发帖 67
注册 2007-10-31
状态 离线
『楼 主』:  全文件删除汉字和指定字符之外的字符

遇到这么一个麻烦的问题:

很多 TXT 文件,一个文本几十兆,  

每个文本中存在不同的、未知的字符需要删除。(用“_”替换也可以)

所有TXT文档需要保留的内容是:

“汉字”:.................
“英文”:A/a - Z/z
“数字”:0-9, 十六位代码30至39
  “|” :文本中的分割符,十六位代码7C
   “.”:表示金额的小数位,十六位代码 2E
   “-”:表示日期中间的横线,十六位代码 2D
换行符 :十六位代码为 0D0A

除了上述以外, 其它的所有字符全部删除,肯请高手出手协助。

[ Last edited by youaoyi on 2008-9-7 at 12:33 AM ]

2008-9-7 00:23
查看资料  发短消息 网志   编辑帖子  回复  引用回复
youaoyi
初级用户





积分 154
发帖 67
注册 2007-10-31
状态 离线
『第 2 楼』:  

没有上传样本的

原因1是:原文本过大  

原因2是:已经找到不保留字符的我已经使用
         @change 1.txt /from "&H0D5C0D0A" /to "&H5F" 这样的命令替换掉了
         而没有找到问题的文本,我也不清楚它们里面有没有含有上述需保留的字符以外的字符,确实很难找.....

2008-9-7 00:28
查看资料  发短消息 网志   编辑帖子  回复  引用回复
youaoyi
初级用户





积分 154
发帖 67
注册 2007-10-31
状态 离线
『第 3 楼』:  

删除“|”“-”“.”英文、数字之外的所有单字符是不是可以?

2008-9-7 14:22
查看资料  发短消息 网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: