标题: 一个关于chm格式电子书的批处理
[打印本页]
作者: mn960mn
时间: 2009-2-25 22:44
标题: 一个关于chm格式电子书的批处理
我在网上下了很多chm格式的电子书
想把里面的类容都复制到txt里面去
一个一个的复制太麻烦
求高手给个批处理能一次性的把里面的类容都
复制到txt里面去
(要一个chm页面的类容复制到一个txt里面去)
谢谢
作者: lxmxn
时间: 2009-2-26 05:14
可以分成这样几个步骤进行处理:
1、先用hh的反编译参数把chm文件分解成html格式的文件;
hh -decompile 输出目录 目标chm文件
2、利用sed等命令行工具去掉html文件里面的标签;
sed -i "s/<[^>]*>//g" html_files
3、利用for命令把第2步处理得到的html文件改名或者把处理后的内容定向到其它文件即可。
自己组织一下代码吧。