Board logo

标题: 一个关于chm格式电子书的批处理 [打印本页]

作者: mn960mn     时间: 2009-2-25 22:44    标题: 一个关于chm格式电子书的批处理

我在网上下了很多chm格式的电子书
想把里面的类容都复制到txt里面去
一个一个的复制太麻烦

求高手给个批处理能一次性的把里面的类容都
复制到txt里面去
(要一个chm页面的类容复制到一个txt里面去)

谢谢
作者: lxmxn     时间: 2009-2-26 05:14
可以分成这样几个步骤进行处理:

1、先用hh的反编译参数把chm文件分解成html格式的文件;
hh -decompile 输出目录 目标chm文件

2、利用sed等命令行工具去掉html文件里面的标签;
sed -i "s/<[^>]*>//g" html_files

3、利用for命令把第2步处理得到的html文件改名或者把处理后的内容定向到其它文件即可。

自己组织一下代码吧。