把从IceCrack处下载到的pdf文件用“foxit reader 2.0”转换成txt文件之后,再用如下代码对转换后的txt文件作去空行、去页脚标注等处理之后,得到了排版较为美观的txt文件:
@echo off
:: 把"hitme批处理集合.pdf"用 foxit reader 2.0 转换成"hitme批处理集合.txt"之后,
:: 因为转换后还保留有某些未知的格式,用常规的方法去空行保存之后,很多不在同一行的
:: 文字都挤在同一行,十分难看,请勿直接用常规方法修改转换后的"hitme批处理集合.txt",
:: 请运行以下代码对 hitme批处理集合.txt 文件进行去空行、去脚注、去页分隔标注等处理。
(
echo.
echo.
echo 此文本文档由pdf格式转换过来,由于转换的限制,
echo 代码可能存在断行的情况,在使用的过程中请注意检查。
echo.
echo -----------------------------------------------------------------------------
echo.
echo.
)>result.txt
for /f "tokens=1* delims=:" %%i in ('findstr /n "." hitme批处理集合.txt^|findstr /v "Generated Page"') do (echo.%%j>>result.txt)
start result.txt
[
Last edited by namejm on 2006-12-22 at 06:45 PM ]
本帖最近评分记录
(共 1 条)
点击查看详情
| 评分人 | 分数 | 时间 |
| — |
+1 |
2010-09-27 23:24 |
尺有所短,寸有所长,学好CMD没商量。
考虑问题复杂化,解决问题简洁化。