标题: 求助:关于批处理分类并重命名网页
[打印本页]
作者: gene771771
时间: 2007-7-3 15:56
标题: 求助:关于批处理分类并重命名网页
我下载了大量的网页,都是rar格式的,但是下载下来以后后缀名都是 index.html.1 ... index.html.100 ... 后缀名都是数字,当然这里的1到100是个例子,实际上的文件有30万个,需要自己把后缀名改成 *.rar,每个*.rar中都包括一个文件和两个文件夹,即default.htm paper Images
所以,我需要两个程序,
第一个,可以把文件名改成1.rar ...100.rar
第二个,读取rar中default.htm,找出含有 银行 金融 经济 证券 保险 管理 贷款 字样的予以保存,其他的删除,关键字之间是“或”的关系,不是“和”的关系,也就是只要有其中一个关键字的都保留下来,没有就删除。
我做了很久没有做出来,请达人们执教,在这里忠心的谢谢你们!
作者: gene771771
时间: 2007-7-3 16:48
拜托了,急用啊~~~
作者: vkill
时间: 2007-7-3 18:07
有防止盗链的,直接用wget下载不带.rar吧?
作者: gene771771
时间: 2007-7-3 21:57
更正一下,我试了试,发现不是RAR格式的而是ZIP格式的,刚好我手上有个工具可以批量解压,但是第二个问题我还是没有解决。
第二个,读取zip中default.htm,找出含有 银行 金融 经济 证券 保险 管理 贷款 字样的予以保存,其他的删除,关键字之间是“或”的关系,不是“和”的关系,也就是只要有其中一个关键字的都保留下来,没有就删除。
作者: zh159
时间: 2007-7-3 23:21
第二个问题,好像目前除了解压,还没有较好的方法
作者: zxlxsqzy
时间: 2007-8-5 16:35
改名字的你试试这个,第二个就无能为力了.
dir /b /aD 路径\*.html >1.txt
for /f %%i in (1.txt) do (for /l %%c in (1,1,100) do (ren 路径\%%i %%c.zip))
del 1.txt