Board logo

标题: [已结]批量提取文本[不使用sed能不能办到] [打印本页]

作者: wjdidi     时间: 2008-7-7 20:10    标题: [已结]批量提取文本[不使用sed能不能办到]
文件夹下的文件均为xx.xml 文件内容如下:
<?xml version="1.0" encoding="GB2312"?>
<!-- Edited with XMLSPY C.+ v2007 rel. 2 U  by QQ 49636010 -->
<event id="538" name="边境-鲁潇(210,7)">
	<!--new means new quest, default is quest on user-->
.....
要求是提取第三行中的"538"和"边境-鲁潇"到新文件x.txt 仅使用P处理能不能办到 [ Last edited by wjdidi on 2008-7-8 at 01:26 PM ]

作者: bat-zw     时间: 2008-7-7 20:33
可以,如下:
@echo off
for /f "delims=" %%a in ('dir /b *.*ml') do (
    for /f "tokens=3,5 delims=<>=( " %%i in ('findstr /c:"event id=" %%a') do echo %%~i %%~j>>new.txt
)
start new.txt

作者: wjdidi     时间: 2008-7-7 21:05
zw19750516的代码可以用,谢谢 不过我对代码有部分还是不太懂: 1. dir /b 这个地方,帮助说明里是说:使用空格式(没有标题信息或摘要)。不太明白是什么意思 2. delims=<>=( 还有就是这个地方 能否帮忙解释一下,越详细越好! 感谢!!

作者: bat-zw     时间: 2008-7-7 21:23
dir /b就是仅列出文件名,不列出其它信息,如一个文件夹中有文件1.txt 2.txt 3.txt 4.exe dir /b *.txt后将输出如下: 1.txt 2.txt 3.txt delims=<>=( 就是将“<”“>”“=”“(”“空格”都做为行中的分隔符,如下: <event id="538" name="边境-鲁潇(210,7)"> 分隔符event分隔符id分隔符"538"分隔符name分隔符"边境-鲁潇分隔符210,7)"分隔符     1    2    3     4      5      6  [ Last edited by zw19750516 on 2008-7-7 at 09:27 PM ]

作者: pusofalse     时间: 2008-7-7 21:36
只要没特殊字符。。。不借助第三方工具还是可以的。。

作者: wjdidi     时间: 2008-7-7 22:00
Originally posted by zw19750516 at 2008-7-7 09:23 PM: dir /b就是仅列出文件名,不列出其它信息,如一个文件夹中有文件1.txt 2.txt 3.txt 4.exe dir /b *.txt后将输出如下: 1.txt 2.txt 3.txt delims=<>=( 就是将“< ...
我把你写的代码拆成一句句的,单独执行,再跟结果对比,终于搞明白了。 dir /b也是,执行了之后看出来结果了,分隔符这一块,我终于算是彻底搞明白了,哈哈,上面的delims不用<>也可以,直接"tokens=3,5 delims==( "就行 谢谢你,感谢!

作者: 26933062     时间: 2008-7-7 22:01
这样效率应该高些。 :
@echo off
for /f "tokens=4,6 delims=<>=(: " %%i in ('findstr /c:"event id=" *.*ml') do (
   >>name.txt echo %%~i %%~j
)
start name.txt
[ Last edited by 26933062 on 2008-7-7 at 10:10 PM ]

作者: pusofalse     时间: 2008-7-7 22:45
原来可以使用通配符。。^_^

作者: vkill     时间: 2008-7-8 12:16
处理xml还是喜欢 xml.exe