Board logo

标题: [已结]批量提取文本[不使用sed能不能办到] [打印本页]

作者: wjdidi     时间: 2008-7-7 20:10    标题: [已结]批量提取文本[不使用sed能不能办到]

文件夹下的文件均为xx.xml
文件内容如下:
<?xml version="1.0" encoding="GB2312"?>
<!-- Edited with XMLSPY C.+ v2007 rel. 2 U  by QQ 49636010 -->
<event id="538" name="边境-鲁潇(210,7)">
        <!--new means new quest, default is quest on user-->
.....
要求是提取第三行中的"538"和"边境-鲁潇"到新文件x.txt

仅使用P处理能不能办到

[ Last edited by wjdidi on 2008-7-8 at 01:26 PM ]
作者: bat-zw     时间: 2008-7-7 20:33
可以,如下:
@echo off
for /f "delims=" %%a in ('dir /b *.*ml') do (
    for /f "tokens=3,5 delims=<>=( " %%i in ('findstr /c:"event id=" %%a') do echo %%~i %%~j>>new.txt
)
start new.txt

作者: wjdidi     时间: 2008-7-7 21:05
zw19750516的代码可以用,谢谢

不过我对代码有部分还是不太懂:

1.   dir /b  这个地方,帮助说明里是说:使用空格式(没有标题信息或摘要)。不太明白是什么意思
2. delims=<>=( 还有就是这个地方

能否帮忙解释一下,越详细越好!

感谢!!
作者: bat-zw     时间: 2008-7-7 21:23
dir /b就是仅列出文件名,不列出其它信息,如一个文件夹中有文件1.txt 2.txt 3.txt 4.exe
dir /b *.txt后将输出如下:
1.txt
2.txt
3.txt
delims=<>=( 就是将“<”“>”“=”“(”“空格”都做为行中的分隔符,如下:
<event id="538" name="边境-鲁潇(210,7)">
分隔符event分隔符id分隔符"538"分隔符name分隔符"边境-鲁潇分隔符210,7)"分隔符
    1    2    3     4      5      6 

[ Last edited by zw19750516 on 2008-7-7 at 09:27 PM ]
作者: pusofalse     时间: 2008-7-7 21:36
只要没特殊字符。。。不借助第三方工具还是可以的。。
作者: wjdidi     时间: 2008-7-7 22:00


  Quote:
Originally posted by zw19750516 at 2008-7-7 09:23 PM:
dir /b就是仅列出文件名,不列出其它信息,如一个文件夹中有文件1.txt 2.txt 3.txt 4.exe
dir /b *.txt后将输出如下:
1.txt
2.txt
3.txt
delims=<>=( 就是将“< ...

我把你写的代码拆成一句句的,单独执行,再跟结果对比,终于搞明白了。
dir /b也是,执行了之后看出来结果了,分隔符这一块,我终于算是彻底搞明白了,哈哈,上面的delims不用<>也可以,直接"tokens=3,5 delims==( "就行

谢谢你,感谢!
作者: 26933062     时间: 2008-7-7 22:01
这样效率应该高些。
:
@echo off
for /f "tokens=4,6 delims=<>=(: " %%i in ('findstr /c:"event id=" *.*ml') do (
   >>name.txt echo %%~i %%~j
)
start name.txt
[ Last edited by 26933062 on 2008-7-7 at 10:10 PM ]
作者: pusofalse     时间: 2008-7-7 22:45
原来可以使用通配符。。^_^
作者: vkill     时间: 2008-7-8 12:16
处理xml还是喜欢 xml.exe