Board logo

标题: [共同讨论]for语句读取文本内容的一些陷阱 [打印本页]

作者: namejm     时间: 2007-1-25 05:33    标题: [共同讨论]for语句读取文本内容的一些陷阱

  1、普通for语句会忽略以分号开头的文本:

  test.txt内容:
;abc
ai
::te
,te st
test
  测试代码:
@echo off
for /f "delims=" %%i in (test.txt) do echo %%i
pause
  此陷阱在不用for的 type test.txt、more test.txt和findstr .* test.txt 语句中不存在。

  2、在for语句中使用带 tokens=1* delims=: 的 findstr /n .* test.txt 的时候,会过滤掉行首的所有冒号:

  test.txt同1;
  测试代码:
@echo off
for /f "tokens=1* delims=:" %%i in ('findstr /n .* test.txt') do echo %%j
pause
  解决问题1和问题2的通用方案:

  稍微复杂一点的:
@echo off
for /f "delims=" %%i in ('findstr /n .* test.txt') do (
    set "str=%%i"
    call set "str=%%str:*:=%%"
    call echo "%%str%%"
)
pause
  最简洁的(经测试,这个方案不具备通用性,因为"delims= eol=" 会把行首为引号的内容过滤掉,看来真是前门驱虎后门进狼、引号和分号不能兼顾啊):
@echo off
for /f "delims= eol=" %%i in (test.txt) do echo %%i
pause
  简洁方案中的"delims= eol=" 顺序不能颠倒,否则会出现偏差。

  不知道强大的 for 还会有哪些陷阱会让不明就里的我们往里跳,请各位收集一下,以便日后编写代码的时候能少走弯路。

[ Last edited by namejm on 2007-5-17 at 09:17 PM ]
作者: 9527     时间: 2007-1-25 05:42
首先我想说的是FOR语句默认是忽略以“分号”开头的行,而不是冒号。
其次for /f "eol= delims=" %%a in (xxx) do command 命令中不会忽略任何符号开头的行,也就是说会显示全部的内容........
作者: lzmyst     时间: 2007-1-25 05:46
几乎所有教程都说delims要放在最后,今天才知道也是有陷阱的。
作者: pengfei     时间: 2007-1-25 05:51
又一个值得注意的地方, 不能说是陷阱, 任何程序自然不能顾及所有方面, 这就得靠我们平时多留意了.
作者: namejm     时间: 2007-1-25 05:54


  Quote:
Originally posted by 9527 at 2007-1-24 16:42:
首先我想说的是FOR语句默认是忽略以“分号”开头的行,而不是冒号。

  呵呵,多谢提醒,笔误已经修正。

  Quote:
其次for /f "eol= delims=" %%a in (xxx) do command 命令中不会忽略任何符号开头的行,也就是说会显示全部的内容........

  这个方案会忽略掉以空格打头的行,兄弟测试一下就知道了。

  Quote:
Originally posted by pengfei at 2007-1-24 16:51:
又一个值得注意的地方, 不能说是陷阱, 任何程序自然不能顾及所有方面, 这就得靠我们平时多留意了.

  这些值得注意的地方,在微软的使用手册里没有任何地方提及,究竟是它刻意忽略的bug还是问题太小而不屑于提及异或是没有察觉到,已经无从得知,但是从使用者的角度来说,有bug的地方却没有正式的说明,无异于是一个个隐藏着的陷阱等着别人往里跳^_^

[ Last edited by namejm on 2007-1-24 at 05:59 PM ]
作者: vkill     时间: 2007-1-25 08:22
"delims= eol=" 顺序不能颠倒

for /?上不是这样的啊
作者: namejm     时间: 2007-1-25 08:31
  哈哈,for /? 里还说:eol=c   -指一个行注释字符的结尾(就一个) 。我狂吐血ing——嘿嘿,实际上是过滤掉以 c 打头的行,不知是哪个家伙翻译的,E文也太差了点吧?

  言归正传,我所说的顺序不能颠倒,并不是指所有的情形,而是说为了能同时处理以分号和冒号打头的行内容,这个顺序不能颠倒。
作者: vkill     时间: 2007-1-25 08:43


  Quote:
Originally posted by namejm at 2007-1-25 08:31:
  哈哈,for /? 里还说:eol=c   -指一个行注释字符的结尾(就一个) 。我狂吐血ing——嘿嘿,实际上是过滤掉以 c 打头的行,不知是哪个家伙翻译的,E ...

汗,才发现for /?有这么大个超级错误,狂晕中
作者: pengfei     时间: 2007-1-25 09:24
for /f "eol= delims=" %%i in (test.txt) do echo %%i   "eol= delims=" 不能颠倒, 本机测试没有发现错误.

看来for /?的注释真的有点问题啊.
eol=c           - 指一个行注释字符的结尾(就一个)
delims=xxx      - 指分隔符集。这个替换了空格和跳格键的
                  默认分隔符集。

上面的说明我们在理解时产生了歧义, eol是过滤与行首字符匹配的行. 就像delims默认的分隔符为空格或TAB. 而eol的默认过滤的行首字符为;号, 而for /?却没有说明.

namejm兄说明给出的解决代码, for /f "delims= eol=" %%i in (test.txt) do echo %%i  它的作用和"delims=" 一样是取消默认空格作为分隔符, 而"eol="是取消;作分隔符.

下面代码为过滤行首为冒号的行, 同时取消了默认的分号分隔符.
@echo off
for /f "delims=  eol=: " %%i in (test.txt) do echo %%i
pause
test.txt
abc
:123
4:56
;
;def
::
   dok:cto:::
elo分隔符只能为一个, 上面代码故意让elo有两个分隔符, 可是只过滤了行首为:号的行, 而空格行却没有过滤.
作者: hxmupdata     时间: 2007-3-14 22:30
看个帖要花半个小时,,,不愧是经典帖..............................
作者: wudixin96     时间: 2007-4-4 01:07
下面代码为过滤行首为冒号的行, 同时取消了默认的分号分隔符.
CODE:  [Copy to clipboard]
--------------------------------------------------------------------------------

@echo off
for /f "delims=  eol=: " %%i in (test.txt) do echo %%i
pause

应该是
下面代码为过滤行首为冒号的行, 同时取消了默认的空格和跳格键分隔符.
作者: ccuu668     时间: 2007-5-2 15:32
看来只有多多学习学习基础的东西了.看的不彻底.
作者: luowei14     时间: 2007-8-15 17:27
。。。呵。。microsoft还有这个BUG啊。。。晕晕
作者: knoppix7     时间: 2007-8-15 22:04
set /?里的BUG更多。。。
作者: dai13910     时间: 2008-1-11 14:39
恩!很多细节值得推敲
作者: 不得不爱     时间: 2008-1-11 14:51
我再补充1句,FOR 不能处理超长行的文本
作者: ehejia     时间: 2008-1-13 10:48
FOR的陷阱烦的很 我做了个脚本就是掉陷阱了害我找好久。。。 感谢楼猪提供的方法
作者: 7testing     时间: 2010-6-7 15:13
for /f "eol=" %i in (test.txt) do echo %i