Board logo

标题: 简析环境变量和变量延迟特殊字符以及中介法的微妙关系 [打印本页]

作者: bjsh     时间: 2007-5-23 15:52    标题: 简析环境变量和变量延迟特殊字符以及中介法的微妙关系

已作修改
本文主要以例子展开了讨论:
对每个例子的结果进行分析;并揭示其中的一些现象;
例一:
@echo off
set "var=kljlk!tsd!21%mk%gd"
set var
结果为

  Quote:
var=kljlk!tsd!21gd

(注意到 此时setlocal默认为disabledelayedexpansion !!不被识别)
因此把%mk%看做环境变量被替换掉;而mk没有被定义因此%mk%被替换为空

再来看加了setlocal enabledelayedexpansion后会是怎样;
例二:
@echo off&setlocal enabledelayedexpansion
set "var=kljlk!tsd!21%mk%gd"
echo.!var!
结果为

  Quote:
kljlk21gd

注意到 此时setlocal声明为enabledelayedexpansion
因此把!tsd!和%mk%均被看做环境变量而被替换掉;而tsd和mk没有被定义因此均被替换为空
(由于优先级的不同;%mk%将在预处理被先被替换,然后!tsd!被替换;原因后面有讲到)


如果把kljlk!tsd!21%mk%gd放到t.txt然后
再通过%%a做为中介进行传递后会有什么现象呢
例三:
@echo off
for /f "delims=" %%a in (t.txt) do (
        set "var=%%a"
        set var
)
结果为:

  Quote:
var=kljlk!tsd!21%mk%gd

如果按照上面所说的此时%mk%应该被替换为空;
但是这里经过一个%%a的中介;此时的结果不会把%mk%替换;即使mk环境变量有定义也不会替换掉;而是按字面输出;

实际上这跟cmd的预处理机制有关;

当CMD读取for语句时,他的所有语句将一同被读取,并完成预处理工作,这其中就包括环境变量%%的扩展;

因为字符串在文本中 并没有以字符串的形式出现在 for语句中;因此其中的%%躲过了预处理机制;

但是当启用延迟环境变量后
例如:
例四
@echo off
for /f "delims=" %%a in (t.txt) do (
        set "var=%%a"
        set var
)
结果为:

  Quote:
var=kljlk21%mk%gd

首先他会和上面一样对for所有语句一起读取;完成对%%的扩展;(%%的优先级高)
然后当CMD读取了一条完整的语句之后,
它不会立即执行变量的扩展行为,而会在某个单条语句执行之前再进行扩展,也就是说,这个扩展行为被“延迟”了
例如在set "var=%%a"时 只有执行到这条命令前才会对这条命令进行扩展;
而此时%%a已经被kljlk!tsd!21%mk%gd所代替;因此将会对其中的!!进行扩展.
他会识别其中是否存在!;此时的扩展只处理!!而不处理%%(因为对%%的处理过程在先前已经进行完;而那时因为字符串在文本中 并没有以字符串的形式出现在 for语句中;因此其中的%%躲过了预处理机制;);


然而只有当该字符串中含有!时, cmd才会对该字符串进行再次处理;
举例:
例五:
@echo off&setlocal enabledelayedexpansion
for /f "delims=" %%a in (t.txt) do (
        set "var=%%a"
        set var
)
t.txt的内容

  Quote:
kl&>jl^k!tsd!21%mk%gd
kl&>jlk^!tsd^!21%mk%gd
dgssdgdg^gds^gdsa

结果为:

  Quote:
var=kl&>jlk21%mk%gd
var=kl&>jlk!tsd!21%mk%gd
var=dgssdgdg^gds^gdsa

注意到 第一行的 ^ 已经不存在了;(所在行包含!!)
而第三行的^没有被处理;(所在行不包含!!)

(包含一个!也会对^进行处理;)
由此可见 启用延迟环境变量后 ;
在每次执行语句前;
cmd会检查是否含有!;
如果存在就对其进行必要的预处理后再执行.


注:此时setlocal默认为disabledelayedexpansion因此!tsd!是因为不给识别而不被替换和%mk%不被替换的原因不同.
如果想强迫进行二次转变(即把%mk%的值按其环境变量值警醒替换)再赋值给var可以使用 call set "var=%%a"
也就是说:
例六:
@echo off
set "mk=152"
for /f "delims=" %%a in (t.txt) do (
        call set "var=%%a"
        set var
)
的结果则为:

  Quote:
var=kljlk!tsd!21152gd

call set "var=%%a"
实际上是让命令解释器再来一次预处理来达到目的的


再来看%%a另一个例子
例七:
@echo off
echo ^&*&^^&%$%^%$#$1213<>:Lksgsd
结果为:

  Quote:
&*
'^' 不是内部或外部命令,也不是可运行的程序
或批处理文件。
'Lksgsd' 不是内部或外部命令,也不是可运行的程序
或批处理文件。

大家都知道这是因为里面有特殊字符;
但是看下面的例子;把^&*&^^&%$%^%$#$1213<>:Lksgsd放到t.txt中;用%%a做为中介后:
例七:
@echo off
for /f "delims=" %%a in (t.txt) do (
        echo.%%a
)
结果则为:

  Quote:
^&*&^^&%$%^%$#$1213<>:Lksgsd

所有的都是原样输出;丝毫没有因为特殊字符而受影响;(原因上面已讲到)
注:如果t.txt中有直接回车的空行则会跳过;原因在for本身而不是%%a;


再来个!var!的特殊例子
例八:
@echo off
set "var=^&*&^^&$^$#$1213<>Lksgsd"
echo.%var%
结果为:

  Quote:
此时不应有 >。

结果出错

做如下的修改
例九:
@echo off&setlocal enabledelayedexpansion
set "var=^&*&^^&$^$#$1213<>Lksgsd"
echo.!var!
结果为:

  Quote:
^&*&^^&$^$#$1213<>Lksgsd

结果正确;
但是此种方法仍然受上面所述的原因影响;
比如如果var=后面的值含有!!和%%等则会发生替换;还有比如中间有:则会与set发生关系而导致结果不准确;
当然可以利用%%a中介可以避免 %% 被替换;但是!!却有上述原因没法逃过被替换;



最后给出个综合应用的例子:
对文件指定行进行输出;不论是否含有特殊字符:
这里就把整个文件输出;对指定行可以修改为 findstr /n .* test.txt^|findstr "^10:" 等;
@echo off
for /f "delims=" %%a in ('findstr /n .* test.txt') do (
        set "var=%%a"
        setlocal enabledelayedexpansion
        set var=!var:*:=!
        echo.!var!
        endlocal
)
短短的几行代码包含了很多技巧;

测试文本:
test.txt

  Quote:
"aou"eo
;euou%^>
::::aeui
   
:::E2uo alejou 3<o2io|
^aue||%ou

aoue eou 2
euo 8
ege#6758!7^^9098!98%$&^
ueyi^^^^aueuo2
~ ! @ # $ % ^ & * ( () " ok " No " <>nul
ege#6758^^^!7^^^^9098^!98%$&^^

~ ! @ # $ %"  ^  "& * ( () " ok " No " <>nul
sdsdg:sadgs

并没有经过大量的测试;诸位帮忙测试;

[ Last edited by bjsh on 2007-5-27 at 12:03 PM ]
作者: namejm     时间: 2007-5-24 07:54
  测试了不少内容,并把这个过程转化为一篇长帖,佩服你的耐心。

  我觉得,一切的一切,应该和CMD的预处理机制有关,可惜水平有限,难以做深入的分析——这个时候,习惯性地又想起了willsort,不知道何年何月才能又看到他那深入本质的分析。
作者: lxmxn     时间: 2007-5-24 08:48
bjsh 真是很有耐心,学习。
作者: guxingyibei     时间: 2007-5-24 09:12    标题: 服了!

bjsh版主太厉害了! 我以前不太了解那个setlocal enabledelayedexpansion 到底有什么用,现在知道了不少了!而且最重要的是他们之间详细的关联,很受益!
  我还从中学到了 echo 和 echo. 的区别,虽然不是很清楚!
  还有那个findstr /n .* test.txt ,"."后面有*和没有*的区别,
非常感谢!!
作者: mtiankong     时间: 2007-5-25 14:27
向楼主学习~~~
作者: Vampire     时间: 2007-5-25 14:39
喜欢看深入的分析。收藏。
作者: qzwqzw     时间: 2007-5-27 00:52


  Quote:
Originally posted by bjsh at 2007-5-23 15:52:
for会自动给每个特殊字符加上转义符号;

请恕冒昧
我感觉这一句很有问题
for不会为特殊字符加转义符号
这样会额外增加它的预处理负担

对于例3的结果分析
应该是因为"kljlk!tsd!21%mk%gd"这个串没有被预处理
因为只有预处理过程才会处理这些特殊字符

也就是说
这个串因为藏在文件中
“躲过了”cmd的预处理机制审查
所以得以全身

至于例5的结果分析
那是因为对!!的分析和其它字符不属于同一阶段的预处理范畴
也就是说
对%"这些是初审
而对!则是复审
过的了初审的!
未必过的了复审
全看命令延迟扩展这根指针的指向呢

总的来说
因为cmd处理所有字符都是有先有后
所以必然会产生所谓优先级的问题
比如%的优先级会很高
因为它很早就被转义解释了
"和^都不会对它发生作用
作者: bjsh     时间: 2007-5-27 10:22
是的;
确实是我理解有误; 已经修改
多谢qzwqzw兄的指点;

当CMD读取for语句时,他的所有语句将一同被读取,并完成预处理工作,这其中就包括环境变量%%的扩展;

因为字符串在文本中 并没有以字符串的形式出现在 for语句中;因此其中的%%躲过了预处理机制;

启用延迟环境变量后
首先他会和上面一样对for所有语句一起读取;完成对%%的扩展;
然后当CMD读取了一条完整的语句之后,他会识别其中是否存在!!;此时的扩展只识别!!而不识别%%;
只用当该字符串中含有!!, cmd才会对该字符串进行再次处理;
举例:
@echo off&setlocal enabledelayedexpansion
for /f "delims=" %%a in (t.txt) do (
        set "var=%%a"
        set var
)
t.txt的内容为

  Quote:
kl&>jl^k!tsd!21%mk%gd
kl&>jlk^!tsd^!21%mk%gd
dgssdgdg^gds^gdsa

结果为:

  Quote:
var=kl&>jlk21%mk%gd
kl&>jlk!tsd!21%mk%gd
var=dgssdgdg^gds^gdsa

注意到 第一行的 ^ 已经不存在了;
而第三行的^没有被处理;

由此可见 启用延迟环境变量后 ;
在每次执行语句前;
cmd会检查是否含有!!;
如果存在就对其进行必要的预处理后再执行.

[ Last edited by bjsh on 2007-5-27 at 10:58 AM ]
作者: oilio     时间: 2007-5-27 16:48
佩服啊,我就没有这种耐心,有的时候测试最多只能做几分钟。
作者: nbic     时间: 2007-5-28 12:29
不错。。收藏学习。。
作者: long626201     时间: 2007-9-3 10:57
谢了
作者: xyhs     时间: 2007-9-3 20:24
看了受益不少
作者: wordexport     时间: 2007-9-29 15:05
这么好的帖子,不顶还是人吗?
作者: wordexport     时间: 2007-9-29 15:05
向版主看齐
作者: austinfu     时间: 2007-9-29 15:22
let me see...
作者: greenworld     时间: 2007-10-18 10:45
好贴,收藏来学习了,非常多谢LZ
作者: techon     时间: 2007-11-9 16:40
学习学习
作者: hizebra     时间: 2007-12-17 13:03    标题: 启用变量延迟后,感叹号如何显示?

诚如楼主所言,启用变量延迟后,双感叹号!!间的内容将被替换,若无定义,则echo为空;
试用了 echo "!!!!" 的语句后,显示双引号"";
再试 echo "^!^!!!" 可以显示 "!!";
再试 echo "!^!^!!" 显示为"!";
试 echo "^!!!^!" 显示为"!";
试 echo "!!^!^!" 显示为"!";

由此得到以下规律:
1、脱字符^在字符串首出现时必可显示一个感叹号,后面继续紧跟^!这样的序列组,有多少组就会得到多少个感叹号,直到连续感叹号出现为止;
2、在第一组连续感叹号和最后一个感叹号间的字符串中,只有出现连续^!两组以上的序列,才会得到一个感叹号,有N组就得到N-1个感叹号;即两个脱字符间的感叹号才可被转义。
3、如果把以上echo语句中的双引号取掉,无论任何情况都得不到输出结果。

尽管得到这样的结论,对其内部处理机制仍不是很清楚,请高手答疑。
另外,即使通过这种方法可以显示!,那么怎么取掉外部的双引号呢?请不要简单告诉我输出文件,再用for解析变换,这样得不偿失。我已经尝试用set定义这些echo内容了,然而显示变量为空,不明就里。
作者: haiou327     时间: 2008-1-4 15:54
好帖顶起来
作者: 429499381     时间: 2008-1-26 07:05
18楼你在说什么  ??

C:\>echo "!!!"
"!!!"

C:\>echo "^!^!!!"
"^!^!!!"

C:\>echo "^!!!^!"
"^!!!^!"

C:\>echo "!!^!^!"
"!!^!^!"

C:\>echo !!
!!

C:\>echo ""
""

C:\>
作者: qianmo717     时间: 2008-1-26 09:49
楼上的朋友,他讨论的是(启用变量延迟后,感叹号如何显示?)
作者: laihaibin08     时间: 2008-10-19 17:23
佩服
收藏学习
作者: slw218856     时间: 2008-10-22 13:04
在基础上有深入的理解,新手由此入境。
收藏了,   学习,继续学习。
作者: cjiabing     时间: 2009-6-9 06:04
学习了!~
作者: weasel     时间: 2009-6-9 12:40
好帖子,学习学习。
作者: sl543001     时间: 2009-10-1 22:05
强人,很有探索精神,顶起!
作者: jiafei2427     时间: 2009-12-16 14:56
不错 学习到了 我的问题从你那里解决了 谢谢
作者: hqz123     时间: 2009-12-17 14:05
setx.rar
作者: 7testing     时间: 2010-6-4 13:52
感觉那些扩展部分还是蛮高深的,还需要继续深入的研究。
作者: wxs81514     时间: 2010-11-11 15:21
高深啊,我看都有点没耐心了,呵呵