Board logo

标题: 据说unicode转ANSI的批处理 [打印本页]

作者: electronixtar     时间: 2006-10-23 08:23    标题: 据说unicode转ANSI的批处理

@Echo off
Md temp
For %%a in (*.inf) Do Type %%a >Temp\%%a
Copy Temp\*.inf /y
Del Temp\*.inf
Rd Temp


把很多 *.inf、*.ini 等Unicode格式转换成ANSI可以减小文件体积,功能不变!

大家想一下,能不能基于这个原理做一个精简注册表的呢?

Last edited by electronixtar on 2006-10-23 at 08:24 ]

作者: namejm     时间: 2006-10-23 08:32
  把Unicode转换成ANSI格式的真的能保证功能不变吗?虽然不知道是否正确,但是对这个说法有点怀疑。有知道的请解释一下原理。

作者: electronixtar     时间: 2006-10-23 08:40
因为 Unicode 保存英文用 2 个字节,而ANSI只要1个字节。系统里很多inf,用ANSI的完全够了

作者: nipo     时间: 2008-5-11 13:20    标题: 测试结果令人鼓舞,也有点奇怪!
双向测试了一个文本,

1、ANSI的。名称RVI.txt,内容如下:

{N=2,300,14}
V1:=((C-O)+2*(REF(C-O,1)+REF(C-O,2)+REF(C-O,3)))/6;
V2:=((H-L)+2*(REF(H-L,1)+REF(H-L,2)+REF(H-L,3)))/6;
NUM:=SUM(V1,N);
DENUM:=SUM(V2,N);
RVI:NUM/DENUM;
RVISIG:(RVI+2*(REF(RVI,1)+REF(RVI,2)+REF(RVI,3)))/6

测试用的代码:

cls
::@Echo off
del /s /q RVI.inf RVI_cheng.inf
echo.
For %%a in (RVI.txt) Do Type %%a >RVI.inf
echo.
For %%a in (RVI.inf) Do Type %%a >RVI_cheng.inf
start RVI.inf
start RVI_cheng.inf
exit

测试结果:
RVI.inf---UNICODE编码,显示正常。
RVI_cheng.inf---ANSI编码,显示字符异常。如下:

{ N = 2 , 3 0 0 , 1 4 }

V 1 : = ( ( C - O ) + 2 * ( R E F ( C - O , 1 ) + R E F ( C - O , 2 ) + R E F ( C - O , 3 ) ) ) / 6 ;

V 2 : = ( ( H - L ) + 2 * ( R E F ( H - L , 1 ) + R E F ( H - L , 2 ) + R E F ( H - L , 3 ) ) ) / 6 ;

N U M : = S U M ( V 1 , N ) ;

D E N U M : = S U M ( V 2 , N ) ;

R V I : N U M / D E N U M ;

R V I S I G : ( R V I + 2 * ( R E F ( R V I , 1 ) + R E F ( R V I , 2 ) + R E F ( R V I , 3 ) ) ) / 6


2、UNCODE的。名称RVI_other.txt,内容不变。

测试代码,除了改一下文件名称,别的没变:
:clss
::@Echo off
del /s /q RVI_other.inf RVI_other_cheng.inf
echo.
For %%a in (RVI_other.txt) Do Type %%a >RVI_other.inf
echo.
For %%a in (RVI_other.inf) Do Type %%a >RVI_other_cheng.inf
start RVI_other.inf
start RVI_other_cheng.inf
exit

测试结果:
生成RVI_other.inf、RVI_other_cheng.inf。显示都和原本一样,但都是ANSI编码的。

这个测试说明,此Type方法确实能造成字符编码的改变,但机制还不清楚。尤其是第一个测试UNICODE-->ANSI造成字符显示异常,而第二个测试同样用UNCODE码却显示正常,不解。

Last edited by nipo on 2008-5-11 at 01:40 PM ]

作者: slore     时间: 2008-5-11 14:40
你的BAT能正常运行?

作者: knoppix7     时间: 2008-5-11 18:21
用cmd /a(/u)也可以的.而且保险..

作者: nipo     时间: 2008-5-11 21:43
回5楼:

我用的是.cmd,运行正常。

回6楼:

谢谢你的提示,我也看到了相关的贴子,查看了cmd/?。

我之所以对这个贴子的方法感兴趣,除了编码转换之外,还有它的TYPE功能。这至少可以在理论上认定,在DOS环境下可以独立地操作UNICODE编码文件。

具体实现上,在文本处理上我还是新手,希望引起各位高手对这个问题的重视,大家齐心协力,加速这一问题的解决。

这个问题对DOS很重要,UNCODE问题不解决,压缩了DOS的生存空间。不仅在处理文本上,在网络等许多方面的应用也一样,解决了它,DOS又得到一片新天地。

Last edited by nipo on 2008-5-11 at 09:47 PM ]