中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名：www.cn-dos.net 论坛域名：www.cn-dos.net/forum
DOS，代表着自由开放与发展，我们努力起来，学习FreeDOS和Linux的自由开放与GNU精神，共同创造和发展美好的自由与GNU GPL世界吧！

游客: 注册 | 登录 | 命令行 | 搜索 | 上传 | 帮助 »

中国DOS联盟论坛 » DOS批处理 & 脚本技术（批处理室） » [原创]GBK ＆ UTF8 编码互转脚本 (CMD+GAWK)

English/Chinese Fix Translation

作者:

标题: [原创]GBK ＆ UTF8 编码互转脚本 (CMD+GAWK)

上一主题 | 下一主题

无奈何
荣誉版主

积分 1338
发帖 356
注册 2005-7-15
状态离线

『楼主』: [原创]GBK ＆ UTF8 编码互转脚本 (CMD+GAWK) 使用 LLM 解释/回答一下

GBK ＆ UTF8 编码互转脚本 (CMD+GAWK)

因为我的实际应用中需要 UTF8 到 GBK 的编码转换，所以就用 GAWK 写了一个，事实上在我早先的帖子中已经在使用。这次整理了一下，已支持编码的双向转换，自己制作了完整的 GBK 到 UTF8 的转码对照表，制作中发现系统的转码结果和 iconv 的转码结果有不少差异，对照表采用的是前者。
本脚本支持管道和文件的编码转换，结果输出到屏幕。现在参数支持不多，但是有参数完整性的检测功能，可以完成多参数的无序调用。采用了新的脚本释放方法，源文件有改动时会自动更新脚本。还有错误消息和依赖文件完整性检查机制。希望这些小技巧对大家编写批处理有所帮助。
GAWK 下载链接：http://www.klabaster.com/progs/gawk32.zip
脚本及转码表见附件。

:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::

:: gbk2utf8.cmd -V0.1 -- GBK & UTF8 编码互转

:: 无奈何@cn-dos.net - 2006-11-28 - CMD & GAWK

:: 用法：gbk2utf8 /I file...

:: 支持文件: - gawk.exe gbk2utf8.dat

:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::

@echo off

setlocal

set self="%~f0"

set AwkScript="%temp%\%~n0%~z0.awk"

set path=%path%;%~dp0;%cd%

set nofile=

set error=

set input=

::依赖文件完整性检查

for %%i in (gawk.exe gbk2utf8.dat) do (

@if "%%~$PATH:i" == "" (

echo.程序所依赖文件 "%%i" 缺失。

set nofile=1

) else ( set %%~ni="%%~$PATH:i" )

)

if defined nofile goto :EOF

::文件改动后更新脚本

if not exist %AwkScript% (

del /q "%temp%\%~n0*.awk" 2>nul

gawk "/^#<-1/,/^#>-1/{if(!/^#/)print}" %self% >%AwkScript%

)

:ParseLoop

if "%~1" == "" goto Start

if "%~1" == "?" goto SwitchH

if "%~1" == "/?" goto SwitchH

rem 参数处理并转到相应标签。

for %%s in (U u I i h H) do if "%~1"=="/%%s" goto Switch%%s

if "%F_input%" == "1" (

if not exist "%~1" set error=警告：文件 "%~1" 不存在。 & goto error

set input=%input% "%~1"

shift

goto ParseLoop

)

if "%F_input%" == "-1" shift & goto ParseLoop

set error=错误: 参数格式不正确 - "%1" !

goto error

:SwitchI

set F_input=1

if "%~2" == "-" set F_input=-1

shift

goto ParseLoop

:SwitchU

set F=-1

shift

goto ParseLoop

:error

echo.%error%

echo.

:SwitchH

echo.gbk2utf8 V0.1 -- GBK ^& UTF8 编码互转

echo.

echo.用法：1、%~n0

echo. 2、%~n0 /I file...

echo. 3、%~n0 /I -

echo.

echo.选项： /? 显示本简短帮助,等价命令 /H 。

echo. /U UTF8 转码为 GBK ，默认设置为 GBK 转码为 UTF8 。

echo. /I 指定转换文件，“-”号从标准输出获得。

echo. 本参数可以空缺，缺省将从标准输出获得。

echo. 指定转换文件时，/I 参数不可省略。

goto :EOF

:Start

if "%input%" == "" set F_input=-1

if "%F_input%" == "-1" (

gawk -v F=%F% -f %AwkScript%

) else (

gawk -v F=%F% -f %AwkScript% %input%

)

goto :EOF

:AwkScript

#<-1

function gbk2utf8(string,flag, reg, gbkreg, utf8reg, char, result){

gbkreg="|"

utf8reg="||\xe0||\xf0|"

reg=gbkreg

if (flag==-1)

reg=utf8reg

RLENGTH = 1

while(RLENGTH != -1){

match(string,reg)

char=substr(string,RSTART,RLENGTH)

if (RLENGTH>1)

char=charset

result=result char

string=substr(string,RSTART+RLENGTH)

}

return result

}

BEGIN {

FS=","

if (!F) F=1

if (F==1) {

while((getline<"gbk2utf8.dat") > 0)

charset=$2

}

else{

while((getline<"gbk2utf8.dat") > 0)

charset=$1

}

close("gbk2utf8.dat")

}

{

x=gbk2utf8($0,F)

print x

}

#>-1

goto :EOF

无奈何发表于 2006-11-30 01:02

Last edited by 无奈何 on 2006-11-30 at 02:04 PM ]

附件 1: gbk2utf8.zip (2006-11-30 14:06, 102.8 KiB, 下载附件所需积分 1 点 ,下载次数： 259)

　　☆开始\运行 (WIN+R)☆
%ComSpec% /cset,=何奈无──　。何奈可无是原，事奈无做人奈无&for,/l,%i,in,(22,-1,0)do,@call,set/p= %,:~%i,1%<nul&ping/n 1 127.1>nul

2006-11-30 00:31

查看资料发送邮件发短消息网志 OICQ

(105400208)