Board logo

标题: [已结]VBS批量转换汉字unicode编码 [打印本页]

作者: HAT     时间: 2007-8-24 17:20    标题: [已结]VBS批量转换汉字unicode编码
前几天发过一个帖子求助汉字编码的问题。
----------------------------
大家知道,把下面这句代码中的空格去掉,帖到BBS上会变成汉字"我"。
&# 25105;

请问这个25105采用的是什么编码方式?
怎样在批处理中获取任意汉字的这种编码?
搜索了很久,没找到解决解决方案,望高人指点。
----------------------------
在slore兄的指点下知道了25105是汉字"我"的unicode编码,于是试着写了段VBS来批量转换汉字。
On Error Resume next

Set objFSO = CreateObject("Scripting.FileSystemObject")
Set objSrcFile = objFSO.OpenTextFile("C:\a.txt",1,True)
Set objDstFile = objFSO.OpenTextFile("C:\b.txt",2,True)

Do Until objSrcFile.AtEndOfStream
text = objSrcFile.Read(1)
if text <> "" then
char = AscW(text)
end if
if char = "13" then
objDstFile.Write ""
elseif char = 10 then
objDstFile.Write "<br>"
else
objDstFile.Write "&#"&char&";"
end if
Loop

objSrcFile.close
objDstFile.close
Set objSrcFile = nothing
Set objDstFile = nothing
set objFSO = nothing

测试用例a.txt
我在测试汉字的unicode编码
换行测试

把b.txt的内容贴到BBS上显示如下
我在测&#-29739;汉字的uni&#99;ode编码<br>换&#-30644;测&#-29739;

大家可以看到,只要转换结果中有负值,贴到BBS上将无法正常显示汉字。请高人指点迷津。

Last edited by HAT on 2008-11-12 at 21:38 ]

作者: slore     时间: 2007-8-24 17:44

'On Error Resume next

Set objFSO = CreateObject("Scripting.FileSystemObject")
Set objSrcFile = objFSO.OpenTextFile("C:\a.txt",1,True)
Set objDstFile = objFSO.OpenTextFile("C:\b.txt",2,True)

Do Until objSrcFile.AtEndOfStream
text = objSrcFile.Read(1)
If text <> "" Then
char = AscW(text)
End If
If
char < 0 Then char = char + 65536
If Len(char) < 3 Then char = "0" & char
If char = "013" Then
'objDstFile.Write ""
ElseIf char = "010" Then
objDstFile.Write "<br>"
Else
objDstFile.Write "&#" & char & ";"
End If
Loop

objSrcFile.Close
objDstFile.Close

Set
objSrcFile = Nothing
Set
objDstFile = Nothing
Set
objFSO = Nothing

结果:
我在测试汉字的unicode编码<br>换行测试

作者: HAT     时间: 2007-8-27 14:38
多谢slore兄
加分

有一点疑惑:
为何对回车换行符的处理要转换成013和010呢?直接用13和10来处理的话会有什么问题呢?
初学VBS,望指教。

作者: slore     时间: 2007-8-27 16:00
If Len(char) < 3 Then char = "0" & char
你没有发现你的unicode的c没有显示出来? c是99

没有正确的显示出来……所以我再小于3位的补了0,所以下面的相应的要
"013","010"……

作者: HAT     时间: 2007-8-27 21:42
//你没有发现你的unicode的c没有显示出来? c是99没有正确的显示出来……所以我再小于3位的补了0

哦,原来如此,多谢了。
我在其他BBS测试的时候没有发现这个问题,可能每个BBS的处理不太一样吧。
再次感谢。