前几天发过一个帖子求助汉字编码的问题。
----------------------------
大家知道,把下面这句代码中的空格去掉,帖到BBS上会变成汉字"我"。
&# 25105;
请问这个25105采用的是什么编码方式?
怎样在批处理中获取任意汉字的这种编码?
搜索了很久,没找到解决解决方案,望高人指点。
----------------------------
在slore兄的指点下知道了25105是汉字"我"的unicode编码,于是试着写了段VBS来批量转换汉字。
On Error Resume next
Set objFSO = CreateObject("Scripting.FileSystemObject")
Set objSrcFile = objFSO.OpenTextFile("C:\a.txt",1,True)
Set objDstFile = objFSO.OpenTextFile("C:\b.txt",2,True)
Do Until objSrcFile.AtEndOfStream
text = objSrcFile.Read(1)
if text <> "" then
char = AscW(text)
end if
if char = "13" then
objDstFile.Write ""
elseif char = 10 then
objDstFile.Write "<br>"
else
objDstFile.Write "&#"&char&";"
end if
Loop
objSrcFile.close
objDstFile.close
Set objSrcFile = nothing
Set objDstFile = nothing
set objFSO = nothing
测试用例a.txt
我在测试汉字的unicode编码
换行测试
把b.txt的内容贴到BBS上显示如下
我在测&#-29739;汉字的unicode编码<br>换&#-30644;测&#-29739;
大家可以看到,只要转换结果中有负值,贴到BBS上将无法正常显示汉字。请高人指点迷津。
Last edited by HAT on 2008-11-12 at 21:38 ]