因为各个字符集并非出自同一组织,所以相互之间是交集的关系,大多数字符集包含ASCII,而Unicode包含所有的字符集。
Windows XP把所有的文件名存储为Unicode,所以能在文件名里看见这些字符。
而在中文版Windows XP中的命令行cmd.exe默认以GBK编码运行(就是cp936),所以那些在GBK编码中没有的字符就看不到。
可以正常处理 Unicode 编码的纯文本编辑器,如果没有以unicode编码打开,就无法保存那些字符集中没有的字符。
我们可以看看楼主所找出的都是些什么字符:
打开记事本,将那6个字符复制上去,且一行一个,
文件->另存为->编码:Unicode big endian,文件名:c:\ch.txt
然后打开命令行,运行:
echo d 100 l 22 | debug c:\ch.txt
这条命令查看ch.txt的16进制格式,结果类似于:
-d 100 l 22
0B67:0100 FE FF 30 FB 00 0D 00 0A-00 B7 00 0D 00 0A FF 62 ..0............b
0B67:0110 00 0D 00 0A FF 63 00 0D-00 0A 30 0C 00 0D 00 0A .....c....0.....
0B67:0120 30 0D 0.
然后开始 -> 附件 -> 系统工具 -> 字符映射表
字体选Arial Unicode MS,选中下方“高级查看”,字符集:Unicode,分组:全部
在“转到Unicode”框里填上面红色的四个字符(如30FB),
就找到了该字符,并在最下方有该字符的名字,这6个字符依次是:
片假名中间点
中间点
半形左角括号
半形右角括号
左角括号
右角括号
Last edited by tigerpower on 2008-9-16 at 08:35 PM ]