Originally posted by zyl910 at 2006-6-27 12:33 PM:
使用什么内码?
是否支持多国语言?
對 不 起 , 插 一 下 嘴 ...
最 基 本 的 希 望 有 繁 簡 體 , 因 為 只 得 簡 體 的 話 , 很 不 方 便 。
感觉现在要编浏览器的话必须使用Unicode。个人觉得UTF-8编码最好。
或者是使用政府推荐的GB18030-2000。
Unicode 是 好 , 但 在 DOS 直 接 輸 入 Unicode 是 否 有 困 難 ?
我 覺 得 使 用 GBK ( 是 否 等 於 18030 呢 ? ) 也 不 錯 , GBK 內 包 括 了 繁 體 , 必 要 是 把 BIG-5 通 過 查 表 法 轉 過 來 就 好 , 真 不 錯 !
还要注意多国语言支持:对于西方语言得支持拉丁文(U+0040 ~ U+024F),对于东亚汉字必须支持CJK基本集和CJK兼容集。因为现在许多网站是简体字、繁体字、日文混排,特别是输入法论坛和中文信息处理论坛(前段时间还听说某论坛准备升级,使其支持CJK扩充B,这样就支持7万汉字,方便古籍交流)。
1) BIG-5 + 日 文 ( 這 裡 只 BIG-5 內 碼 中 的 日 文 , 非 SHIFT-JIS )
2) GB2312 + 日 文 ( 同 上 )
3) Unicode
阿拉伯文的双向排版极其复杂、梵文的字符合并规则极其变态……这些语言暂时不需要考虑。
还要注意那些零碎的标点符号、数学符号、图形符号。比如 版权符©、商标符™ 等符号很常见。
十 分 同 意
小弟我现在在学习文本编码,感觉7位ASCII+GB2312那样单纯的年代已经过了,现在的文本编码极其复杂:GB18030居然敢提出4字节编码,260万编码空间,狂晕!
從 前 Apple]