Board logo

标题: 如何验证输入的字符串包含双字节字符 [打印本页]

作者: everest79     时间: 2008-1-4 20:20    标题: 如何验证输入的字符串包含双字节字符

rt。再扩展一下,如何查找识别文本中的内容为中文
作者: everest79     时间: 2008-1-4 20:28
这个问题我研究了一年,不信搜我第一个贴子,嘿嘿
作者: lxmxn     时间: 2008-1-4 20:34
o_O

要求纯批处理么?

[ Last edited by lxmxn on 2008-1-4 at 08:36 PM ]
作者: zh159     时间: 2008-1-4 20:45
先用字符截取单个字符,再用你的(echo string&echo.)|findstr /o ".*"判断是否是两个字节
(用字符截取判断字符个数,再用(echo string&echo.)|findstr /o ".*"判断字节数,如果相等,则没有包含双字节字符)

input:中文
4


input:English
7


input:中文+English
12

作者: zh159     时间: 2008-1-4 20:56

@echo off
set/p input=输入:
set str=%input%

:loop
set str=%str:~1%
set/a n+=1
if not "%str%" == "" goto loop

for /f "skip=1 delims=:" %%i in ('^(echo "%input%"^&echo.^)^|findstr /o ".*"') do set/a l=%%i-5
if %n% == %l% (
  echo 字符串 %input% 不包含双字节字符
) else (
  echo 字符串 %input% 包含双字节字符
)
pause>nul
exit
[ Last edited by zh159 on 2008-1-4 at 08:58 PM ]
作者: everest79     时间: 2008-1-4 21:16
zh159
嘿嘿,findstr的o参数也是我研究这个才发现的,不过这样子代码就显得太长了一点,所以想问问有没有别的方法
lxmxn
若是有简单一点的VBS脚本也可以
作者: HAT     时间: 2008-1-4 21:57
很久以前斑竹教过我们一个方法:

  Quote:
读取第一个数字后,首先用批处理判断是不是空格,若不为空格,则通过:
echo %x%>3.txt 然后读取 3.txt 的文件大小是一个字节还是两个字节来判断是不是汉字。

现在又有了findstr /o的方法

期待更简介的方法^_^
作者: junchen2     时间: 2008-1-4 23:13
echo 望大师,傅.看见fdg|awk "{a=gsub(/[\x80-\xff]/,\"\");print a/2\"个汉子\"}"

6个汉子
作者: zh159     时间: 2008-1-5 00:16


  Quote:
Originally posted by everest79 at 2008-1-4 21:16:
zh159
嘿嘿,findstr的o参数也是我研究这个才发现的,不过这样子代码就显得太长了一点,所以想问问有没有别的方法
lxmxn
若是有简单一点的VBS脚本也可以

VBS脚本也简单不了多少:
@echo off
set/p input=:

>ascw.vbs echo Wscript.echo ascw(wscript.arguments(0))

for /f %%i in ('"cscript //nologo ascw.vbs %input%"') do (
  if %%i leq 255 (
    echo %input% 不是双字节字符
  ) else (
    echo %input% 是双字节字符
  )
)
pause

作者: lxmxn     时间: 2008-1-5 00:59
To zh159:
这个情况输入哪个呢?

  Quote:
:ok我
ok我 不是双字节字符
请按任意键继续. . .


作者: zh159     时间: 2008-1-5 01:11
ascw只能一个个字符处理,要判断整句得用另外的语句配合了
所以我 9 楼只写“不是双字节字符、是双字节字符”,而不写“包不包含双字节字符”
作者: zh159     时间: 2008-1-5 01:21
判断字符串的:
@echo off
set/p input=:

>ascw.vbs echo str=wscript.arguments(0):result="不":for i=1 to len(str):if ascw(mid(str,i,1))^>255 then:result="":exit for:end if:next:Wscript.echo result^&"包含双字节字符"

for /f %%i in ('"cscript //nologo ascw.vbs %input%"') do echo %input% %%i
pause

作者: electronixtar     时间: 2008-1-5 17:49
http://www.google.com/search?hl= ... +%E4%B8%AD%E6%96%87
作者: zh159     时间: 2008-1-5 20:17
VBS可用正则判断字符类型,不过我还不会-_-|||
作者: everest79     时间: 2008-1-5 20:22
有没有完整点的,只是一句我是没办法照猫画虎
作者: qzwqzw     时间: 2008-1-5 21:40

:: isDBCS.cmd - 检查参数中是否含有多字节字符
:: qzwqzw@www.cn-dos.net  - 2008-01-05 21:18

@echo off & setlocal EnableDelayedExpansion
set strInput=%*------------------------------
set strInput=%strInput:~0,30%
echo %strInput%> "%temp%\_isDBCS.tmp"
for %%f in ("%temp%\_isDBCS.tmp?") do (
    if "%%~zf"=="32" (echo 参数 %* 中不含多字节字符
    ) else (          echo 参数  %* 中含多字节字符 )
    del "%%~f"
)
pause