Board logo

标题: 过滤出EMAIL 地址 『已结』 [打印本页]

作者: uiopuiop     时间: 2009-5-14 01:45    标题: 过滤出EMAIL 地址 『已结』
需要从一个文本文件里过滤出EMAIL 地址,但碰到点问题。

(work@home you can visit www.test.com)并不是我想要的EMAIL地址。希望能用纯批处理来实现这个功能,谢谢!

C:\temp>findstr "@." test.txt
work@home you can visit www.test.com
afdf@test.com
test2@test2.com
zzd@tests.com
badbu@test.com.cn


文本如下:(email 两边或许会有些空格或TAB,前N行有些乱七八糟的文字)
luan ti ba zao de wen zi
work@home you can visit www.test.com
afdf@test.com
test2@test2.com
zzd@tests.com
badbu@test.com.cn

Last edited by uiopuiop on 2009-5-17 at 10:25 ]

作者: yishanju     时间: 2009-5-14 04:40
用FR 才是王道

type a.txt|fr -ric:"*(*@.*)*" -t:"\1"

没有测试过,代码可能不对

FR 下载http://baiy.cn/utils/fr/index.htm

Last edited by yishanju on 2009-5-14 at 04:50 ]

作者: uiopuiop     时间: 2009-5-14 11:24
纯批处理不能做吗?

作者: everest79     时间: 2009-5-14 15:09

//var a=WScript.Arguments;if (a.Length > 0) WScript.Echo(a(0).match(/\w+@\w+\.\w+/));
var a=WScript.Arguments;
if (a.Length > 0){
var f=new ActiveXObject("Scripting.FileSystemObject");
var u=f.OpenTextFile(a(0).replace(/\\/g,"\\\\"),1).ReadAll().match(/\w+@\w+\.\w+/g);
//WScript.Echo(u);
for (i=0;i<u.length;i++)WScript.Echo(u);
}



cscript my.js 1.txt

作者: uiopuiop     时间: 2009-5-14 23:42
多谢各位,但是我还是希望能用纯批处理来实现这个功能,谢谢!

作者: everest79     时间: 2009-5-15 03:49

@echo off
for /f "delims=" %%a in (b.txt) do (
echo %%a|findstr "*@*\.*" >nul&&set/ac+=1&&call :replace "%%a" %%c%%
)
set new
pause
goto :eof

:replace
set x=0
set src=%~1
set tmp=%src:*@=%
call set src=%%src:%tmp%=%%
for %%i in (%src%) do set tmp=%%i%tmp%
for %%i in (%tmp%) do set/ax+=1,1/(1/x)2>nul&&echo %%i&&set dst=%%i
set newmail%~2=%dst%
goto :eof

纯批的,不容错

作者: uiopuiop     时间: 2009-5-15 07:26    标题: 楼上你好!
不容错?什么意思?

高手!果然管用,但我没看懂你是如何把 空格,TAB 都给去掉的?

set/ax+=1,1/(1/x)2 何意 ?

set new 这个变量什么地方冒出来的?

Last edited by uiopuiop on 2009-5-15 at 10:58 ]

作者: everest79     时间: 2009-5-16 06:21
是使用set替换字符串时的通配方法,将你原来的字符串自"@"符号分成两部分
例如
badbu@test.com.cn
就分成了
badbu

@test.com.cn
然后使用for按空格分割输出,第一个字符串,保留最后一个
第二个字符串保留第一个
set /a x+=1,1/(1/x)&&echo %%i就是用来判断是不是第一个

set new是显示以new打头的变量
这些变量是
set newmail%~2=%dst%
来定义的

作者: uiopuiop     时间: 2009-5-16 11:07
Originally posted by everest79 at 2009-5-16 06:21 AM:
是使用set替换字符串时的通配方法,将你原来的字符串自"@"符号分成两部分
例如
badbu@test.com.cn
就分成了
ba ...



多谢啊,学习了。。。

用空格分隔,但你又是如何吧TAB去掉的?

作者: everest79     时间: 2009-5-17 07:42
你可以关掉回量,只输入一行文本来仔细观察下

作者: yangfengoo     时间: 2009-5-17 09:15
学习了.讲得很好.可惜我不能评分..