Board logo

标题: sed 如何解析网页中的图片地址 [打印本页]

作者: ngd     时间: 2008-1-3 23:21    标题: sed 如何解析网页中的图片地址

不了解sed,只会使用替换、删除 参数
sed 如何解析网页中的图片地址
代码越简越好
用for有点麻烦
作者: lxmxn     时间: 2008-1-3 23:58
拿具体的源码来看看,具体情况具体对待。
作者: ngd     时间: 2008-1-4 00:03
curl www.baidu.com
就百度举个例子吧
作者: lxmxn     时间: 2008-1-4 10:42
只针对百度的这个页面解析
sed -n "s`.*\?\(http://.*\?\.gif\).*`\1`gp"

作者: ngd     时间: 2008-1-6 15:54
使用sed 处理  代码果然简洁
能否解释一下代码 新手入门 看不太懂
作者: ngd     时间: 2008-1-6 21:32

sed "/http/s/.*\(http:\/\/.*\.gif\).*/\1/;/^http:/!d"
[ Last edited by ngd on 2008-1-7 at 09:32 PM ]
作者: lxmxn     时间: 2008-1-6 22:35
兄都会自己写了,就不用解释了吧?
作者: ngd     时间: 2008-1-6 23:35
说实话,刚使用sed,看不懂兄台的代码
我想 多读源代码,多学些使用方法
还望达人多多指点,感激不尽
作者: lxmxn     时间: 2008-1-7 09:48


  Quote:
Originally posted by ngd at 2008-1-6 23:35:
说实话,刚使用sed,看不懂兄台的代码
我想 多读源代码,多学些使用方法
还望达人多多指点,感激不尽

参数-n表示默认不打印匹配模式,p命令接在s替换命令后面,表示只打印替换成功的结果。正则你应该不难理解了。
作者: ngd     时间: 2008-1-7 13:00
o(∩_∩)o... 多谢版主
难就难在正则表达式
http://www.cn-dos.net/forum/viewthread.php?tid=24206
作者: lxmxn     时间: 2008-1-7 13:31
呵呵,你把无奈何版主发的这个文章好好的看看就差不多啦。
作者: vkill     时间: 2008-1-7 19:41


  Quote:
Originally posted by lxmxn at 2008-1-7 13:31:
呵呵,你把无奈何版主发的这个文章好好的看看就差不多啦。

同一
作者: ngd     时间: 2008-1-7 21:28
刚解析一个文件 提取“”之间的url地址 用for无法将“作为分隔符
用了一下sed,果然很方便
sed -e "s/[^\x22]*\x22//;s/\x22.*//"
[ Last edited by ngd on 2008-1-7 at 09:30 PM ]