Board logo

标题: 请教SED问题 [打印本页]

作者: terse     时间: 2008-7-20 16:53    标题: 请教SED问题

wget -q -O "test1.log" http://download.gna.org/grub4dos/
wget -q -O "test2.log"  http://nufans.net/grub4dos/
上面命令两log文件
@echo off
sed -e :a -e "s/<[^>]*>//g;/</N;//ba;/.zip/!d;s/$/\r/;s/^[ \t]*//" "test1.log">"列表1.log"
rem /.zip/!d 后缀.zip行
rem -e :a -e "s/<[^>]*>//g;/</N;//ba; 移除大部分的HTML标签(包括跨行标签)
rem s/^[ \t]*//;  将每一行前导的“空白字符”(空格,制表符)删除使之左对齐               
rem s/[ \t]*$//;  将每一行拖尾的“空白字符”(空格,制表符)删除
rem s/$/\r/ 换行吧
pause
test1.log 处理后会的到下面:
grub4dos-0.4.3-2007-03-10.zip                     10-Mar-2007 20:41   243k  
grub4dos-0.4.3-2007-03-16.zip                     16-Mar-2007 06:03   243k  
grub4dos-0.4.3-2007-03-20.zip                     20-Mar-2007 10:02   242k  
..............  
能否用同一命令使test2.log处理后的 列表2.log 和 列表1.log一样的格式
怎么用SED得到第一列呢? 我试着用 :a; s/\( .*\)*/\1/; ta 不行
请教了
作者: fastslz     时间: 2008-7-20 18:44
测试下可能要分2步才完成
sed "s/<A HREF/\n<A HREF/g" "test2.log">tmp.log
sed -e :a -e "s/<[^>]*>//g;/</N;//ba;/.zip/!d;s/$/\r/" "tmp.log">"列表2.log"
我之前写的Grub_Update用的是http://grub4dos.jot.com里的列表
最近很长一段时间这个连接已失效了
作者: fastslz     时间: 2008-7-20 18:54
http://nufans.net/grub4dos是Climbing创建的吧,看看Climbing私藏的东东
http://nufans.net/grub4dos/Climbing/
作者: terse     时间: 2008-7-20 22:15
谢fastslz兄  先用着吧
作者: lxmxn     时间: 2008-7-21 01:51

sed "s/<br>/\n/g; s/<[^>]*>//g;" test2.log | sed " /[0-9]:[0-9]/!d; s/^[ \t]*//; s/\(.*\) \([^ \t]*$\)/\2                                                         \1/;s/^\(.\{58\}\)[ ]*\([^ \t]*\)[ \t]*\([^ \t]*\)[ \t]*\([^ \t]*\)/\1 \2 \t\3 \t\4/"
test2.log 需要是ANSI编码才好在CMD下处理。

PS: 这个是目前写得最长的sed online code。