Board logo

标题: 请教SED问题 [打印本页]

作者: terse     时间: 2008-7-20 16:53    标题: 请教SED问题

wget -q -O "test1.log" http://download.gna.org/grub4dos/ wget -q -O "test2.log" http://nufans.net/grub4dos/ 上面命令两log文件
@echo off
sed -e :a -e "s/<[^>]*>//g;/</N;//ba;/.zip/!d;s/$/\r/;s/^[ \t]*//" "test1.log">"列表1.log"
rem /.zip/!d 后缀.zip行
rem -e :a -e "s/<[^>]*>//g;/</N;//ba; 移除大部分的HTML标签(包括跨行标签)
rem s/^[ \t]*//;  将每一行前导的“空白字符”(空格,制表符)删除使之左对齐                
rem s/[ \t]*$//;  将每一行拖尾的“空白字符”(空格,制表符)删除 
rem s/$/\r/ 换行吧
pause
test1.log 处理后会的到下面:
grub4dos-0.4.3-2007-03-10.zip                     10-Mar-2007 20:41   243k  
grub4dos-0.4.3-2007-03-16.zip                     16-Mar-2007 06:03   243k  
grub4dos-0.4.3-2007-03-20.zip                     20-Mar-2007 10:02   242k  
..............  
能否用同一命令使test2.log处理后的 列表2.log 和 列表1.log一样的格式 怎么用SED得到第一列呢? 我试着用 :a; s/\( .*\)*/\1/; ta 不行 请教了

作者: fastslz     时间: 2008-7-20 18:44
测试下可能要分2步才完成
sed "s/<A HREF/\n<A HREF/g" "test2.log">tmp.log
sed -e :a -e "s/<[^>]*>//g;/</N;//ba;/.zip/!d;s/$/\r/" "tmp.log">"列表2.log"
我之前写的Grub_Update用的是http://grub4dos.jot.com里的列表 最近很长一段时间这个连接已失效了

作者: fastslz     时间: 2008-7-20 18:54
nufans.net/grub4dos是Climbing创建的吧,看看Climbing私藏的东东 nufans.net/grub4dos/ ...

作者: terse     时间: 2008-7-20 22:15
谢fastslz兄 先用着吧

作者: lxmxn     时间: 2008-7-21 01:51
sed "s/<br>/\n/g; s/<[^>]*>//g;" test2.log | sed " /[0-9]:[0-9]/!d; s/^[ \t]*//; s/\(.*\) \([^ \t]*$\)/\2                                                         \1/;s/^\(.\{58\}\)[ ]*\([^ \t]*\)[ \t]*\([^ \t]*\)[ \t]*\([^ \t]*\)/\1 \2 \t\3 \t\4/"
test2.log 需要是ANSI编码才好在CMD下处理。 PS: 这个是目前写得最长的sed online code。