Board logo

标题: [求助]如何得到文本中的特殊字符 [打印本页]

作者: piliskys     时间: 2007-9-20 17:08    标题: [求助]如何得到文本中的特殊字符
有文本如下
<td bgcolor="#F1F1F1" align="left" width="70%"><font face="verdana, arial, helvetica" size="2" > 投票: <a href="851747.html"><font color=red><b></b></font> 2007年度会员交流与服务大版最佳斑竹初选投票:30-&gt;10</a></font> <font face="verdana,arial,helvetica" size="1" > ( <img src="images/multipage.gif" border="0" alt="">  <a href="851747,1.html">1</a>  <a href="851747,2.html">2</a>  <a href="851747,3.html">3</a>  <a href="851747,4.html">4</a>  ... <a href="showthread.php?s=&threadid=851747&goto=lastpost">Last page</a> )</font></td>
<td bgcolor="#F1F1F1" align="left" width="70%"><font face="verdana, arial, helvetica" size="2" > <a href="854365.html"> 一周午饭菜谱</a></font> <font face="verdana,arial,helvetica" size="1" > ( <img src="images/multipage.gif" border="0" alt=""> <a href="854365,1.html">1</a> <a href="854365,2.html">2</a> <a href="854365,3.html">3</a> <a href="854365,4.html">4</a> ... <a href="showthread.php?s=&threadid=854365&goto=lastpost">Last page</a> )</font></td>
<td bgcolor="#F1F1F1" align="left" width="70%"><font face="verdana, arial, helvetica" size="2" > <img src="images/paperclip.gif" alt="8 附件" border="0" align="absmiddle"><a href="557858.html"><font color=FF0000><b></b></font> 明朝的那些事儿</a></font> <font face="verdana,arial,helvetica" size="1" > ( <img src="images/multipage.gif" border="0" alt=""> <a href="557858,1.html">1</a> <a href="557858,2.html">2</a> <a href="557858,3.html">3</a> <a href="557858,4.html">4</a> ... <a href="showthread.php?s=&threadid=557858&goto=lastpost">Last page</a> )</font></td>

上面只列出三行,如何得到上面的851747.html,854365.html,557858.html及html">后面与</a>之间的内容
比如第一行为
<font color=red><b></b></font> 2007年度会员交流与服务大版最佳斑竹初选投票:30-&gt;10

第二行为
 一周午饭菜谱

第三行为
 <font color=FF0000><b></b></font> 明朝的那些事儿

看了里面的好多帖了,还是不会,
上面的三行得到的结果用两变量分量表示其内容,谢谢!

作者: lxmxn     时间: 2007-9-20 17:48
试试sed:
sed "s:</a>.*::" dos1.txt | sed "s:.*<a href=\"\(\+\.html\)\">\(.*\):\1\t\2:"

作者: piliskys     时间: 2007-9-20 18:01
为什么报
'sed' 不是内部或外部命令,也不是可运行的程序

作者: knoppix7     时间: 2007-9-20 18:06
SED乃外部命令,需要LS自己下载一个

作者: lxmxn     时间: 2007-9-20 18:06
作者: piliskys     时间: 2007-9-21 12:02
谢谢各位,对这种命令实在是不懂啊,
要把这二变量写入另一文件该怎么做
再次谢谢

作者: wudixin96     时间: 2007-9-21 12:13
LS是说把sed修改好后的内容写入到另外一个文件里吗?

和P的一样的,用>>。

作者: piliskys     时间: 2007-9-21 12:50
哪位帮我写下好吗,就上面那语句,这方面我实在是菜鸟一个

作者: lxmxn     时间: 2007-9-21 13:06
汗一个 有时间多看看批处理的基础教程.
sed "s:</a>.*::" oldfile.txt | sed "s:.*<a href=\"\(\+\.html\)\">\(.*\):\1\t\2:" | more >newfile.txt

作者: piliskys     时间: 2007-9-21 14:00
谢谢!