Board logo

标题: htm2txt的sed版应该如何来写? [打印本页]

作者: hello547rf44     时间: 2007-11-20 10:30    标题: htm2txt的sed版应该如何来写?

htm2txt的sed版应该如何来写?
作者: lxmxn     时间: 2007-11-20 14:22
# 移除大部分的HTML标签(包括跨行标签)
sed -e :a -e 's/<[^>]*>//g;/</N;//ba'

其它的自己添加...
作者: vkill     时间: 2007-11-20 21:42
不是有现成的吗?

HtoX32c.exe