Board logo

标题: 把一些不要的代码删掉 [打印本页]

作者: flyingphf     时间: 2008-3-31 13:11    标题: 把一些不要的代码删掉
面料:涤棉<BR></STRONG></FONT><FONT style="BACKGROUND-COLOR
颜色:白色、粉色、绿色、深灰<BR></FONT></STRONG></FONT>
尺寸:均码胸围86以内,裙长83,腰围2尺1以内</FONT></STRONG></FONT>
尺寸:125cm</FONT></STRONG></FONT>
可不可以把这些网页代码整理一下,变为
面料:涤棉
颜色:白色、粉色、绿色、深灰
尺寸:均码胸围86以内,裙长83,腰围2尺1以内
尺寸:125cm

谢谢了

作者: abcd     时间: 2008-3-31 13:33
sed "/</ s/<.*//g" a.txt

作者: balinger     时间: 2008-3-31 13:56
for /f "tokens=1,* delims=<" %%a in (a.txt) do (echo %%a)>>b.txt

作者: Climbing     时间: 2008-3-31 16:24
还是sed比较强劲:
sed "s/<.*//g" a.txt

不过,上面的命令会将夹在html标签中间的文字去掉,例如:
面料:涤棉<BR>纯棉<BR>...

其中的“纯棉”会消失。

Last edited by Climbing on 2008-3-31 at 06:25 PM ]

作者: flyingphf     时间: 2008-3-31 17:45
谢谢了