Board logo

标题: 求助 wget或curl 抓取特殊网页 [打印本页]

作者: sady2009     时间: 2010-3-2 09:46    标题: 求助 wget或curl 抓取特殊网页

想抓取下边这个地址中的某天节目预告.

例如: 2010-03-05日上午节目表

http://www.studytv.cn/Program/Schedule.aspx

用wget或curl 可以做到吗? 如何构建参数呢? 请高手指教,谢谢.
作者: lotus516     时间: 2010-3-2 12:05
用你说的工具,下下来分析关键字就可以了!
作者: sady2009     时间: 2010-3-2 16:19
谢谢回复,
我不是随便就发问的人,实际上
wget 和curl 教程都看过N遍了.也试过记不清多少次了,还是没有成功.

具体来说是:
wget -O 中学生.html --post-data=提交参数 http://www.studytv.cn/Program/Schedule.aspx

难点是提交参数如果构建.
网页部分源代码如下:
<div class="select_date">
                        选择日期<input name="ctl00$ContentPlaceHolder1$txtDate" type="text" value="2010/3/2" onchange="javascript:setTimeout('__doPostBack(\'ctl00$ContentPlaceHolder1$txtDate\',\'\')', 0)" onkeypress="if (WebForm_TextBoxKeyHandler(event) == false) return false;" id="ctl00_ContentPlaceHolder1_txtDate" style="width:100px;" />
                        <input type="image" name="ctl00$ContentPlaceHolder1$Image1" id="ctl00_ContentPlaceHolder1_Image1" src="../Library/Image/Calendar_scheduleHS.png" alt="Click to show calendar" style="height:16px;width:16px;border-width:0px;" />
                        
                        
                        <input type="submit" name="ctl00$ContentPlaceHolder1$butPeriod_2" value="上午(8:00-11:59)" id="ctl00_ContentPlaceHolder1_butPeriod_2" class="btn" />
                        <input type="submit" name="ctl00$ContentPlaceHolder1$butPeriod_3" value="下午(12:00-17:59)" id="ctl00_ContentPlaceHolder1_butPeriod_3" class="btn" />
                        <input type="submit" name="ctl00$ContentPlaceHolder1$butPeriod_4" value="晚上(18:00-23:59)" id="ctl00_ContentPlaceHolder1_butPeriod_4" class="btn" />
                    </div>
请帮忙分析一下. 如果我要抓取2010-3-5 上午 这个页面.--post-data= 后边的提交参数该如何写呢?

如果wget 或curl 做不到.还有其他方法吗? 比如vbs. js等也可以.本人只会一点bat. 请不吝赐教.谢谢

[ Last edited by sady2009 on 2010-3-2 at 17:00 ]
作者: sady2009     时间: 2010-3-3 16:43
有高手帮忙吗? 看来不好弄哦.