中国DOS联盟论坛

中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net  论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

游客:  注册 | 登录 | 命令行 | 搜索 | 上传 | 帮助 »
作者:
标题: 补充附件,不好意思! 上一主题 | 下一主题
junchen2
高级用户





积分 537
发帖 219
注册 2007-8-4
来自 杭州--半山
状态 离线
『楼 主』:  补充附件,不好意思!

刚才发不上来 更新了一点内容 echo today_mode ::1------------TW转贴-------------------------------------------------- ::www.mycould.com/discuz/forum-4 ... curl -A "Mozilla/5.0 (Windows; U; Windows NT 5.1)" "http://www.mycould.com/discuz/forum-479-1.html"|awk -F\042 "{if($0~/<font color.*遏肈<\/b><\/font>/){++i}};{if(i){if($0~/<em>.*typeid=.*<a href=\042thread.*\.html/){printf \"http://www.mycould.com/discuz/\"$6\"\t\"};if(/<em>2007-[0-9]+-[0-9]+<\/em>/){gsub(/[^\-0-9]/,\"\",$0);printf $0\"\t\"};if(/<td class=\042nums\042><strong>[0-9]+<\/strong> \/ <em>[0-9]+<\/em><\/td>/){a=$0;i=0;{while(i<3){i++;a=gensub(/[^0-9]+/,\" \",i,a)}};print a}}}" >twzt\indexzt.txt ::1---------------------------------------------------------------------------- awk "BEGIN{\"date /t\"|getline;da=gensub(/-0/,\"-\",\"g\",$1)};{if($2==da){system(\"curl \" $1);print $0>\"twzt\\oldzt.txt\"}}" twzt\indexzt.txt |more>twzt\today_view_mode_zt.html ping -n 2 127.1>nul ::1--------------------------------------------------------------------------== ::jpg_view_mode awk "/<h2>.*\[[0-9a-z]+\].*<\/h2>/,/20[0-1][0-9]-[0-9]+-[0-9]+ [0-9][0-9]:[0-9][0-9], 更Ω计:/" twzt\today_view_mode_zt.html|awk -F\042 "BEGIN{print \"^<meta http-equiv=\042Content-Type\042 content=\042text/html; charset=big5\042 /^>\"} ; {if($0~/^<img src=.*onclick=.*onload=/){++i;if(i>1){print \"^<a href=\042\"$2\"\042 target=\042_blank\042^>\"i\".jpg^</a^>\"}else{print}}else {if(/<a href=\042.+\042 +target=.+\.torrent<\/a>/){sub(/<a href=\042/,\"^&www.mycould.com/discuz/\");print} else {if($0~/20[0-1][0-9]-[0-9]+-[0-9]+ [0-9][0-9]:[0-9][0-9], 更Ω计:/){i=0};print}}}" >twzt\ok_today_zt.html ::由于TW的这个论坛编码为BIG5,所以在WEB 进行写入的时候加入了 代码,方便浏览器处理。 ::BEGIN{print \"^<meta http-equiv=\042Content-Type\042 content=\042text/html; charset=big5\042 /^>\"} ::####################################################################### ::2---------- tw原创区-------------------------------------------------------- :: www.mycould.com/discuz/forum-4 ... curl -A "Mozilla/5.0 (Windows; U; Windows NT 5.1)" "http://www.mycould.com/discuz/forum-478-1.html"|awk -F\042 "{if($0~/<font color.*產堕肈<\/b><\/font>/){++i}};{if(i){if($0~/<em>.*typeid=.*<a href=\042thread.*\.html/){printf \"http://www.mycould.com/discuz/\"$6\"\t\"};if(/<em>2007-[0-9]+-[0-9]+<\/em>/){gsub(/[^\-0-9]/,\"\",$0);printf $0\"\t\"};if(/<td class=\042nums\042><strong>[0-9]+<\/strong> \/ <em>[0-9]+<\/em><\/td>/){a=$0;i=0;{while(i<3){i++;a=gensub(/[^0-9]+/,\" \",i,a)}};print a}}}" |more>twyc\indexyc.txt ::2-------------------------------------------------------------------------- awk "BEGIN{\"date /t\"|getline;da=gensub(/-0/,\"-\",\"g\",$1)};{if($2==da){system(\"curl \" $1);print $0>\"twyc\\oldyc.txt\"}}" twyc\indexyc.txt >twyc\today_view_mode_yc.html ping -n 2 127.1>nul ::2----------------------------------------------------------------------- ::jpg_view_mode awk "/<h2>.*\[[0-9a-z]+\].*<\/h2>/,/20[0-1][0-9]-[0-9]+-[0-9]+ [0-9][0-9]:[0-9][0-9], 更Ω计:/" twyc\today_view_mode_yc.html|awk -F\042 "BEGIN{print \"^<meta http-equiv=\042Content-Type\042 content=\042text/html; charset=big5\042 /^>\"} ; {if($0~/^<img src=.*onclick=.*onload=/){++i;if(i>1){print \"^<a href=\042\"$2\"\042 target=\042_blank\042^>\"i\".jpg^</a^>\"}else{print}}else {if(/<a href=\042.+\042 +target=.+\.torrent<\/a>/){sub(/<a href=\042/,\"^&www.mycould.com/discuz/\");print} else {if($0~/20[0-1][0-9]-[0-9]+-[0-9]+ [0-9][0-9]:[0-9][0-9], 更Ω计:/){i=0};print}}}" >twyc\ok_today_yc.html ::2-------------------------------------------------------------------------- ::####################################################################### ::3--------------草柳社区--------------------------------------------------- curl -A "Mozilla/5.0 (Windows; U; Windows NT 5.1)" "http://c2088.yi.org/~mod07/thread.php?fid=2"|awk -F\042 "{if($0~/<td colspan.*style=\042border-top:.*普通主題<\/td>/){++i}};{if(i){if($0~/<h3><a href=\042readhtm/){printf \"http://c2088.yi.org/~mod07/\"$2\"\t\"};if(/<div class=\042f10\042>2007-[0-9][0-9]-[0-9][0-9]<\/div>/){gsub(/[^\-0-9]/,\"\",$3);printf $3\"\t\"};if ($0~/<td class=\042tal f10 y-style\042>[0-9]+<\/td>/){gsub(/[^0-9]/,\"\",$3);print $3}}}" |more>caoliu\indexcl.txt ::3----------------------------------------------------------------- awk "BEGIN{\"date /t\"|getline;datet=$1};{if($2==datet){system(\"curl \" $1);print $0>>\"caoliu\\oldyc.txt\"}}" caoliu\indexcl.txt >caoliu\today_view_mode_cl.html ::3-^----------torrent_view_mode (2)------today_torrent_viewing awk "/<tr><td class=\042h\042>.*<b>本頁主題:<\/b>/,/回 樓主.*的帖子/" caoliu\today_view_mode_cl.html|awk -F"<br>" "{if($0~/<br \/><div class=\042tpc_content.*src.*.*torrent.*/){ for (i=1;i<=NF;i++){if($i~/\.jpg/){++b;if(b>1){sub(/<img src='/,\"\",$i);sub(/'.*/,\"\",$i);print \"^<a href=\042\"$i\"\042 target=\042_blank\042^>\"b\".jpg^</a^>\"} else {print $i}}else{print $i}}}else{if($0~/回 樓主.*的帖子/){b=0};print}}"|more>caoliu\ok_today_cl.html ::---------------------------------open_web with torrent twzt\ok_today_zt.html pause twyc\ok_today_yc.html pause caoliu\ok_today_cl.html [ Last edited by junchen2 on 2008-1-19 at 12:51 AM ]


2008-1-19 00:49
查看资料  发送邮件  发短消息  网志   编辑帖子  回复  引用回复
junchen2
高级用户





积分 537
发帖 219
注册 2007-8-4
来自 杭州--半山
状态 离线
『第 2 楼』:  

需要curl awk(我的是gawk被我改成了awk) 最好创建以下3个文件夹 twzt caoliu twyc 这个脚本下载有三种模式。 1,更新模式 2,选择人气高的种子下载模式 3,当天的模式(这个是我现在发的) 这是我一个半月前写的,最近我的ip被我下载的论坛屏蔽了,好可怜。


2008-1-19 00:55
查看资料  发送邮件  发短消息  网志   编辑帖子  回复  引用回复

请注意:您目前尚未注册或登录,请您注册登录以使用论坛的各项功能,例如发表和回复帖子等。


可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题



论坛跳转: