标题: [请教]检测系统log存活以及有无关键字
[打印本页]
作者: win007
时间: 2008-12-24 17:50
标题: [请教]检测系统log存活以及有无关键字
1.首先,有个问题用什么办法判定log 3分钟有没有进行记录,因为上次通过检验文件修改时间的
方法,由于系统本身有自动启动的功能,而自动启动以后,虽然log中有写入内容,但是log的修改
时间并没有改变(原因不得而知),所以请教有无其他办法或者知道这个的原因,能判定log有无
内容写入,从而判定系统是否存活。
2.系统运行时候有产生log,3分钟一次,若产生failed,error,exception,warning就会发出警告信
息 如:SYSTEM HAS failed/error/exception/warning
作者: exzzz
时间: 2008-12-24 18:11
如果是想判断远程计算机是否存活,你不如在远程机器上架个简单的FTP或IIS,在自己机器上定时telnet上去然后看看本地日志,通过本地日志看是否存活。
如果是想看自己的机器是否存活,那。。。。。如果机器挂了,那你这监控程序也没用啊。难道重启了再判断??那你可以定时写入时间嘛,通过判断时间差距来判断上一次日志到本次日志之间系统是否挂了。
我觉得问题在于:你没有把问题所在的环境描述清楚。。。
Last edited by exzzz on 2008-12-24 at 18:12 ]
作者: win007
时间: 2008-12-24 18:38
标题: [请教]检测系统log存活以及有无关键字
我想了解是一个系统的存活,并不是操作系统,应该不是你说的机器的存活吧!这个系统应该是在本机上的,我是通过任务计划来定时判断的,因为已经用过判定上次日志记录,文件修改的时间和本次日志记录,文件修改的时间差距的方法了,但是问题在于因为这个系统有自动重起的功能,然后等到重起以后再次写入日志后,日志文件的修改时间并没有变化,依然停留在系统重起的时间,这也是我搞不懂的原因!现在想问有其他方法来判定日志是否写入,从而判定该系统是否存活,第二步,我想问通过搜索关键字,来进行警报,问题在于log 3分钟记录一次,若本次log出现关键字,则警报,下个3分钟不出现关键字,就算前几次都出现,也不发警报。
作者: HAT
时间: 2008-12-24 19:00
请把上次那个帖子链接更新到顶楼,以方便他人了解事情的来龙去脉。
作者: exzzz
时间: 2008-12-24 20:06
日志发生变化后,如果大小变化了,可以判定系统产生了变动,可以对它进行分析。
如果日志是固定大小的,可以考虑用findstr 定时在日志中查询某个关键词的数量并计数,若数量发生变化就报警,应该是可以的吧?
把你的日志文件贴上来,这样才能帮到你
Last edited by exzzz on 2008-12-24 at 20:09 ]
作者: win007
时间: 2008-12-25 10:25
我先研究下,可以参考我更新过的 帖子 了解上次的算法
[已结]检测系统存活的程式
作者: win007
时间: 2009-1-7 15:49
经过研究,log大于1000K,会自动重新刷新一版,旧版就保存在同文件夹下,而monitor.bat是一直关注最新一版的log。这就产生个问题--如果用计算“error等关键字个数的方法就没有办法准确来确定log当时是否error,无论本次的error个数大于,还是小于上次error的个数,都不能确定系统是否报error
比如:1.前后都检查同一个log中的error:(1).Cur_error_count>last_error_count 有error
(2).Cur_error_count=last_error_count>0 有error
总结:0<last_error_count=<Cur_error_count 有error
2.前后检查不同的log中的error:
(1).Cur_error_count>last_error_count 有error
(2).0<Cur_error_count<last_error_count 有error
(3).0<Cur_error_count=last_error_count 有error
总结:0<Cur_error_count=<last_error_count 有error
Cur_error_count>last_error_count 有error
这样就不能有个数的方法来判断,请哪为高手帮帮忙啊!
作者: win007
时间: 2009-1-7 15:52
作者: win007
时间: 2009-1-8 23:59
哪位高手解答下啊~
作者: slore
时间: 2009-1-9 00:23
fc.exe
作者: win007
时间: 2009-1-9 18:38
楼上的仁兄,能不能说的详细点啊~
作者: win007
时间: 2009-1-11 23:30
高手解答下啊 万分求救呀
作者: slore
时间: 2009-1-12 00:39
定时复制一个副本
fc.exe /b a.log b.log
检测%errorlevel%可以比较出有没有差异
作者: win007
时间: 2009-1-12 20:45
不会啊,能不能提供代码,我是菜鸟,万分感谢
作者: slore
时间: 2009-1-12 22:00
copy a.log b.log
等待3分钟
fc.exe /B a.log b.log
echo %errorlevel%
自己看吧。
Last edited by slore on 2009-1-12 at 22:01 ]
作者: win007
时间: 2009-1-12 22:04
LS的高手,我是想了解log是否有新的error
作者: win007
时间: 2009-1-13 11:32
这是log可能产生的几种状况,高手指教下
1.出现warn的状况:no comments可以为产生WARN的reason:
130000 [2009-01-07 14:35:24,754] WARN com.1234.system.12 - no comments
2.出现Error的状况:Error in Reason:产生error的reason
40144274 [2009-01-05 11:09:07,547] DEBUG com.1234.system.12 - Domain: XXX.XXXXXX
40144274 [2009-01-05 11:09:07,547] DEBUG com.1234.system.12 - User: user
40144274 [2009-01-05 11:09:07,547] DEBUG com.1234.system.12 - Passwd: 123123
40144274 [2009-01-05 11:09:07,547] DEBUG com.1234.BsLg.RemFutHoldBL - TimeOut: 15
40144274 [2009-01-05 11:09:07,547] DEBUG com.1234.BsLg.RemFutHoldBL - Setting TP time out...
40144274 [2009-01-05 11:09:07,547] DEBUG com.1234.BsLg.RemFutHoldBL - dTranTimeOut : 15.0
40144274 [2009-01-05 11:09:07,547] DEBUG com.1234.BsLg.RemFutHoldBL - Validating the request message format which has
nested structure for basic tag...
40144274 [2009-01-05 11:09:07,547] INFO com.1234.123456.systemAdapter - Result message:<?xml version="1.0"
encoding="UTF-8"?><RemFutHoldResult
xmlns="http://www.1234.com.tw/api/xml/RemFutHoldResult"><Lot><RetCode>12345678</RetCode><FabCode>12</FabCode><RetMsg>Error in
Reason:XX:XXXXX,XXXXXXX, XXXXXXXXXXXXXXXXXXXXXXX.(regno:XXXX)
3.系统正常处于wait状态的状况:
191063 [2009-01-12 00:03:13,949] INFO com.1234.message.MessageService - Receiving wait...1
191391 [2009-01-12 00:03:14,277] INFO com.1234.message.MessageService - Receive from
queue(queue://123456789/123456.12345.REQUEST?CCSID=950)
380891 [2009-01-12 00:06:23,777] INFO com.1234.message.MessageService - Receiving wait...2
381063 [2009-01-12 00:06:23,949] INFO com.1234.message.MessageService - Receive from
queue(queue://123456789/123456.12345.REQUEST?CCSID=950)
570000 [2009-01-12 00:09:32,886] INFO com.1234.message.MessageService - Receiving wait...3
570329 [2009-01-12 00:09:33,215] INFO com.1234.message.MessageService - Receive from
queue(queue://123456789/123456.12345.REQUEST?CCSID=950)
759141 [2009-01-12 00:12:42,027] INFO com.1234.message.MessageService - Receiving wait...4
759313 [2009-01-12 00:12:42,199] INFO com.1234.message.MessageService - Receive from
queue(queue://123456789/123456.12345.REQUEST?CCSID=950)
4.user作动作的状况:
作者: slore
时间: 2009-1-14 17:30
你能不能给下log文件。。。
只贴2次比较要看的地方。。。
作者: win007
时间: 2009-1-15 13:54
我是按log文件上会出现error的地方贴出来
我也想把log贴出来
可惜公司没办法上传
给点建议吧~
作者: slore
时间: 2009-1-15 14:29
每次log的修改都是往最后添加麽?
是的话,一直读。将最后一句就保存起来了。
最后一句开头是reason是error了,是queue那是wait,检查最后一句有没有
debug或warn就能区分了啊
我看你的例子最后一行就能判断出全部。。。