egg-schedule 定时任务执行中断
我们用 egg-schedule 半夜会跑一些数据处理的定时任务,跑起来时间比较长大概有三四个小时,最近开始有一些故障,在某个时间就离奇的进程中断,导致定时任务终止。
看 egg-schedule 日志显示,进程意外中断,然后又重新恢复,定时任务重新注册。 看 alinode 的进程存活时间,有一两条线程的时间是比较短的,也就是近期有中断过。 看服务器的 CPU、内存、负载都没有爆。 目前没法确定是哪里的问题,是定时炸弹。
请问这个情况该怎么避免,数据处理中断成本重新跑的成本挺大。
1 回复
看 alinode 的进程存活时间,有一两条线程的时间是比较短的,也就是近期有中断过。
说明你们进程挂了,查错误日志看看咯