问题现象:接到网吧的老板反馈突然很多电脑开不了机,卡住了,如图:
因为这个网吧购买的某知名品牌万兆交换机3个,半年内全挂了,所以怀疑是交换机的问题,不过一时过不去,我先用手机登录了服务器,重启了一下无盘服务,竟然好了。
安生了一天以后,到了晚上10点左右,又出现了一次,这次体现的比较严重,因为是满座,所以几乎全场重启,蓝屏,顾客走了很多,老板很不满意。
可能是X520网卡在SERVER2012/2016/2019/WIN10下会有比较高的几率断流,只有在2008下才正常。 我把网吧2楼改为主服务器带机,把网吧3楼改为副服务器带机,并同时打开深蓝群ping来记录网络中断,以确认出现网卡故障的服务器
经过2个小时的稳定运行,到达夜里凌晨0点06分的时候,又全场崩溃了。 立即迅速赶赴现场检查原因,当时也是比较蒙逼,想着干脆直接换2008系统算了。 到了现场以后,我先看了深蓝群PING的日志,发现深蓝群PING竟然自动关闭了,打开以后看了一下深蓝群PING的日志,没有找到可用信息。 看系统日志,对比主服服务器的网卡启动时间,发现几乎一样,都是刚刚启动的,难道服务器重启了? 使用命令查看系统启动时间: 发现2台服务器启动时间就差1秒,说明是同时重启的。 然后再检查上午的重启日志和晚上10点的重启日志,发现也都是意外关机造成的 解决方法:查看了UPS,UPS已经用了2年了,出现这种问题正常,一般一个UPS最多用一年多就要挂了。 撤下UPS后,测试了一天多正常。
|