今晚作了点死,差点要和主力机固态里的数据说拜拜了。
事情还要从一次蓝屏开始说起……
以下是今晚的操作日志:
0.1:晚上准备开始玩某款内测的游戏,插上Xbox手柄,进入游戏后就蓝屏了。错误信息如下:
终止代码 PAGE_FAULT_IN_NONPAGED_AREA
失败的操作 xboxgip.sys
日志里面并没有什么有价值的信息,也没有保存下来转储文件。
0.2:重启Samsung Magician提示有新版本,更新之,并未手动关闭RAPID。需要重启。
1:重启。更新完毕后,Samsung Magician提示可以更新固态(860EVO)到版本RVT24B6Q,更新之。需要重启。
2:关闭计算机后,按电源键重启,计算机卡在以下画面。
3:等待一分钟后无反应,此时已经意识到出现问题了。直接长按电源按钮关机,并立即开机按F2尝试进入BIOS。
4:尝试3失败,仍是2中的画面。此时怀疑是以下几种故障:
- FTL丢失:主控正在重建FTL表,等待即可(先假设三星的固态有这个机制)
- 启动分区损坏:使用PE查看磁盘状况。但此时机器卡启动LOGO无法进入其它系统,并且手头没有M.2硬盘盒,只能先准备工具。
- 主控损坏:需要返厂,并且数据可能完全丢失。后续冷静分析感觉可能性不高,因为主控损坏导致掉盘的话BIOS会直接不认盘而报No Bootable Device之类的错误。和当前卡LOGO的现象不一致。
5:经过以上分析后,采取了下列行动
- 让计算机保持2中的状态一小时,等待固态自修复
- 狗东临时购买一个M.2硬盘盒(后天才能到)
- 给三星技术支持发邮件
- 水贴(成本略高)和与群友吹逼(用备机)
- 思考人生,考虑丢失的工程怎么补,反思安全策略
6:等待一小时后,计算机状态无变化。感觉不能坐以待毙。于是执行了以下操作:
- 关闭计算机电源
- 拆除故障的固态,妥善保存
- 重新开机并使用PE盘引导
去除故障的固态后,计算机其它的各部件都正常。
7:执行6中的操作花了约10分钟。完成后,将固态重新安装回机器并启动。
- 第一次启动,进入恢复环境(有戏)
- 第二次启动,使用PE盘引导,成功看到故障磁盘,并能正常查看分区
- 第三次启动,成功进入系统,一切恢复正常。
以上就是今晚出现的所有问题和操作了。当然硬盘盒也退了。
总结
最后分析,故障的原因可能有以下两种:
- FTL表之类的东西丢失了,固态重建完成后并没有回报给BIOS
- 固件更新完成后固态需要重启,系统重启时主板并没有给固态复位的信号。或者说主板没有给固态断电,使固态主控处在等待状态,导致固态无响应。
不过真正的原因谁会知道呢,我又不是三星的工程师。
虽说这次意外好在只是一场虚惊,但教训还是有的:
- 对于可能造成灾难性后果的系统变更,准备太过随便,说更新就更新了。今后对于这种变更需要事先进行调研,并了解可能造成的最坏后果,并做一定的预防性准备(如数据备份,准备回退手段)
- 平时对于数据安全意识不到位,没有及时地对重要数据(尤其在固态上的)进行备份。
接下来的工作:
- 对固态进行完全测试,确保没有因为此次事故留下隐患
- 加强备份策略,今晚执行一次全盘备份
用seafile + OSS 搞一个私有云存储 ∠( ᐛ 」∠)_