每日英語,每天進步一點點(偷笑):
前言
臨近五一節,想到有 5 天假期,小林開始飄了。
寫個簡單的Bash腳本都不上心了,寫完連檢查都不檢查,直接拖到到實體服務器跑。
結果一跑起來,發生不對勁,怎么一個簡單腳本跑了 10 秒還沒結束,于是立馬直接ctrl + c一頓操作停掉了運行中腳本。
接著,習慣性的輸入了ls,結果 what?找不到ls命令?
瞬間背后一涼,慌慌張張打開了腳本。
發現問題了,小林我寫了個巨蠢的 Bug,間接執行了rm -fr /*,這不意味著我刪庫了?
這臺是公司的授權服務器呀,被小林這么一整,公司歷史的授權記錄和其他重要信息不就丟了?
心里慌的一批的小林,跟我的朋友們說了這件事,朋友建議我先第一時間上報給 ,不要把刪庫的事情瞞著。
于是,小林就向 說了我刪庫事情,本以為會被痛批一頓。
結果 笑著說:“沒事,你先看看重要的文件還在不在。不過你這么一整,我突然想起編譯服務器半年沒備份,我先備份一下我的編譯服務器,防止哪天也被你們刪庫了。”
我:“????”
吃瓜的小伙伴,是不是覺得小林要刪庫跑路了?哈哈哈,小林沒跑路,反而是恢復了回來,所以接下來說說小林是如何「從刪庫到恢復」的。
正文初探案發現場
來看看小林寫的垃圾代碼,是如何引發這次的刪庫。
既然發生了rm -fr /*的現象,那必然這個變量是空的。
所以導致執行rm -fr $/*這條語句的時候,變成了rm -fr /*刪庫語句。很好刪除文件操作無法完成,兇器找到了。
那為什么 會是空的呢?
細心的小伙伴肯定察覺出來了,是因為給變量賦值的時使用了反引號。
沒錯,就是反引號的原因。
反引號在 Linux Shell 命令行中有特殊的含義:反引號間的內容,會被 Shell 先執行。其輸出被放入主命令后,主命令再被執行。
也就是說,的值是${}/這條命令執行的結果,問題這哪是命令啊,所以肯定返回空值給變量。
小林寫的那么溫柔的代碼,竟然變成了窮兇極惡的刪庫代碼。
這下原因是找到了,反引號應該改成雙引號才對。
小林你真菜呀,那么簡單的賦值命令都寫錯。
哈哈哈,確實菜,都說了嘛,快五一了,小林是飄著寫這份代碼的。
所以習慣性開啟程序員內容的第一大武功:crtl+c和crtl+v。
把第一條賦值 =`pwd` 語句,復制粘貼了,然后只改了變量名,沒注意反引號要修改成雙引號,所以造成了刪庫的悲劇。
保留案發現場
既然發生了刪庫的事情,千萬不要重啟服務器,也不要關閉 ssh 連接的會話,而是要保留案發現場,接著查查還剩什么。
小林,這不是吹大炮嘛?ls都沒了,還怎么查?
還好這次是比較幸運,因為在執行腳本的時候,第一時間發現不對勁,立馬掐斷了還在運行的腳本,所以并非 Linux 所有文件都被刪除了。
只要我掐的快,rm -fr /* 就干不死我。
雖然ls被刪了,但所幸發現cd命令還能用。
只要cd用的好,它也能用出的ls效果。很簡單,只需cd + Tab鍵就會自動出現指定目錄下的所有文件。
有了 cd + Tab鍵,我們就可以查看每個目錄下的文件,于是就可以一步一步來確認哪些系統文件被刪了。
通過一番的確認和對比后,發現主要被刪除的有四個目錄分別是
來復習下上面這四個目錄主要是存放了什么:
/boot都被刪除了,還好小林沒有重啟服務器,要是重啟了服務器,就完犢子了,系統肯定起不來了。
cd命令是在/sin目錄下,/sin還健全,所以cd是可以正常使用。
所幸重要的數據庫信息和文件都還沒刪除,所以小林首要的目標是要恢復/bin、/boot、/dev、/lib這四個目錄。
還原文件
由于/bin目錄 和/lib部分動態文件被刪除,常用的傳遞文件的方式是無法使用的,如 ftp、scp、mount 等。
小林摸索了很久,竟然發現wget可以使用,wget命令是在/usr/bin目錄,所幸/usr/bin還健全。
于是,用了取巧的方法,先另一臺正常的服務器,把/bin目錄放到了Web服務器的Web目錄,接著通過wget進行下載。
有戲,看到了成功的曙光。
但是新的問題就來了,我下載過來的命令文件,是沒有執行權限的。
而chmod命令是在/bin目錄的,它同樣也被刪除了,無法使用它來給予文件權限。
還在,在網上搜到了一個偉大命令perl,可以通過它來給予文件權限:
perl?-e?"chmod?777,?'ls'"
真是個神奇的命令。
好了,這下賦值權限問題也解決了,成功在望了。
wget是無法直接把/bin目錄下載下來的,只能下載一個文件。
但是小林我不可能一個一個去下載來進行恢復,這得要何年何月才能完成。。。
小林就想到了一個方法:
/bin就這樣恢復回來啦,剩余的其他目錄 也是通過同樣的操作恢復了回來。
小林的笑容漸漸恢復了回來,哈哈哈哈哈哈哈哈哈哈哈哈
遇到 rm -fr /* 刪庫事件發生,一定要沉住氣,穩住心態
本次刪庫事件,之所以小林能幸運的恢復回來,有非常關鍵兩點:
如果以上兩點都沒做好,服務器恢復的難度就加大了很多,更嚴重的是五一節就沒的過了。
預防誤執行 rm -fr /*
既然rm -fr /*是殘忍的兇器刪除文件操作無法完成,那么預防它是很有必要的,接下來跟大家討論討論預防它的幾種方案。
方案一:rm -rf 刪除目錄時要判斷目錄
#!/bin/bash
work_path=`pwd`
#如果目錄不為空,才執行刪除操作
if?[?${work_path}?!=?""?];then
????rm?-fr?${work_path}/*
fi
在執行刪除目錄操作前,先判斷要刪除的目錄是否為空,不為空才執行刪除操作。
方案二:Shell 腳本指定 set -u
執行腳本的時候,如果遇到不存在的變量,Bash 默認忽略它。
#!/bin/bash
echo?$a
echo?hello
上面代碼中,$a是一個不存在的變量,執行結果如下。
$?bash?test.sh
hello
可以發現,echo $a輸出了一個空行,Bash忽略了不存在的$a,然后繼續執行echo hello。
最好是遇到變量不存在,腳本應該報錯,而不是一聲不響地往下執行。
set -u就用來改變這種行為,在腳本加上它,遇到不存在的變量就會報錯,并停止執行。
#!/bin/bash
set?-u
rm?-fr?$a/*
echo?hello
運行結果如下:
$?bash?test.sh
test.sh:?line?4:?a:?unbound?variable
可以看到,因為a是未定義變量,腳本報錯了,并且不再執行后面的語句。
方案三:safe-rm 替換 rm
safe-rm是一個開源軟件工具,這名字聽起來就很安全嘛,所以它是用來替代不太安全的rm。
它可以在/etc/safe-rm.conf中配置路徑黑名單,定義哪些不能被safe-rm刪除。
我們可以將safe-rm更名為rm,假設定義了/etc/無能被刪除,那么刪除/etc時就會報錯:
$?rm?-rf?/etc/
safe-rm:?skipping?/etc/
方案四:建立回收站機制
是有回收站的,即使誤刪了,也可以在回收站恢復。
所以,我們也可以在 Linux 實現回收站的機制。
實現思路:
刪除文件時,它并不真正執行刪除操作,而是將文件移動到一個特定目錄,可以設置定時清除回收站,或者在回收站里面的文件大小達到一定容量時(或者用時間做判斷)執行刪除操作以騰出空間。
可以寫個 Shell 腳本替換rm命令,或者在需要刪除文件的時候使用mv命令將文件移動到回收站。
① 創建回收站目錄
mkdir?/home/.trash
② 編寫.sh腳本,內容如下
③ 修改~/., 用我們自建的.sh替代rm命令
alias?rm="sh?/home/remove.sh"
④ 設置,定期清空垃圾箱,如每天 0 點清空垃圾箱:
0?0?*?*?*?rm?-rf?/home/.trash/*
⑤ 最后,執行以下命令,使之生效
source?~/.bashrc?
方案五:根文件掛載成只讀
在/etc/fstab文件,把/文件系統掛載成只讀的方式。
其中,ro,就表示只讀的方式掛載。
只讀的方式掛載后,進行刪除操作是無法成功的:
事后反思
涉及到rm -fr命令的代碼,要留個心眼,要反復檢查,要做好預防誤執行rm -fr /*,并在測試機驗證完后,再拖到實體機上跑,千萬不可大意。
就算的發生了rm -fr /*,要第一時間停掉它,并且要做到三不要:
只要立馬掐斷rm -fr /*,它是干不死我們的。
利用當下環境剩有的命令,冷靜分析,是有機會恢復的。
小林現在是一個刪過庫沒跑路的男人了,, 我們下次見。
*版權聲明:轉載文章和圖片均來自公開網絡,版權歸作者本人所有,推送文章除非無法確認,我們都會注明作者和來源。如果出處有誤或侵犯到原作者權益,請與我們聯系刪除或授權事宜。