如何在 Linux 上殺死一個僵尸進程
要殺死一個僵尸進程,你必須從進程列表中刪除其名稱。
這里有一個和 Unix 紀(jì)元一樣古老的故事。自從有了 C 和 Unix,以及(后來的)Linux,我們就有了“僵尸”。具體來說,有一些進程被標(biāo)記為“僵尸進程”。一些人誤解它,另一些人忽視它,而它對我們許多人試圖 “殺死” 這些進程的努力免疫,沒有什么成效。這是為什么呢?
Linux 中的進程是什么?
這一切始于執(zhí)行 Linux 中的一個程序時,當(dāng)它被執(zhí)行時,它的運行實例被稱為進程。你可以用 ps 命令 查看你的 Linux 環(huán)境中的所有進程:
$ ps -axPID TTY STAT TIME COMMAND1 ? Ss 0:01 /usr/lib/systemd/systemd rhgb --switched-root --sys2 ? S 0:00 [kthreadd]3 ? I< 0:00 [rcu_gp]4 ? I< 0:00 [rcu_par_gp]
有時一個進程啟動另一個進程,使第一個進程成為第二個進程的父進程。pstree 命令是一個很好的工具,可以讓你看到系統(tǒng)中進程的“家譜”:
$ pstree -psnsystemd(1)─┬─systemd-journal(952)├─systemd-udevd(963)├─systemd-oomd(1137)├─systemd-resolve(1138)├─systemd-userdbd(1139)─┬─systemd-userwor(12707)│ ├─systemd-userwor(12714)│ └─systemd-userwor(12715)├─auditd(1140)───{auditd}(1141)├─dbus-broker-lau(1164)───dbus-broker(1165)├─avahi-daemon(1166)───avahi-daemon(1196)├─bluetoothd(1167)
每個進程在系統(tǒng)中都會被分配一個編號。進程編號(PID)1 被分配給啟動過程中執(zhí)行的第一個進程,PID 1 之后的每一個進程都是它的子孫。PID 1 進程是初始化進程,在大多數(shù)新版本的 Linux 中,它只是一個指向 systemd 程序的符號鏈接。
用 kill 命令結(jié)束一個進程
你可以用 kill 命令來終止 Linux 系統(tǒng)中的進程。盡管名字叫 “殺死”,但 kill 命令和其他一些命令,如 pkill 和 killall,都是為向一個或多個進程發(fā)送信號而編寫/設(shè)計的。當(dāng)沒有指定信號時,它發(fā)送的默認信號是 SIGTERM 信號,以終止進程。
當(dāng)一個父進程死亡或被殺死,而其子進程沒有跟隨其父進程的死亡,我們稱該進程為“孤兒進程”。
如何殺死一個僵尸進程
另一方面,僵尸進程是不能被“殺死”的!你可能會問為什么?因為它們已經(jīng)死了!
每一個子進程,當(dāng)被終止時,都會成為一個僵尸進程,然后被父進程刪除。當(dāng)進程退出并釋放它所使用的資源時,它的名字仍然在操作系統(tǒng)的進程表中。這時,父進程的工作就是把它的名字從進程表中刪除。如果沒有刪除,我們就有了僵尸進程,它不再是一個真正的進程,而只是操作系統(tǒng)進程表上的一個條目。
這就是為什么試圖對一個失效的(僵尸)進程執(zhí)行 “殺死” 命令,即使使用 -9(SIGKILL)選項也不起作用,因為沒有什么可以殺死的。
因此,要殺死一個僵尸進程,比如從進程列表(進程表)中刪除其名稱,你必須殺死其父進程。例如,如果 PID 5878 是一個僵尸進程,而它的父進程是 PID 4809,那么要殺死僵尸進程(5878),就必須結(jié)束父進程(4809):
$ sudo kill -9 4809 # 4809 是父進程,而非僵尸
我對僵尸的最后一句警告:在殺死父進程時要非常小心。如果一個進程的父進程是 PID 1,而你殺了它,你就會重新啟動自己!
而這將是一個更可怕的故事!















 
 
 






 
 
 
 