什么是僵尸進(jìn)程 僵尸進(jìn)程是指它的父進(jìn)程已經(jīng)退出(父進(jìn)程沒有等待(調(diào)用wait/waitpid)它),,而該進(jìn)程dead之后沒有進(jìn)程接受,就成為僵尸進(jìn)程,,也就是(zombie)進(jìn)程,。 僵尸進(jìn)程是怎么樣產(chǎn)生 一個(gè)進(jìn)程在調(diào)用exit命令結(jié)束自己的生命的時(shí)候,其實(shí)它并沒有真正的被銷毀,,而是留下一個(gè)稱為僵尸進(jìn)程(Zombie)的數(shù)據(jù)結(jié)構(gòu)(系統(tǒng)調(diào)用exit,,它的作用是使進(jìn)程退出,但也僅僅限于將一個(gè)正常的進(jìn)程變成一個(gè)僵尸進(jìn)程,,并不能將其完全銷毀),。 在Linux進(jìn)程的狀態(tài)中,僵尸進(jìn)程是非常特殊的一種,,它已經(jīng)放棄了幾乎所有內(nèi)存空間,,沒有任何可執(zhí)行代碼,也不能被調(diào)度,,僅僅在進(jìn)程列表中保留一個(gè)位置,,記載該進(jìn)程的退出狀態(tài)等信息供其他進(jìn)程收集,除此之外,,僵尸進(jìn)程不再占有任何內(nèi)存空間,。它需要它的父進(jìn)程來(lái)為它收尸。 如果他的父進(jìn)程沒安裝SIGCHLD信號(hào)處理函數(shù)調(diào)用wait或waitpid()等待子進(jìn)程結(jié)束,,又沒有顯式忽略該信號(hào),那么它就一直保持僵尸狀態(tài),如果這時(shí)父進(jìn)程結(jié)束了,,那么init進(jìn)程自動(dòng)會(huì)接手這個(gè)子進(jìn)程,,為它收尸,它還是能被清除的,。 但是如果父進(jìn)程是一個(gè)循環(huán),,不會(huì)結(jié)束,那么子進(jìn)程就會(huì)一直保持僵尸狀態(tài),,這就是為什么系統(tǒng)中有時(shí)會(huì)有很多的僵尸進(jìn)程,。系統(tǒng)所能使用的進(jìn)程號(hào)是有限的,如果大量的產(chǎn)生僵死進(jìn)程,將因?yàn)闆]有可用的進(jìn)程號(hào)而導(dǎo)致系統(tǒng)不能產(chǎn)生新的進(jìn)程. 僵尸進(jìn)程的避免 1、父進(jìn)程通過(guò)wait和waitpid等函數(shù)等待子進(jìn)程結(jié)束,,這會(huì)導(dǎo)致父進(jìn)程掛起 2,、如果父進(jìn)程很忙,那么可以用signal函數(shù)為SIGCHLD安裝handler,,因?yàn)樽舆M(jìn)程結(jié)束后,,父進(jìn)程會(huì)收到該信號(hào),可以在handler中調(diào)用wait回收 3,、如果父進(jìn)程不關(guān)心子進(jìn)程什么時(shí)候結(jié)束,,那么可以用signal(SIGCHLD, SIG_IGN) 通知內(nèi)核,自己對(duì)子進(jìn)程的結(jié)束不感興趣,,那么子進(jìn)程結(jié)束后,,內(nèi)核會(huì)回收,并不再給父進(jìn)程發(fā)送信號(hào) 4,、還有一些技巧,,就是fork兩次,父進(jìn)程fork一個(gè)子進(jìn)程,,然后繼續(xù)工作,,子進(jìn)程fork一個(gè)孫進(jìn)程后退出,那么孫進(jìn)程被init接管,,孫進(jìn)程結(jié)束后,,init會(huì)回收。不過(guò)子進(jìn)程的回收還要自己做,。 子進(jìn)程結(jié)束后為什么要進(jìn)入僵尸狀態(tài)? 因?yàn)楦高M(jìn)程可能要取得子進(jìn)程的退出狀態(tài)等信息,。 僵尸狀態(tài)是每個(gè)子進(jìn)程比經(jīng)過(guò)的狀態(tài)嗎? 任何一個(gè)子進(jìn)程(init除外)在exit()之后,并非馬上就消失掉,,而是留下一個(gè)稱為僵尸進(jìn)程(Zombie)的數(shù)據(jù)結(jié)構(gòu)(它占用一點(diǎn)內(nèi)存資源,也就是進(jìn)程表里還有一個(gè)記錄),,等待父進(jìn)程處理。這是每個(gè)子進(jìn)程在結(jié)束時(shí)都要經(jīng)過(guò)的階段,。如果子進(jìn)程在exit()之后,,父進(jìn)程沒有來(lái)得及處理,,這時(shí)用ps命令就能看到子進(jìn)程的狀態(tài)是“Z”。 如果父進(jìn)程能及時(shí)處理,,可能用ps命令就來(lái)不及看到子進(jìn)程的僵尸狀態(tài),,但這并不等于子進(jìn)程不經(jīng)過(guò)僵尸狀態(tài)。 如果父進(jìn)程在子進(jìn)程結(jié)束之前退出,,則子進(jìn)程將由init接管,。init將會(huì)以父進(jìn)程的身份對(duì)僵尸狀態(tài)的子進(jìn)程進(jìn)行處理。 如何查看僵尸進(jìn)程 在linux中,,利用命令ps,,可以看到有標(biāo)記為Z的進(jìn)程就是僵尸進(jìn)程。 ps -ef|grep defunc可以找出僵尸進(jìn)程. 可以用ps的-l選項(xiàng),得到更詳細(xì)的進(jìn)程信息. F(Flag):一系列數(shù)字的和,,表示進(jìn)程的當(dāng)前狀態(tài),。這些數(shù)字的含義為: 00:若單獨(dú)顯示,表示此進(jìn)程已被終止,。 S(state of the process ) O:進(jìn)程正在處理器運(yùn)行 僵尸進(jìn)程清除的方法 1.改寫父進(jìn)程,,在子進(jìn)程死后要為它收尸。具體做法是接管SIGCHLD信號(hào),。子進(jìn)程死后,,會(huì)發(fā)送SIGCHLD信號(hào)給父進(jìn)程,父進(jìn)程收到此信號(hào)后,,執(zhí)行waitpid()函數(shù)為子進(jìn)程收尸,。這是基于這樣的原理:就算父進(jìn)程沒有調(diào)用wait,內(nèi)核也會(huì)向它發(fā)送SIGCHLD消息,,盡管對(duì)的默認(rèn)處理是忽略,,如果想響應(yīng)這個(gè)消息,可以設(shè)置一個(gè)處理函數(shù),。 SIGCHLD信號(hào):子進(jìn)程結(jié)束時(shí), 父進(jìn)程會(huì)收到這個(gè)信號(hào),。如果父進(jìn)程沒有處理這個(gè)信號(hào),也沒有等待(wait)子進(jìn)程,,子進(jìn)程雖然終止,,但是還會(huì)在內(nèi)核進(jìn)程表中占有表項(xiàng),,這時(shí)的子進(jìn)程稱為僵尸進(jìn)程。這種情況我們應(yīng)該避免(父進(jìn)程或者忽略SIGCHILD信號(hào),,或者捕捉它,,或者wait它派生的子進(jìn)程,,或者父進(jìn)程先終止,,這時(shí)子進(jìn)程的終止自動(dòng)由init進(jìn)程來(lái)接管)。 2. kill -18 PPID (PPID是其父進(jìn)程) 這個(gè)信號(hào)是告訴父進(jìn)程,,該子進(jìn)程已經(jīng)死亡了,,請(qǐng)收回分配給他的資源。 SIGCONT也是一個(gè)有意思的信號(hào),。如前所述,,當(dāng)進(jìn)程停止的時(shí)候,這個(gè)信號(hào)用來(lái)告訴進(jìn)程恢復(fù)運(yùn)行,。該信號(hào)的有趣的地方在于:它不能被忽略或阻塞,,但可以被捕獲。缺省行為是丟棄該信號(hào),。 ?。?終止父進(jìn)程 如果方法2不能終止,可采用終止其父進(jìn)程的方法(如果其父進(jìn)程不需要的話)父進(jìn)程死后,,僵尸進(jìn)程成為”孤兒進(jìn)程”,,過(guò)繼給1號(hào)進(jìn)程init,init始終會(huì)負(fù)責(zé)清理僵尸進(jìn)程.它產(chǎn)生的所有僵尸進(jìn)程也跟著消失,。 先看其父進(jìn)程又無(wú)其他子進(jìn)程,,如果有,可能需要先kill其他子進(jìn)程,,也就是兄弟進(jìn)程,。方法是: kill –15 PID1 PID2 (PID1,PID2是僵尸進(jìn)程的父進(jìn)程的其它子進(jìn)程)。 然后再kill父進(jìn)程:kill –15 PPID 這樣僵尸進(jìn)程就可能被完全殺掉了,。 |
|