有關(guān)Python線程操作問題進(jìn)行學(xué)習(xí)研究
下面文章進(jìn)行著重分析下什么是Python線程,以及為什么要使用Python線程?對(duì)于Python線程的功能特點(diǎn)進(jìn)行近一步的說明介紹,好了,就隨我進(jìn)入Python線程的世界吧。
比如考慮一個(gè)最簡(jiǎn)單的情形,在某種情況下,每個(gè)線程都需要訪問線程狀態(tài)對(duì)象中所保存的thread_id信息,顯然,線程A獲得的應(yīng)該是A的thread_id,線程B亦然。倘若線程A獲得的是B的thread_id,那就壞菜了。這就意味著Python線程內(nèi)部必須有一套機(jī)制,這套機(jī)制與操作系統(tǒng)管理進(jìn)程的機(jī)制非常類似。
我們知道,在操作系統(tǒng)從進(jìn)程A切換到進(jìn)程B時(shí),首先會(huì)保存進(jìn)程A的上下文環(huán)境,再進(jìn)行切換;當(dāng)從進(jìn)程B切換回進(jìn)程A時(shí),又會(huì)恢復(fù)進(jìn)程A的上下文環(huán)境,這樣就保證了進(jìn)程A始終是在屬于自己的上下文環(huán)境中運(yùn)行。
這里的線程狀態(tài)對(duì)象就等同于進(jìn)程的上下文,Python同樣會(huì)有一套存儲(chǔ)、恢復(fù)線程狀態(tài)對(duì)象的機(jī)制。同時(shí),在Python內(nèi)部,維護(hù)著一個(gè)全局變量:PyThreadState * _PyThread- State_Current。當(dāng)前活動(dòng)線程所對(duì)應(yīng)的線程狀態(tài)對(duì)象就保存在這個(gè)變量里,當(dāng)Python調(diào)度線程時(shí)。會(huì)將被激活的線程所對(duì)應(yīng)的線程狀態(tài)對(duì)象賦給_PyThreadState_Current,使其始終保存著活動(dòng)線程的狀態(tài)對(duì)象。#t#
這就引出了這樣的一個(gè)問題:Python如何在調(diào)度進(jìn)程時(shí),獲得被激活線程對(duì)應(yīng)的狀態(tài)對(duì)象?Python內(nèi)部會(huì)通過一個(gè)單向鏈表來管理所有的Python線程的狀態(tài)對(duì)象。當(dāng)需要尋找一個(gè)線程對(duì)應(yīng)的狀態(tài)對(duì)象時(shí),就遍歷這個(gè)鏈表,搜索其對(duì)應(yīng)的狀態(tài)對(duì)象。在此后的描述中,我們將這個(gè)鏈表稱為“狀態(tài)對(duì)象鏈表”。
下面我們來看一看實(shí)現(xiàn)這個(gè)機(jī)制的關(guān)鍵數(shù)據(jù)結(jié)構(gòu)。PyThread_create_key將創(chuàng)建一個(gè)新的key。注意,這里的key都是一個(gè)整數(shù)。而且,當(dāng)PyThread_create_key***次被調(diào)用時(shí)(在_PyGILState_Init中的調(diào)用正是***次調(diào)用),會(huì)通過PyThread_allcate_lock創(chuàng)建一個(gè)keymutex。
根據(jù)我們前面的分析,這個(gè)keymutex實(shí)際上和GIL一樣,都是一個(gè)PNRMUTEX結(jié)構(gòu)體,而在這個(gè)結(jié)構(gòu)體中,維護(hù)著一個(gè)Win32下的Event內(nèi)核對(duì)象。這個(gè)keymutex的功能就是用來互斥對(duì)狀態(tài)對(duì)象鏈表的訪問。在_PyGILState_Init中,創(chuàng)建的新key被Python維護(hù)的全局變量autoTLSkey接收,其中的TLS是Thread Local Store的縮寫。
這個(gè)autoTLSkey將用作Python線程保存所有線程的狀態(tài)對(duì)象的一個(gè)參數(shù),即是圖15-6中的key值。也就是說,狀態(tài)對(duì)象列表中所有key結(jié)構(gòu)體中的key值都會(huì)是autoTLSkey。哎,那位看官說了,你看PyThread_create_key返回的是nkeys的遞增后的值啊,就是說每create一次,得到的結(jié)果都是不同的。
怎么能說所有的key都是一樣的呢?事實(shí)上,在整個(gè)Python的源碼中,PyThread_create_key只在_PyGILState_Init中被調(diào)用了,而這個(gè)_PyGILState_Init只會(huì)在Python運(yùn)行時(shí)環(huán)境初始化時(shí)調(diào)用一次。
那么如何區(qū)分哪個(gè)線程對(duì)應(yīng)哪個(gè)狀態(tài)對(duì)象呢,別忘了,我們還有線程id呢。圖15-6中的id存儲(chǔ)的正是各個(gè)線程的id,根據(jù)這個(gè)id,顯然可以區(qū)分不同的線程了。那么圖中的key看上去就有點(diǎn)多此一舉了,實(shí)際上,圖15-6中所示的鏈表結(jié)構(gòu)并非是純的狀態(tài)對(duì)象鏈表。
在一個(gè)key結(jié)構(gòu)體的value域存儲(chǔ)的不是線程的狀態(tài)對(duì)象,而是與線程相關(guān)的其他對(duì)象時(shí),這個(gè)key值就有意義了。假如我們將一種狀態(tài)對(duì)象設(shè)為S,而另一種對(duì)象設(shè)為O,在圖15-6所示的鏈表中,存在著兩個(gè)與某個(gè)線程A相關(guān)的key結(jié)構(gòu)體。
顯然,對(duì)于這兩個(gè)key結(jié)構(gòu)體,id域是完全一致的,那么當(dāng)我們需要從這個(gè)鏈表中取出對(duì)象O,而并非S時(shí),該用什么來區(qū)分O和S呢?正是這個(gè)key值。所以實(shí)際上在Python中,與每個(gè)線程相關(guān)的對(duì)象可能有多種,而每一種對(duì)象都會(huì)對(duì)應(yīng)一個(gè)key值,這個(gè)key值將會(huì)被所有的線程在存儲(chǔ)這種對(duì)象時(shí)共享。
對(duì)于我們這里關(guān)注的線程狀態(tài)對(duì)象,其key值就是autoTLSkey。同樣,由于我們這里僅僅關(guān)注Python線程機(jī)制,所以我們?cè)诤竺娴拿枋鲋羞€是將圖15-6中的鏈表稱為線程狀態(tài)對(duì)象鏈表。