摘要
只要用到Objective-C,,我們每天都會跟方法調用打交道,。我們都知道Objective-C的方法決議是動態(tài)的,但是在底層一個方法究竟是怎么找到的,,方法緩存又是怎么運作的卻鮮為人知,。本文主要從源碼角度探究了Objective-C在runtime層的方法決議(Method resolving)過程和方法緩存(Method cache)的實現(xiàn)。 簡介 本文作者來自美團酒店旅游事業(yè)群iOS研發(fā)組,。我們致力于創(chuàng)造價值,、提升效率、追求卓越,。歡迎大家加入我們(簡歷請發(fā)送到郵箱 [email protected] ),。 本文系學習Objective-C的runtime源碼時整理所成,主要剖析了Objective-C在runtime層的方法決議過程和方法緩存,,內容包括: 從消息決議說起 緩存為誰而生 追本溯源,,何為方法緩存 緩存和散列 十萬個為什么 緩存 - 性能優(yōu)化的萬金油? 優(yōu)化,,永無止境
從消息決議說起 我們都知道,,在Objective-C里調用一個方法是這樣的: 這表示我們想去調用object的methodA,。 但是在Objective-C里面調用一個方法到底意味著什么呢,是否和C++一樣,,任何一個非虛方法都會被編譯成一個唯一的符號,,在調用的時候去查找符號表,找到這個方法然后調用呢,? 答案是否定的,。在Objective-C里面調用一個方法的時候,runtime層會將這個調用翻譯成 1 | objc_msgSend(id self, SEL op, ...)
|
而objc_msgSend具體又是如何分發(fā)的呢,? 我們來看下runtime層objc_msgSend的源碼,。 在objc-msg-arm.s中,objc_msgSend的代碼如下: (ps:Apple為了高度優(yōu)化objc_msgSend的性能,,這個文件是匯編寫成的,,不過即使我們不懂匯編,詳盡的注釋也可以讓我們一窺其真面目) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 | ENTRY objc_msgSend
# check whether receiver is nil
teq a1, #0
beq LMsgSendNilReceiver
# save registers and load receiver's class for CacheLookup
stmfd sp!, {a4,v1}
ldr v1, [a1, #ISA]
# receiver is non-nil: search the cache
CacheLookup a2, v1, LMsgSendCacheMiss
# cache hit (imp in ip) and CacheLookup returns with nonstret (eq) set, restore registers and call
ldmfd sp!, {a4,v1}
bx ip
# cache miss: go search the method lists
LMsgSendCacheMiss:
ldmfd sp!, {a4,v1}
b _objc_msgSend_uncached
LMsgSendNilReceiver:
mov a2, #0
bx lr
LMsgSendExit:
END_ENTRY objc_msgSend
STATIC_ENTRY objc_msgSend_uncached
# Push stack frame
stmfd sp!, {a1-a4,r7,lr}
add r7, sp, #16
# Load class and selector
ldr a3, [a1, #ISA] /* class = receiver->isa */
/* selector already in a2 */
/* receiver already in a1 */
# Do the lookup
MI_CALL_EXTERNAL(__class_lookupMethodAndLoadCache3)
MOVE ip, a1
# Prep for forwarding, Pop stack frame and call imp
teq v1, v1 /* set nonstret (eq) */
ldmfd sp!, {a1-a4,r7,lr}
bx ip
|
從上述代碼中可以看到,,objc_msgSend(就arm平臺而言)的消息分發(fā)分為以下幾個步驟: 判斷receiver是否為nil,,也就是objc_msgSend的第一個參數(shù)self,也就是要調用的那個方法所屬對象 從緩存里尋找,,找到了則分發(fā),,否則 利用objc-class.mm中_class_lookupMethodAndLoadCache3(為什么有個這么奇怪的方法。本文末尾會解釋)方法去尋找selector 如果支持GC,,忽略掉非GC環(huán)境的方法(retain等) 從本class的method list尋找selector,,如果找到,填充到緩存中,,并返回selector,,否則 尋找父類的method list,并依次往上尋找,,直到找到selector,,填充到緩存中,并返回selector,,否則 調用_class_resolveMethod,,如果可以動態(tài)resolve為一個selector,不緩存,,方法返回,,否則 轉發(fā)這個selector,否則
報錯,,拋出異常
緩存為誰而生 從上面的分析中我們可以看到,,當一個方法在比較“上層”的類中,用比較“下層”(繼承關系上的上下層)對象去調用的時候,,如果沒有緩存,,那么整個查找鏈是相當長的,。就算方法是在這個類里面,當方法比較多的時候,,每次都查找也是費事費力的一件事情,。 考慮下面的一個調用過程: 1 2 3 4 | for ( int i = 0; i < 100000; ++i) {
MyClass *myObject = myObjects[i];
[myObject methodA];
}
|
當我們需要去調用一個方法數(shù)十萬次甚至更多地時候,查找方法的消耗會變的非常顯著,。 就算我們平常的非大規(guī)模調用,,除非一個方法只會調用一次,否則緩存都是有用的,。在運行時,,那么多對象,那么多方法調用,,節(jié)省下來的時間也是非??捎^的。 追本溯源,,何為方法緩存 本著源碼面前,,了無秘密的原則,我們看下源碼中的方法緩存到底是什么,,在objc-cache.mm中,objc_cache的定義如下: 1 2 3 4 5 | struct objc_cache {
uintptr_t mask; /* total = mask + 1 */
uintptr_t occupied;
cache_entry *buckets[1];
};
|
嗯,,objc_cache的定義看起來很簡單,,它包含了下面三個變量: 1)、mask:可以認為是當前能達到的最大index(從0開始的),,所以緩存的size(total)是mask+1 2),、occupied:被占用的槽位,因為緩存是以散列表的形式存在的,,所以會有空槽,,而occupied表示當前被占用的數(shù)目 3)、buckets:用數(shù)組表示的hash表,,cache_entry類型,,每一個cache_entry代表一個方法緩存 (buckets定義在objc_cache的最后,說明這是一個可變長度的數(shù)組) 而cache_entry的定義如下: 1 2 3 4 5 | typedef struct {
SEL name; // same layout as struct old_method
void *unused;
IMP imp; // same layout as struct old_method
} cache_entry;
|
cache_entry定義也包含了三個字段,,分別是: 1),、name,被緩存的方法名字 2),、unused,,保留字段,還沒被使用,。 3),、imp,,方法實現(xiàn) 緩存和散列 緩存的存儲使用了散列表。 為什么要用散列表呢,?因為散列表檢索起來更快,,我們來看下是方法緩存如何散列和檢索的: 1 2 3 4 5 6 7 8 9 10 11 | // Scan for the first unused slot and insert there.
// There is guaranteed to be an empty slot because the
// minimum size is 4 and we resized at 3/4 full.
buckets = (cache_entry **)cache->buckets;
for (index = CACHE_HASH(sel, cache->mask);
buckets[index] != NULL;
index = (index+1) & cache->mask)
{
// empty
}
buckets[index] = entry;
|
這是往方法緩存里存放一個方法的代碼片段,我們可以看到sel被散列后找到一個空槽放在buckets中,,而CACHE_HASH的定義如下: 1 | #define CACHE_HASH(sel, mask) (((uintptr_t)(sel)>>2) & (mask))
|
這段代碼就是利用了sel的指針地址和mask做了一下簡單計算得出的,。 而從散列表取緩存則是利用匯編語言寫成的(是為了高度優(yōu)化objc_msgSend而使用匯編的)。我們看objc-msg-arm.mm 里面的CacheLookup方法: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 | .macro CacheLookup /* selReg, classReg, missLabel */
MOVE r9, $0, LSR #2 /* index = (sel >> 2) */
ldr a4, [$1, #CACHE] /* cache = class->cache */
add a4, a4, #BUCKETS /* buckets = &cache->buckets */
/* search the cache */
/* a1=receiver, a2 or a3=sel, r9=index, a4=buckets, $1=method */
1:
ldr ip, [a4, #NEGMASK] /* mask = cache->mask */
and r9, r9, ip /* index &= mask */
ldr $1, [a4, r9, LSL #2] /* method = buckets[index] */
teq $1, #0 /* if (method == NULL) */
add r9, r9, #1 /* index++ */
beq $2 /* goto cacheMissLabel */
ldr ip, [$1, #METHOD_NAME] /* load method->method_name */
teq $0, ip /* if (method->method_name != sel) */
bne 1b /* retry */
/* cache hit, $1 == method triplet address */
/* Return triplet in $1 and imp in ip */
ldr ip, [$1, #METHOD_IMP] /* imp = method->method_imp */
.endmacro
|
雖然是匯編,,但是注釋太詳盡了,,理解起來并不難,還是求hash,,去buckets里找,,找不到按照hash沖突的規(guī)則繼續(xù)向下,直到最后,。 十萬個為什么 了解了方法緩存的定義之后,,我們提出幾個問題并一一解答 讓我們去翻看類的定義,,在Objective-C 2.0中,,Class的定義大致是這樣的(見objc-runtime.mm) 1 2 3 4 5 6 7 | struct _class_t {
struct _class_t *isa;
struct _class_t *superclass;
void *cache;
void *vtable;
struct _class_ro_t *ro;
};
|
我們看到在類的定義里就有cache字段,沒錯,,類的所有緩存都存在metaclass上,,所以每個類都只有一份方法緩存,而不是每一個類的object都保存一份,。 在第一節(jié)對objc_msgSend的追溯中我們可以看到,,即便是從父類取到的方法,,也會存在類本身的方法緩存里。而當用一個父類對象去調用那個方法的時候,,也會在父類的metaclass里緩存一份,。 要回答這個問題,,我們需要再看一下源碼,,在objc-cache.mm有一個變量定義如下: 1 2 3 4 5 | /* When _class_slow_grow is non-zero, any given cache is actually grown
* only on the odd-numbered times it becomes full; on the even-numbered
* times, it is simply emptied and re-used. When this flag is zero,
* caches are grown every time. */
static const int _class_slow_grow = 1;
|
其實不用再看進一步的代碼片段,僅從注釋我們就可以看到問題的答案,。注釋中說明,,當_class_slow_grow是非0值的時候,只有當方法緩存第奇數(shù)次滿(使用的槽位超過3/4)的時候,,方法緩存的大小才會增長(會清空緩存,,否則hash值就不對了),;當?shù)谂紨?shù)次滿的時候,方法緩存會被清空并重新利用,。 如果_class_slow_grow值為0,,那么每一次方法緩存滿的時候,其大小都會增長,。 所以單就問題而言,,答案是沒有限制,雖然這個值被設置為1,,方法緩存的大小增速會慢一點,,但是確實是沒有上限的。 這個問題么,,我覺得有以下三個原因: 散列表是沒有順序的,Objective-C的方法列表是一個list,,是有順序的,;Objective-C在查找方法的時候會順著list依次尋找,并且category的方法在原始方法list的前面,,需要先被找到,,如果直接用hash存方法,,方法的順序就沒法保證,。 list的方法還保存了除了selector和imp之外其他很多屬性 散列表是有空槽的,,會浪費空間
緩存 - 性能優(yōu)化的萬金油,? 非也,,就算有了有了Objective-C本身的方法緩存,,我們還是有很多調用方法的優(yōu)化空間,,對于這件事情,,這篇文章講的非常詳細,,大家可以自行移步觀摩http://www./artikel/Optimization/opti-3-imp-deluxe.html (強烈推薦,雖然我們一般不會遇到需要這么強度優(yōu)化的地方,,但是這種精神和思想是值得我們學習的) 優(yōu)化,,永無止境 在文章末尾,我們再來回答一下第一節(jié)提出的問題:“為什么會有_class_lookupMethodAndLoadCache3這個方法,?” 這個方法的實現(xiàn)如下所示: 1 2 3 4 5 6 7 8 9 10 11 | /***********************************************************************
* _class_lookupMethodAndLoadCache.
* Method lookup for dispatchers ONLY. OTHER CODE SHOULD USE lookUpImp().
* This lookup avoids optimistic cache scan because the dispatcher
* already tried that.
**********************************************************************/
IMP _class_lookupMethodAndLoadCache3(id obj, SEL sel, Class cls)
{
return lookUpImpOrForward(cls, sel, obj,
YES /*initialize*/ , NO /*cache*/ , YES /*resolver*/ );
}
|
如果單純看方法名,,這個方法應該會從緩存和方法列表中查找一個方法,但是如第一節(jié)所講,,在調用這個方法之前,,我們已經(jīng)是從緩存無法找到這個方法了,,所以這個方法避免了再去掃描緩存查找方法的過程,而是直接從方法列表找起,。從Apple代碼的注釋,,我們也完全可以了解這一點。不顧一切地追求完美和性能,,是一種品質,。 后記 本文是Objective-C runtime源碼研究的第二篇,主要對Objective-C的方法決議和方法緩存做了剖析,。runtime的源代碼可以在 http://www.opensource.apple.com/tarballs/ 下載,。如有錯誤,敬請指正,。
|