Advances in Financial Machine Learning的作者,,著名的量化大佬,,Marcos Lopez de Prado昨天在AI&Data Science in Trading的線上論壇,分享了其對于量化職業(yè)發(fā)展的主題演講《Escaping The Sisyphean Trap: How Quants Can Achieve Their Full Potential》,。 從初入量化行業(yè)所可能遇到的問題和挑戰(zhàn),,談到了當(dāng)前量化機構(gòu)的兩種模式,投資經(jīng)理模式和流水線模式,。 作者認(rèn)為,,在機器學(xué)習(xí)時代,流水線模式的量化研究更適合Quant的職業(yè)發(fā)展,。像科研一樣做量化策略的研究,,才是最符合這個時代量化投資機構(gòu)的發(fā)展路徑。 金融行業(yè)技術(shù)及人才需求的變革 Marcos首先回顧了過去100多年,,投資行業(yè)所使用的技術(shù)和所需技能的演進,。 20世紀(jì)初,投資交易主要是由投機占主導(dǎo),,沒有系統(tǒng)的金融理論,,更沒有計算機,數(shù)據(jù)也非常有限,。即使涉及到數(shù)學(xué),,所使用也都是非常簡單的數(shù)學(xué)模型,更多的是采用技術(shù)分析,。這個時期,,投資管理的從業(yè)人員基本沒有接受專業(yè)的訓(xùn)練,投資決策主要依靠故事或主題,。 20世紀(jì)50年代開始,,經(jīng)濟學(xué)家開始關(guān)注怎么對經(jīng)濟和金融系統(tǒng)進行建模。系統(tǒng)性的金融理論開始得到發(fā)展,,比如現(xiàn)代組合管理理論,,資產(chǎn)定價理論等。專業(yè)的金融分析師開始在投資決策中占主導(dǎo),,他們利用基本面分析及計量經(jīng)濟學(xué)的方法進行投資決策,。在這個階段CFA成為金融認(rèn)證的黃金標(biāo)準(zhǔn),。 2000年開始,隨著技術(shù)的發(fā)展,,包括算力,、數(shù)據(jù)存儲及互聯(lián)網(wǎng)的發(fā)展,還有數(shù)學(xué)建模的發(fā)展,,市場微觀結(jié)構(gòu)也在這時候成為很多高頻交易的理論工具。這時候開始,,很多投資管理的公司開始傾向雇用STEM專業(yè)的畢業(yè)生進行研究及技術(shù)開發(fā),。但這時候,大部分的Quant還是Q side,。 2015年以來,,隨著機器學(xué)習(xí)的發(fā)展及另類數(shù)據(jù)的爆發(fā),Quant的研究也從定價轉(zhuǎn)向了預(yù)測,,機構(gòu)對于機器學(xué)習(xí),、數(shù)據(jù)科學(xué)家及自動化專家的需求達到了新高度。 是什么推進了這個變革,,Marcos總結(jié)了三個方面:數(shù)據(jù),、算法和算力。數(shù)據(jù)正以指數(shù)級的速度增加,,根據(jù)IDC的估算,,過去兩年產(chǎn)生的數(shù)據(jù)總量,已經(jīng)占到了歷史所有數(shù)據(jù)總量的90%以上,。這當(dāng)中有80%的數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),,在處理非結(jié)構(gòu)化數(shù)據(jù)又需要強大的機器學(xué)習(xí)算法和算力。這三個方面共同的作用,,是對科學(xué)背景的人才的高需求,。金融投資行業(yè)的數(shù)據(jù)處理,對數(shù)據(jù)科學(xué)家提出了很高的挑戰(zhàn),。 金融研究的五大困境 與傳統(tǒng)的科學(xué)研究相比,,金融研究存在了哪些困難與挑戰(zhàn)?Marcos闡述了金融研究相比科學(xué)研究最顯著的五個困境: 實驗的障礙:相對于傳統(tǒng)科研,,量化策略的研究并沒有那么明顯的因果推斷關(guān)系,,很難使用傳統(tǒng)的控制變量法。 非平穩(wěn)的數(shù)據(jù):金融系統(tǒng)是一個動態(tài)的系統(tǒng),,金融市場的數(shù)據(jù)大多是非平穩(wěn),,這種非平穩(wěn)性往往是市場結(jié)構(gòu)的變化所導(dǎo)致的,比如監(jiān)管的變化,、投資者結(jié)構(gòu)的變化等,。非平穩(wěn)性帶來很多問題,,會導(dǎo)致預(yù)測的不可靠及多發(fā)的黑天鵝事件等等。如下圖所示,,在數(shù)據(jù)存在結(jié)構(gòu)性突變的情況下,,依據(jù)歷史數(shù)據(jù)預(yù)測未來的可行性就大大降低。 嚴(yán)苛的競爭:不同為科學(xué)研究上創(chuàng)新性的競爭,,能夠提高生產(chǎn)力,。策略的研究,本質(zhì)上是一個零和的游戲,,是一種內(nèi)卷,,這種競爭降低了金融市場的信噪比。比如一樣策略研究的發(fā)表會使其在將來失去有效性,,增加了有效策略挖掘的難度,,加快了alpha的衰減。 系統(tǒng)的復(fù)雜性:金融系統(tǒng)是一個復(fù)雜的系統(tǒng),,傳統(tǒng)的統(tǒng)計學(xué)假設(shè)我們知道每一個變量的分布,,及變量之間的相關(guān)性。但這些假設(shè)都是不現(xiàn)實的,,特別是第二個假設(shè),。我們知道金融市場的數(shù)據(jù)存在層級性、高緯度等未知的特性,,某一個相關(guān)性的錯誤假設(shè)都會導(dǎo)致模型的失敗,,得出錯誤的結(jié)論。 少量的樣本:雖然說金融市場有大量數(shù)據(jù),,但相對系統(tǒng)的復(fù)雜性,,數(shù)據(jù)還是不夠,更何況這些數(shù)據(jù)還存在序列自相關(guān),,及多個序列之間的相互依賴,。這就造成了大量假陰性研究結(jié)果的出現(xiàn)。 如何克服困境:像科研人員一樣工作 面對以上困境,,什么樣的研究體系能夠有助Quant直面這些挑戰(zhàn)呢,?Marcos首先明確表示傳統(tǒng)的投資經(jīng)理主導(dǎo)的模式(稱為Silos模式)阻礙的Quant的發(fā)展,及投資者利益的最大化,。什么是Silos模式呢,?傳統(tǒng)的機構(gòu)會雇用獨立的投資團隊,這個團隊通常由一個投資經(jīng)理及幾個研究員組成,,不同的投資團隊之間相互獨立(確切說是相互競爭),。團隊共用公司的研究平臺及技術(shù)設(shè)施(如數(shù)據(jù)API、風(fēng)控系統(tǒng)及回測交易設(shè)施),獨立研發(fā)策略,,對策略研發(fā)的整個生命周期負(fù)責(zé),,并根據(jù)策略的表現(xiàn)獲得相應(yīng)報酬。在這種模式下,,團隊之間沒有任何激勵去進行合作,,而是存粹的競爭關(guān)系。采用這個模式的公司希望通過競爭達到團隊的分散化,,但這種模式存在如下明顯的缺點:
所以,,Solios模式的公司很難適合想做科研一樣做量化研究的Quant。Solios公司需要的是通才而不是專才,。在某方面突出的Quant,,進入這類公司會有專才變成通才,每天花費很多時間在重復(fù)性的工作上,,比如回測,、數(shù)據(jù)整理,而在策略創(chuàng)新方面失去動力,。Marcos把這種情況比作了Quant的西西弗斯困境,。 與Silos模式對立的是另一種模式,Marcos稱之為Big Science模式或Assembly Line模式,,把策略的研究作為一個系統(tǒng)化的科學(xué)研究工作,,在這樣一個框架下精細化分工,每個來自不同專業(yè)背景的角色承擔(dān)整個系統(tǒng)的某一個細分部分的工作,。美國著名物理學(xué)家Ernest Lawrence在1931年創(chuàng)立了伯克利實驗室,,就通過跨專業(yè)團隊的合作解決了很多在大學(xué)里很難解決的問題。 以實驗室的形式,,通過不同分工進行量化研究,,是Marcos所推崇的模式,他認(rèn)為這種模式相對Solios模式有很大的優(yōu)點: Assembly Line模式把整個量化研究分成了多個部分,,具體可以參考Marcos的書《Advances in Financial Machine Learning》,。以下為部分截圖,整個生產(chǎn)線主要包括:研究、策略及生產(chǎn)三個大部分,。每個部分有分為多個角色,,比如研究中有特征分析的角色主要從海量數(shù)據(jù)中挖掘因子。生產(chǎn)中,,有負(fù)責(zé)部署的角色,,也有負(fù)責(zé)訂單執(zhí)行的角色。 在這種模式下,,量化研究更像是一個科研人員,,為了解決整個系統(tǒng)中某一個部分的優(yōu)化而不斷努力研究,最終掌握的是一種技能,,而不是一個策略,。團隊成員間的合作,更利于解決更困難的問題,,挖掘更優(yōu)質(zhì)的Alpha,。獨立的策略測試團隊,更能保證策略的有效性,,避免了策略的過擬合,。在沒有組合經(jīng)理這個角色的情況下,團隊更扁平,,更具自我糾錯的能力,。 Marcos認(rèn)為,在這樣一個Quant研究朝向團隊合作發(fā)展的情景下,,2-3人的量化團隊將更難生存,,因為隨著技術(shù)及算法的發(fā)展,很難有人能夠獨自掌控整個量化策略研究到生產(chǎn)的全過程,,即使有這樣的人,,在面對大型團隊的時候,也幾乎沒有競爭優(yōu)勢,,這樣的團隊在未來將很難生存,。 回到國內(nèi)量化機構(gòu) 關(guān)于國內(nèi)量化機構(gòu)采用的管理模式,之前公眾號在知乎上也看到廣泛的討論,,有些大的機構(gòu)從發(fā)展初期就確定了流水線模式,。有些機構(gòu)則依賴幾個核心的投資經(jīng)理,不斷擴大規(guī)模,。 關(guān)于投資經(jīng)理模式(Silos)/ 流水線模式(Assembly Line)在國內(nèi)的情況,,歡迎大家在評論區(qū)討論。 |
|