任何事情都應該使其盡可能地簡單,,直到無法再簡單為止,。——愛因斯坦,。 1,、引言 量化交易最大的特點是有明確的交易策略并具備可回測性(Backtest) 交易策略必須包含明確的規(guī)則,如買賣信號,、加減倉條件等,。量化技術依賴的是明確的交易策略,結合資產的歷史交易數(shù)據,,可以對交易策略的歷史表現(xiàn)進行回測,。可回測性是量化交易區(qū)別于主觀投資的最重要的特征。近年來,,隨著量化投資和Python的流行,,以及量化平臺和開源框架的迅速發(fā)展,使用歷史交易數(shù)據進行回測變得越來越便利,。但是往往發(fā)現(xiàn),,回測非常好看的策略,實盤卻可能表現(xiàn)不佳,。今天給大家分享關于如何識別貌似可行的策略,,以及如何規(guī)避量化回測的陷阱,,內容參考了(加)歐內斯特·陳的《量化交易——如何建立自己的算法交易事業(yè)》一書,,公眾號后臺回復“量化交易”可免費下載PDF。 2,、常見的回測陷阱 量化回測是基于過去發(fā)生的行情數(shù)據產生歷史交易,,從而考察這些交易業(yè)績表現(xiàn)的過程。使用計算機編程對歷史交易數(shù)據進行回測看似簡單,,但實際上很容易出錯,。歷史業(yè)績高估(相對于已發(fā)生的現(xiàn)實交易)是回測的常見錯誤。使用有存活偏差數(shù)據會導致回測業(yè)績高估,。然而還有一些與如何編寫回測程序以及如何構造交易策略相關的常見回測陷阱,,最常見的有兩種:前視偏差和數(shù)據遷就偏差,。 前視偏差 簡單理解是使用交易完成之后的信息。例如,,在“日最低價的1%之內買入股票”的交易規(guī)則,,就有前視偏差,因為在當日市場收盤前,,是不可能知道日最低價的,。又如,使用全部數(shù)據回歸得來的系數(shù),,來產生一個基于前后兩段價格序列的線性回歸模型的交易信號,,同樣有前視偏差。 如何避免前視偏差,? 使用“滯后”的歷史數(shù)據來計算策略信號,,可以避免前視偏差。滯后數(shù)據系列意味著,,在計算移動平均值,、最高價、最低價,、成交量等指標時,,只使用“上一”交易期限的收盤數(shù)據。 數(shù)據遷就偏差 所謂數(shù)據遷就偏差,,主要是指因遷就歷史數(shù)據的噪音而過度優(yōu)化模型參數(shù),,造成策略的回測業(yè)績高于未來業(yè)績。在基于歷史數(shù)據的統(tǒng)計預測模型中,,數(shù)據遷就偏差非常普遍,,而在金融中,因為獨立數(shù)據的量非常有限,,所以這個問題就更加嚴重,。獨立數(shù)據的量越少,交易模型中用到的可調參數(shù)就應該越少,。構建數(shù)據驅動模型時,,幾乎不可能完全消除數(shù)據遷就偏差,但有幾種方法可以降低這種偏差,。 合理的樣本含量,。降低數(shù)據遷就偏差的最基本方法是,按照要優(yōu)化的自由參數(shù)個數(shù),,使用足夠多的回測數(shù)據,。根據經驗規(guī)則,通常假定優(yōu)化參數(shù)所需的數(shù)據點個數(shù),是模型中自由參數(shù)個數(shù)的252倍(一年交易天數(shù)為252天),。例如,,回測三參數(shù)的當日交易模型,至少要用三年的日價格數(shù)據,,如果是分鐘交易模型,,則至少需要7個月(252/390年)的分鐘數(shù)據(每天交易分鐘數(shù)6.5*60=390)。 進行樣本外測試,。將歷史數(shù)據根據時間先后分為兩段,,后一段數(shù)據用于樣本外測試。構建模型時,,參數(shù)優(yōu)化和定性選擇使用前一段數(shù)據(訓練集),,所得模型的測試使用后一段數(shù)據(測試集)。兩段數(shù)據的大小要大致相等,,若數(shù)據量不夠,,則至少用三分之一的數(shù)據做測試。訓練集的最小含量由樣本含量經驗規(guī)則確定,。 動態(tài)參數(shù)優(yōu)化是更嚴密,,也更復雜的樣本外測試方法,通過使參數(shù)不斷適應變化的歷史數(shù)據,,來消除數(shù)據遷就偏差,。不過最靠譜的樣本外測試方法是仿真交易,用尚未發(fā)生的真實數(shù)據運行模型,,是最可靠的測試方法,。仿真交易不僅能做真實準確的樣本外測試,同時也常??梢园l(fā)現(xiàn)模型中的前視偏差,,以及各種與操作相關的問題。 3,、如何識別策略的好壞,? 上述兩個回測陷阱往往容易造成“回測很豐滿,實盤很骨感”的窘境,。那么 面對紛繁復雜的量化交易策略,,漂亮的歷史回測收益率曲線,如何分辨策略的好壞與回測的可靠性呢,?其實不管策略多么復雜,,不管年化收益與風險指標多么漂亮,,我們只要回答好下面幾個問題,,就能識別出改策略的優(yōu)劣。 01、策略與基準相比如何,?收益持續(xù)性如何,? 策略的超額收益可以通過信息比率或夏普比率來衡量。量化策略相關衡量指標可參加推文:【手把手教你】Python量化策略風險指標,。 信息比率 = 超額收益率的均值 / 超額收益率的標準差 其中,,超額收益率=組合收益率-基準收益率,基準通常是市場指數(shù),。如只買賣創(chuàng)業(yè)板股票,,對應的市場指數(shù)就是創(chuàng)業(yè)板指數(shù),如果買賣滬深大盤股,,對應的市場指數(shù)應該是滬深300或上證50(超大盤股策略),,中下盤股一般使用中證500。 夏普比率是信息比率的一個特例,,基準使用無風險利率,。實踐中,由于對市場基準的選擇不同,,使得不同策略的信息比率不具有可比性,,但是對無風險利率比較有共識,因此夏普比率適合對不同種類的策略進行比較,。一個比較有用的經驗規(guī)則是,,任何夏普比率低于1的策略都不適合單獨使用,幾乎每月都實現(xiàn)盈利的策略,,其年化夏普比率通常大于2,,幾乎每天盈利的策略,其夏普比率通常大于3,。 02,、交易成本如何影響策略? 每次基于策略的買賣都會產生交易成本,。交易越頻繁,,交易成本對策略的盈利影響就越大。交易成本不僅包括證券中介的手續(xù)費,,還包括流動性成本——當你以市場價格買賣證券時,,要支付買賣價差。如果采用現(xiàn)價指令買賣證券,,確實可以避免流動性成本,,但卻要承擔機會成本,因為限價指令可能不被執(zhí)行,,從而錯失了交易的潛在盈利,。同樣,,如果你買賣大筆證券,不可能在不影響價格的情況下完成整個交易,。這種由自身指令所引起的市場價格變動效應被成為“市場沖擊”,。當市場流動性不好時,往往成為交易成本的大頭,。此外,,由于互聯(lián)網或軟件的滯后,指令通過程序傳送到交易所與指令在交易所被執(zhí)行存在時間上的滯后,,這種滯后會造成價差(稱為“滑點”),,即觸發(fā)指令的價格和執(zhí)行價格之間的差。當然,,滑點有正有負,,但平均而言,是成本而不是收益,。 03,、數(shù)據有無存活偏差 股票價格的歷史數(shù)據庫往往不包括那些由于破產、退市,、兼并或收購而不再交易的股票,,因此存在所謂的存活偏差,即數(shù)據庫中只有幸存者,。使用有存活偏差的數(shù)據進行回測是很危險的,,因為會夸大策略的歷史業(yè)績。這在策略有“價值”偏好時(傾向于買便宜的股票)尤為突出,,因為有些股票便宜的原因是公司即將破產,。如果你的策略只包含哪些當時非常便宜但卻存活下來的股票(而且可能已經興盛),而忽略那些退市的股票,,回測的結果當然會比交易員當時的實際經歷要好很多,。 04、策略的業(yè)績如何隨時間變化而變化,? 許多策略10年期的業(yè)績要遠遠好于現(xiàn)在,,至少從回測的結果來看是這樣。如果用今天的交易成本做回測,,會不現(xiàn)實地抬高早年的收益,。有存活偏差的數(shù)據也會使早年業(yè)績表現(xiàn)較好,回測回溯的越早,,消失的股票越多,,有些股票消失是因為已經破產倒閉,一個純多頭策略在回測的早期會比當年實際的盈虧看起來好,。因此,,在判斷一項策略的適用性時,,要重點關注其最近幾年的業(yè)績。此外,,當股票市場轉態(tài)發(fā)生轉化(如重大制度變革,,如股權分置改革,;再如2018年的退市制度完善,,中弘股份和長生生物相繼退市),早年的交易數(shù)據并不能簡單地應用于今天的相同模型,。股票市場的監(jiān)管變化或其他宏觀經濟事件或股災,,都可能導致重要的制度變換。 一般會認為,,數(shù)據越多,,回測在統(tǒng)計上就越可靠。這其實只是對由平穩(wěn)過程產生的金融時間序列來說才是正確的,。但是金融市場時間序列數(shù)據往往是非平穩(wěn)的,。 05、策略是否存在過擬合或參數(shù)調優(yōu)偏差,? 如果構建一個有多個參數(shù)的策略,,很容易通過優(yōu)化參數(shù),使歷史業(yè)績看起來很優(yōu)秀,。通過參數(shù)的調優(yōu),,只是使模型與過去發(fā)生但未來不會再重現(xiàn)的任何偶然歷史事件溫和。一般而言,,策略的規(guī)則越多,,模型的參數(shù)越多,就越可能出現(xiàn)過度擬合問題,。能經得起時間考驗的往往是簡單的模型,。
|
|
來自: 追夢文庫 > 《量化交易系統(tǒng)》