久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

AI時(shí)代,,我們?cè)诮鹑谕顿Y方面做了這些嘗試…

 黑馬_御風(fēng) 2017-01-12

金融科技的到來(lái),,不僅代表著技術(shù)上的飛躍,,更是對(duì)金融服務(wù)模式的顛覆和創(chuàng)新。隨著AI的發(fā)展和普及,,量化交易也步入了智能交易的新高度,。金融投資的核心在于追求收益,而人工智能的分析和預(yù)測(cè)能力恰如其分地滿足了投資的要求,。



讓我們就AI在金融投資方面的應(yīng)用進(jìn)行設(shè)想:

▲證券長(zhǎng)短期價(jià)格區(qū)間的預(yù)測(cè)

▲量化策略模型的研發(fā)(高/低頻)

▲證券的擇股和擇時(shí)的優(yōu)化

▲大類資產(chǎn)的配置

▲證券投資組合的優(yōu)化

▲證券風(fēng)險(xiǎn)特征識(shí)別


機(jī)器學(xué)習(xí)分為淺層機(jī)器學(xué)習(xí)和深度學(xué)習(xí),,傳統(tǒng)的淺層學(xué)習(xí)中決策樹(shù)、樸素貝葉斯,、支持向量機(jī)和淺層神經(jīng)網(wǎng)絡(luò)等等也都是金融工程中常用的一些方法,。作為金融科技的開(kāi)拓者,恒生研究院就人工智能在量化交易領(lǐng)域進(jìn)行了一系列的創(chuàng)新嘗試,。


>>基于小波神經(jīng)網(wǎng)絡(luò)對(duì)時(shí)間序列進(jìn)行預(yù)測(cè)


人工智能有監(jiān)督機(jī)器學(xué)習(xí)的模式中,,有兩大類學(xué)習(xí)模型:分類和回歸預(yù)測(cè),而在金融投資或者說(shuō)量化交易中,,對(duì)于時(shí)間序列的預(yù)測(cè)最為直觀,。


小波分析是指通過(guò)高低頻通道來(lái)將時(shí)序數(shù)據(jù)分解為高頻部分和低頻部分,進(jìn)行多尺度細(xì)化分析,,目前對(duì)于時(shí)序/頻域的預(yù)測(cè)已經(jīng)取得了一些有意義的成果,。將小波分析和神經(jīng)網(wǎng)絡(luò)結(jié)合起來(lái),構(gòu)建小波神經(jīng)網(wǎng)絡(luò)(Wavelet Neural Network,,WNN),,可以對(duì)時(shí)序數(shù)據(jù)進(jìn)行預(yù)測(cè)分析。WNN是將神經(jīng)網(wǎng)絡(luò)隱節(jié)點(diǎn)的激活函數(shù)由小波函數(shù)來(lái)替代,,相應(yīng)的輸入層到隱含層的權(quán)值及隱含層的閾值分別由小波函數(shù)的尺度伸縮因子和時(shí)間平移因子所代替,,這是應(yīng)用最廣泛的緊致型結(jié)合。


如下圖所示我們用小波神經(jīng)網(wǎng)絡(luò)做的HS300的預(yù)測(cè),,使用2010.1~2015.8滬深300指數(shù)的日行情數(shù)據(jù)進(jìn)行模型訓(xùn)練,,使用2015.9~2016.8的日行情數(shù)據(jù)進(jìn)行測(cè)試驗(yàn)證。

有監(jiān)督的學(xué)習(xí)要取得較好的應(yīng)用效果,,其和機(jī)器學(xué)習(xí)的訓(xùn)練過(guò)程直接相關(guān),。這一過(guò)程中還是要投資者較深地介入數(shù)據(jù)的預(yù)處理,進(jìn)行培訓(xùn)數(shù)據(jù)樣本的特征標(biāo)簽標(biāo)定或?qū)τ?xùn)練規(guī)則給出方向性指引,。通常量化交易的團(tuán)隊(duì)資源要更深入地去發(fā)掘更好的特征,。因此,人工設(shè)計(jì)樣本特征,,不是一個(gè)容易的可擴(kuò)展的途徑,。上面我們判別市場(chǎng)短期走勢(shì)的案例中,,所定義的特征是否合適?我們也比較難評(píng)判,,也許會(huì)有更好的特征可以刻畫(huà)證券市場(chǎng)的走勢(shì),。


>>讓機(jī)器學(xué)習(xí)幫我們找到合適的量化策略


市場(chǎng)千變?nèi)f化,很難找到合適的特征去進(jìn)行機(jī)器學(xué)習(xí),,那么是否我們能通過(guò)機(jī)器學(xué)習(xí)的方法去尋找合適的量化策略,,替代自己總結(jié)的方式呢?


技術(shù)指標(biāo)千差萬(wàn)別,,股票市場(chǎng)價(jià),、量、時(shí),、空的數(shù)據(jù)也是海量的,,在這樣龐大的數(shù)據(jù)基礎(chǔ)上,尋找和優(yōu)化量化技術(shù)指標(biāo)也是比較困難的,?;谶M(jìn)化理論的遺傳算法可以較好地針對(duì)預(yù)定問(wèn)題,用解決全局最優(yōu)解的方式尋找性能瓶頸,,在對(duì)傳統(tǒng)技術(shù)指標(biāo)因子和基本面因子進(jìn)行交易信號(hào)的整合上,,也可以發(fā)揮很好的作用。通過(guò)遺傳算法可以獲得在訓(xùn)練集上較好表現(xiàn)的量化技術(shù)模型,,雖然遺傳算法得到的是類似黑箱的量化技術(shù)模型,,但模型背后隱含著關(guān)于時(shí)間序列的深刻的數(shù)學(xué)含義。

上面這個(gè)就是機(jī)器通過(guò)遺傳規(guī)劃的方法,,尋找出來(lái)的模型,。訓(xùn)練集我們采用了2006~2010的數(shù)據(jù)——深100ETF,通過(guò)機(jī)器訓(xùn)練,,系統(tǒng)能夠找到勝率在70%,、盈虧比接近6的策略,策略的年化夏普率超過(guò)了1.5,。


為了考察策略的泛化能力,,我們采用2014.1~2016.8的深100ETF數(shù)據(jù)進(jìn)行測(cè)試驗(yàn)證。下圖是在2014~2016的測(cè)試集上的效果,,發(fā)現(xiàn)測(cè)試能力還是具備一定的可驗(yàn)證性,。在測(cè)試集上的年化夏普率甚至超過(guò)了2。


為了進(jìn)一步考察模型的泛化能力,,我們使用50ETF的數(shù)據(jù)進(jìn)行驗(yàn)證,,50和深100在走勢(shì)上還是有較大的差異的。


上面是50ETF的測(cè)試效果,雖然比100ETF要差,,但還是可以接受的一種模型,。


后續(xù),我們希望將“遺傳算法在量化技術(shù)指標(biāo)的優(yōu)化”這一應(yīng)用成果形成智能策略服務(wù)平臺(tái),,為廣大投資者提供適合自己投資風(fēng)格的量化技術(shù)模型,。


>>從圖像中識(shí)別證券發(fā)展趨勢(shì)


圖形屬于非結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)的金融工程很難運(yùn)用非結(jié)構(gòu)數(shù)據(jù),。利用圖像識(shí)別的方法,,將圖形數(shù)據(jù)應(yīng)用于CNN學(xué)習(xí)網(wǎng)絡(luò)是否是一個(gè)可行的量化分析方法?盤(pán)感好的高手可以通過(guò)看K線圖,,用較難量化的模糊模式識(shí)別出證券未來(lái)的走勢(shì)可能。


圍棋為什么難,?因?yàn)樗枰祟愅ㄟ^(guò)直觀判斷盤(pán)面而進(jìn)行行動(dòng),,和投資者根據(jù)K線圖進(jìn)行投資行為很相像。那么,,是否也可以通過(guò)CNN的方法,,讓機(jī)器自己從這張圖中提取出有用的特征?為此,,我們應(yīng)用了標(biāo)普500從1962年到現(xiàn)在的13768個(gè)日K線數(shù)據(jù),,生成120根K線加20、60,、120,、240的均線,和成交量的1366張圖片以及20根K加各均線的6000多張圖片,,對(duì)CNN進(jìn)行訓(xùn)練,。最終,120天K線數(shù)據(jù)圖片識(shí)別未來(lái)10日收益率的10分類勝率只有30%左右,,20天較短周期的K線圖識(shí)別勝率在40%左右,。雖然top5的勝率是接近95%了,但如果簡(jiǎn)單做成2分類,,目前看沒(méi)有比傳統(tǒng)的金融工程方法更優(yōu),,或許幾千張圖片對(duì)于深度學(xué)習(xí)來(lái)說(shuō)數(shù)據(jù)量也還是欠缺。



心得:那些在機(jī)器學(xué)習(xí)訓(xùn)練中的技巧


人工智能應(yīng)用于預(yù)測(cè)和分類中最棘手的問(wèn)題就是對(duì)于歷史數(shù)據(jù)的“過(guò)擬合”,?!斑^(guò)擬合”的表現(xiàn)是模型在訓(xùn)練集上表現(xiàn)得非常好,但在不同于訓(xùn)練集的測(cè)試數(shù)據(jù)上則表現(xiàn)較差,。如果把模型在訓(xùn)練集和測(cè)試集上的模型精度畫(huà)一個(gè)圖,,會(huì)發(fā)現(xiàn)隨著模型訓(xùn)練的迭代,在訓(xùn)練集上的精度會(huì)不斷提高,但在測(cè)試集上的精度是先逐漸提高,,后來(lái)卻隨著訓(xùn)練的進(jìn)展而不斷下降,。


▲解決模型訓(xùn)練的過(guò)擬合,首先就是early stopping,,即在每一個(gè)epoch結(jié)束時(shí)計(jì)算測(cè)試集的模型精度,,當(dāng)精度不再提高時(shí),就停止訓(xùn)練,。這是很自然的做法,,因?yàn)榫炔辉偬岣撸?xùn)練下去也沒(méi)用,;


▲其次是數(shù)據(jù)的擴(kuò)充,,避免過(guò)擬合最根本的還是需要海量的訓(xùn)練數(shù)據(jù),數(shù)據(jù)能夠覆蓋各種各樣的場(chǎng)景,。并通過(guò)隨機(jī)洗牌來(lái)減少數(shù)據(jù)之間的自相關(guān)性,。當(dāng)然海量數(shù)據(jù)本身的獲取和特征化提取,也是一個(gè)非常困難的事情,;


▲再者是模型連接和懲罰項(xiàng)參數(shù)的調(diào)整,,如正則化和Drop Out/Drop Connect,這兩者其實(shí)本質(zhì)上是簡(jiǎn)化深度神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜程度,,為使模型具備一定的稀疏性,,刻意地將代價(jià)函數(shù)加上懲罰項(xiàng),以及減少深度神經(jīng)網(wǎng)絡(luò)模型的連接,。通過(guò)簡(jiǎn)化機(jī)器學(xué)習(xí)的模型,,的確可以避免模型過(guò)分依賴于訓(xùn)練集上的數(shù)據(jù)表現(xiàn);


▲最后則是學(xué)習(xí)速率和梯度下降參數(shù),。關(guān)于梯度下降,,這方面有Momentum、NAG,、AdaGrad等各種優(yōu)化模型,,實(shí)踐中基本采用Mini-Batch的隨機(jī)梯度下降方法。另外,,怎么粗略地確定一個(gè)比較好的學(xué)習(xí)速率呢,?好像也只能通過(guò)嘗試??梢韵劝褜W(xué)習(xí)速率設(shè)置為較小值,,然后觀察training cost的走向,如果cost在減小,,那你可以逐步地調(diào)大學(xué)習(xí)速率,,如果cost在增大,那就得減小學(xué)習(xí)速率。經(jīng)過(guò)一番嘗試之后,,可以大概確定學(xué)習(xí)速率的合適值,。通常在訓(xùn)練時(shí)可以采用變學(xué)習(xí)速率的方式,即在訓(xùn)練的初期采用較大的學(xué)習(xí)速率,,隨著訓(xùn)練的迭代,,模型的精度提高則逐漸減少學(xué)習(xí)速率。


恒生的使命就是“讓金融變簡(jiǎn)單”,,我們也會(huì)在高頻交易等方面不斷進(jìn)行嘗試,,實(shí)現(xiàn)“投資者人人享有自己的量化交易模型”的夢(mèng)想,助力恒生搭建智能策略服務(wù)的PaaS平臺(tái),!

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多