寫在前面 關于人工智能如何結合金融的話題,,研投菌早就想做一次專門討論,,趁著國慶假日,我們花點時間做一次全面的透視如何,? 目前金融機構的主流玩法有四種: 1. 投資銀行和賣方研究嘗試自動報告生成,,2. 金融智能搜索;3. 公募,、私募基金在通過人工智能輔助量化交易,;4. 財富管理公司在探索智能投顧方向。 由于篇幅所限,,本文重點討論自動報告生成和人工智能輔助交易,,明日將對后兩個話題進行交流。文章或許有些專業(yè),,但保證不無聊,。 #人工智能與金融結合的思考#
文 | 文因新三板、維基百科,、上市公司公告 編輯:對沖研投 轉載請注明出處 1 自動生成投研報告靠譜嗎,? 在投資銀行的投行業(yè)務與證券研究業(yè)務中涉及大量的固定格式的報告撰寫工作,如招股說明書中的部分章節(jié),,研報,,以及投資意向書。這些報告撰寫需要大量的投行初級員工進行長時間枯燥繁瑣的數(shù)據(jù)羅列,、整理,、反復Copy-Paste工作。 目前,,自動報告生成主要運用自然語言處理(NLP)中的兩種技術: 自然語言理解(NLU):將日常話語消化理解,,并轉化為機器可后續(xù)處理的結構; 自然語言生成(NLG):將由機器拆分好的結構化數(shù)據(jù)以人們能看懂的自然語句表達出來,。 我們可以將這兩種技術理解看成對日常對話這一原料的拆分加工和整裝成可理解的自然語句——最終產(chǎn)品,。 然而真正生成報告還需要利用以上技術完成3個步驟: 1.處理海量異構數(shù)據(jù)
將投行分析師需要閱讀的年報,彭博新聞社的實時新聞以及數(shù)據(jù),,行業(yè)分析報告,,以及法律公告等資源進行消化。其中對于文本中的圖片和表格需要OCR(光學字符識別)等技術解析,。 2.分析數(shù)據(jù)這一過程涉及運用知識圖譜中常用的知識提取與實體關聯(lián)將其關鍵邏輯主干抽出,,結合事件地點等因素,將關鍵信息嵌入預先設計好的報告模板中,。 3.文章生成
經(jīng)過處理海量異構數(shù)據(jù)與分析數(shù)據(jù)的過程后,,即可生產(chǎn)新聞,,券商分析研報,上市招股書,,企業(yè)年報,,定增公告,甚至基金研究員開每日晨會所需的投資建議書也都可以用類似方式生成,。用戶只需選擇符合其需求的模板確定主題與關鍵信息,,以及報告呈現(xiàn)形式,便可生成基本內(nèi)容,。而且投行分析師可以進行校對與人工二次編輯,,加入有價值的觀點與結論,并提升報告精準度,。 自動報告生成已經(jīng)被廣泛的運用到新聞行業(yè)中,,代表的科技公司有美聯(lián)社投資的Automated Insights已為美聯(lián)社自動生成出10多億篇文章與報告。法國公司Yseop可以每秒生產(chǎn)3000頁內(nèi)容,,支持英語,,法語,德語等多種語言,,產(chǎn)品廣泛用于銀行,、電信公司的客戶服務部門以及財經(jīng)新聞網(wǎng)站,。
但是一些科技公司已經(jīng)不僅僅滿足于為新聞行業(yè)提供自動報告生成的服務,。 Narrative Science由西北大學的新聞系和計算機科學系的聯(lián)合創(chuàng)立,旨在通過給定主題的數(shù)據(jù)分析,,自動生成文章報告,。該公司的著名數(shù)據(jù)分析平臺Quill可以分析結構化數(shù)據(jù),將人工智能與大數(shù)據(jù)進行技術融合,,理解這些數(shù)據(jù)的重要性,,從而產(chǎn)生簡短的文字表述或結構化的報告內(nèi)容。Quill的主要面向?qū)ο鬄椤鹑诜仗峁┥獭? Narrative Science的CEO Frankel 表示“我們的目標是替代人工做絕大部分基礎工作,,讓機器來處理數(shù)據(jù)和信息”,。 2 人工智能如何輔助量化交易 量化交易從很早開始就運用機器進行輔助工作,分析師通過編寫簡單函數(shù),,設計一些指標,,觀察數(shù)據(jù)分布,而這些僅僅把機器當做一個運算器來使用,。直到近些年機器學習的崛起,,數(shù)據(jù)可以快速海量地進行分析、擬合,、預測,,人們逐漸把人工智能與量化交易聯(lián)系得愈發(fā)緊密,甚至可以說人工智能的3個子領域(機器學習,,自然語言處理,,知識圖譜)貫穿量化交易的始終。 1. 機器學習:從數(shù)字推測模型
量化交易分析師們對財務、交易數(shù)據(jù)進行建模,,分析其中顯著特征,,利用回歸分析等傳統(tǒng)機器學習算法預測交易策略。這種方式有兩個主要弊端,,其一是數(shù)據(jù)不夠豐富,,僅限于交易數(shù)據(jù),更重要的是它受限于特征的選取與組合(Feature Engineering),,模型的好壞取決于分析員對數(shù)據(jù)的敏感程度,。此外一種做法是,模仿專家的行為,,選擇某一領域的特定專家,,復制他們的決策過程,,并導入可重復的計算框架。 全球最大的對沖基金橋水聯(lián)合(Bridgewater Asspcoates)早在2013年就開啟一個新的人工智能團隊,,該團隊約有六名員工,,由曾經(jīng)供職IBM并開發(fā)了認知計算系統(tǒng)Watson的David Ferrucci領導。據(jù)彭博新聞社報道,,該團隊將設計交易算法,通過歷史數(shù)據(jù)和統(tǒng)計概率預測未來,。該程序?qū)㈦S著市場變化而變化,,不斷適應新的信息,而不是遵循靜態(tài)指令,。而橋水基金的創(chuàng)始人也曾公開表示,,其旗下基金持有大量多倉和空倉,投資120種市場,,持倉組合高達100多種,,并且以人工智能的方式考慮投資組合。
Rebellion Research是一家運用機器學習進行全球權益投資的量化資產(chǎn)管理公司,Rebellion Research在2007年推出了第一個純?nèi)斯ぶ悄埽ˋI)投資基金,。該公司的交易系統(tǒng)是基于貝葉斯機器學習,,結合預測算法,響應新的信息和歷史經(jīng)驗從而不斷演化,,利用人工智能預測股票的波動及其相互關系來創(chuàng)建一個平衡的投資組合風險和預期回報,,利用機器的嚴謹超越人類情感的陷阱,有效地通過自學習完成全球44個國家在股票,、債券,、大宗商品和外匯上的交易。 (責任編輯:幽靈學院) |
|