摘要: 機器學習理論是基於統計學的, 而諸如時間序列分析、Monte Carlo method之類的方法也離不開統計學和經濟學。所以我在好奇是不是在掌握了ML的基本原理之後,再了解一些金融知識就可以嘗試Quant?
問:機器學習理論是基於統計學的, 而諸如時間序列分析、Monte Carlo method之類的方法也離不開統計學和經濟學。所以我在好奇是不是在掌握了ML的基本原理之後,再了解一些金融知識就可以嘗試Quant?
-------------------------------------------------------------------
回答者:知乎用戶袁浩瀚,畢業於加州大學伯克利分校(UC Berkeley),現任職於摩根士丹利(Morgan Stanley)。
答:謝邀。年前太忙了,好不容易完成一個firmwide的大項目,趕回家過年,偷得半日閒,來回答馬年的第一個問題。
首先要說明兩點,一是我離開每天讀paper的日子已經有些時間了,精準的旁徵博引的能力急劇退化,所以引用的觀點的來源,很可能出現謬誤,請包涵;二是以下看法很多源自我自己的理解,因此很可能引起爭議。
從Quantitative Modeling的角度來說,有兩大主流的方向:Stochastic Calculus(隨機微積分)和Statistical Learning(統計學習)。這兩個主流方向基本涵蓋了你所有可能用到的技術——隨機微積分,或者說金融數學,提供了各種衍生產品的風險估計基礎,也是處理新型資產定價的常用方式;而統計學習,則包羅計量經濟學、時間序列分析和各種機器學習方法。我個人比較喜歡用Q measure世界和P measure世界來指代這兩種方法,因為統計學習主要在真實概率空間進行分析,而隨機微積分在基於無套利假定而設立的Q概率空間進行分析。
好吧,我相信你已經暈了——為什麼在真實概率空間外,還會有一個Q概率空間,這不是一下子可以說清楚的問題,我就給一個簡單的例子,剩下的如果你還有興趣可以再自己研究:
假設現在只有兩種資產,一種是股票,一種是債券,假設一年後這個世界只有兩種情景,一種是好市場,一種是壞市場,各自出現的概率是60%和40% 。我們畫一個表格,就有:
t=0 | t=1 Good (60%) | t=1 Bad (40%)
Stock 1 | 1.2 | 0.8
Bond 1 | 1.1 | 1.1
表格里面的數字代表價格,比如第一行表示股票今天1元,一年後在好的情況下變成1.2元,而壞的情況下變成0.8元;第二行因為債券是固定收益,兩種請都是10%的收益。
那麼在P概率空間(真實概率空間),股票的Expected Return就是:
也就是4%,那麼這不符合金融數學均衡思想,因為其期望收益和無風險回報不相等(10%)。所有Q measure下面的兩種情況的概率應該是75%和25%,這樣股票的回報就成了:
這樣滿足了理論微觀經濟學的各種假設,你就可以基於此概率去定價一個期權了,或者其它更加複雜的衍生產品。
這套體係由Arrow在1965年建立,之後他也成為了諾獎得主。而基於這一體系誕生了Black Scholes(1973)期權定價公式,在很長一段時間內被業界奉為圭臬。
但是這一體系太理論化了,在實際做交易的時候會缺少指導意義。就好比Wolf of Wall Street裡面,Can you sell the pen now,那支筆有理論價值,比如市場同類的價格是多少,成本是多少,不能偏差太多,不然就有套利,但是你的交易價格可能遠遠偏離這個價格,因為這一單取決於購買者的現實需求,而這或許可以從歷史交易數據中得出,這就是統計學習方法可以應用的場景。
在業界呆了一段時間後,我開始重新思考這個問題——為什麼1960到2000年大量的金融研究在隨機微積分領域開展,而2000年後,大量的金融研究開始應用越來越複雜的計量經濟學和機器學習方法。我個人的看法是——早期數據的缺失,使得數學建模——隨機微積分成為唯一可行的方法,而2000年後數據的蓬勃發展,使得統計學習成為可能。要知道Fama在1970寫有效市場理論市場的數據是Dow Jones裡面30支股票的10年日交易數據,這是當時的大數據,而現在,所有股票的每單級別的數據也不罕見了,數據——信息驅動研究的變化,在每個領域都是一樣。這不難解釋為什麼機器學習逐漸主流了——30年前沒有數據,何來金融統計分析?
這兩種方法(Q世界與P世界)在一定假設下可以得到相同的結果,比如你設定同樣的無套利、經濟人理性等條件,隨機微積分與統計學習可以得到非常接近的期權定價。但是統計學習的好處是,你知道這個世界的不完美,你可以隨意放鬆無套利和理性交易這些太過嚴格的假設,依然獲得魯棒性不錯的模型。
那麼在今天的Quant世界,這兩者的應用是怎樣的呢?做風險和定價的Quant,還是採用傳統的隨機微積分為綱領,這種方法算出來的價格被交易員用來作為交易和對沖的指導,但是交易員的報價還是根據自己的判斷來進行;在山的另一邊,做程序化做市(Automatic Market Making)、資產配置或者高頻交易的Quant,無一例外的活動在P世界——基於大數據和先進的機器學習來發現交易機會。
是信息行業的發展重塑了整個金融研究,但這不意外——要知道數百年前就是提前獲得的關於英法戰爭結果信息幫助了羅斯柴爾德家族成為歐洲金融霸主——信息一直就是金融中最關鍵的edge。
從Quant自身來說,我覺得P世界——統計學習方向是未來,隨著數據越來越多,實證方法很有可能長期成為主流——甚至隨機微積分的傳統強勢領域也可能為之侵蝕。但是隨機微積分領域的很多理論與方法是古典經濟學的集大成之作,如果你想獲得更好的直覺,這些是必須深入研究的,不然你很可能淪為反复在同一數據上使用不同的統計包碰運氣的data miner。
Quant其實只是一種絕對理性和數量化分析思想的踐行者。也許今天我說的這些是Quant需要的技能,5年後或許又有了全新的一套體系。要做好一個Quant,唯一必須的就是對理性的信仰和Unquenchable Curiosity。
資料來源:煉數成金
留下你的回應
以訪客張貼回應