摘要: 大數據時代將帶來人類生產力的又一次大解放和生產效率的巨大提高,移動互聯網絡將成為實現中國夢的重要載體,這本質上需要相互聯通相互融合的大金融體系。然而,多年來我國金融監管體系相互獨立,銀行、證券、保險行業相互割裂,難以適應大數據時代金融發展的要求,當前雖然面臨著移動互聯帶來的巨大機遇,但難以把握,反而受到互聯網企業的全面滲透,各行業處於不改變就被改變的境地

摘要: 上個星期,我花了一些時間參加了Numerai 的機器學習金融比賽。這篇文章就是我對於比賽的一些筆記:我嘗試過得一些方法,我做了什麼工作以及什麼工作我直接放棄不做。

摘要: In this second article on adversarial validation we get to the meat of the matter: what we can do when train and test sets differ. Will we be able to make a better validation set?

摘要: Many data science competitions suffer from a test set being markedly different from a training set (a violation of the “identically distributed” assumption). It is then difficult to make a representative validation set. We propose a method for selecting training examples most similar to test examples and using them as a validation set. The core of this idea is training a probabilistic classifier to distinguish train/test examples.

摘要: 隨著數據科學在人工智能發展中大放異彩,數據挖掘、機器學習進入了越來越多人的視野。而對於很多人來說,諸如機器學習之類的名次聽起來是神乎其技,但其真正的內涵卻不為一般人所知。

摘要: 近日南洋理工大學研究者發佈了一篇描述卷積網絡數學原理的論文,該論文從數學的角度闡述整個卷積網絡的運算與傳播過程。該論文對理解卷積網絡的數學本質非常有幫助,有助於讀者「徒手」(不使用卷積API)實現卷積網絡。

摘要: 在今年的 EMNLP 2017 上,臺灣大學黃意堯與加州聖塔芭芭拉大學 (UCSB)William Wang 教授有一篇合作論文被錄用。黃意堯撰寫了關於這篇論文的研究歷程,以供學習與參考。我們做了不改動原意的編輯與修改,將繁體字轉換爲簡體,並將一些臺灣常用表述轉換爲大陸的通用說法。