摘要: 雲端運算已經大力推行將數據存儲和處理,集中在網路的伺服器上。雖然這種方法對業務肯定有利(且如果沒有Slack和Dropbox這些服務的話)新的模式開始引起人們的興趣,起初卻似乎與雲端概念不一致。

摘要: 不久前 Google 發表的 Google Scholar(學術搜尋),方便查找論文。科學家、工程師或其他對數據有需求的人,這次也可以透過專門的搜尋引擎,更有效率找到關鍵資料。過去資訊散佈不同存放區,搜尋上有難度,如今 Google 建立起資料集搜尋引擎,雖然該應用程師仍在測試階段,但據 Google Dataset Search 的簡介表示,希望透過建立資料系統,鼓勵更多人使用科學家研究的心血發揮更大的影響力。

摘要: 最優化方法一直是機器學習中非常重要的部分,也是學習過程的核心算法。而 Adam 自 14 年提出以來就受到廣泛關注,目前該論文的引用量已經達到了 10047。不過自去年以來,很多研究者發現 Adam 優化算法的收斂性得不到保證,ICLR 2017 的最佳論文也重點關注它的收斂性。在本文中,作者發現大多數深度學習庫的 Adam 實現都有一些問題,並在 fastai 庫中實現了一種新型 AdamW 算法。根據一些實驗,作者表示該算法是目前訓練神經網絡最快的方式。

摘要: 在之前的文章《講透大數據,我只需要一頓飯》里,用做飯這件大家身邊的事情來介紹了大數據及資料分析工程,應該能夠讓大家對資料分析這件看上去很專業的行業有了一定的認識,很高興的是文章也得到了很多資料圈專業人士的共鳴和互動。 這篇文章我們會順著之前的思路,稍微深入一點,聊聊資料分析架構。

摘要: The visualization shows a Bayesian two-sample t test, for simplicity the variance is assumed to be known. It illustrates both Bayesian estimation via the posterior distribution for the effect, and Bayesian hypothesis testing via Bayes factor. The frequentist p-value is also shown. The null hypothesis, H0 is that the effect δ = 0, and the alternative H1: δ ≠ 0, just like a two-tailed t test. You can use the sliders to vary the observed effect (Cohen's d), sample size (n per group) and the prior on δ.

摘要: 金融大數據的運用有助於提高金融監管能力,重塑金融監管的方式。金融先進技術可以讓金融監管發揮更大的效力。先進的信息系統可以及時檢測金融市場與企業的動態大數據。