何謂網絡?
網絡分析是透過兩兩之間的個體關聯,所構造出的網絡型架構,利用其圖形結構的緊密程度、中心化程度、不同族群之間的連結關係......等,來觀察個體在網絡中的角色地位,或是整體網絡結構的隱含資訊。
如何得到兩兩關聯性?
依照資料類型有許多種的定義方法,舉個例子:社群網絡,利用是否互為好友或關注來建立關係,如果是好友給予強度2的連線,如果是關注則給予強度1的連線,藉此藉此建立網絡圖,強度可利用線的粗細來表達;而在金融界常見的股價資料,較常見的做法為利用各股票間一定期間的時間序列資料(e.g. 60日)來計算個股間的相關係數,並過濾掉關聯度太低的連結(e.g 相關係數<0.7,則設為0),藉此建立該期間的網絡連結強度關係。
相關係數矩陣可以直接轉換成網絡結構嗎?
可以的,不論在python、R中都有對應的語法可以將其轉成網絡結構,而所謂網絡結構是指兩兩個體之間的連線關係,矩陣表達形式如下
如何衡量網絡呢?
網絡的衡量主要可分為三個層次。
個體:個體網絡衡量主要在探討該個體與其他個體之間的差異,例如社群中,A是網紅,則其網絡密集度可能就會較高。
群體:群體網絡衡量主要在探討某個網絡中的群體與其他網絡中的群體的互動關係,例如:讀清華大學的人的好友圈與讀交通大學的人的好友圈是否緊密連結。
整體:整體網絡是衡量整體網絡結構有不平衡的現象亦或是有特殊的群聚情形,例如:國中同學間整體網絡可能就比研究所同學間網絡更加緊密
網絡的指標計算
此處不細談數學公式,維基百科上都能查詢到,且程式有library可以直接算,僅討論其變數意義
個體層次網絡指標:
連結度Degree: 與其他行動者的直接連結數目
內連結度In-degree:從其他行動者「接收」的連結
外連結度Out-degree:「送」給其他行動者的連結
關係涵蓋面Range (diversity):連結不同「他人」的程度
鄰近度Closeness:與其他行動者的鄰近程度(平均路徑距離)
居間度Betweeness:任兩行動者間需經過你才能連結到他人的次數
居中度Centrality:與其他個體連結的緊密程度
群體層次的指標與個體層次指標類似
整體層次網絡指標:
degreeCentralization : 衡量整體網路中有多少的點有連線
eigenCentralization : 較重要的連線會給予較多的權重,e.g:與網紅的連線給予較多權重,其餘同degreeCentralization(eigen value的概念)
assortativity : 衡量是否相似的點都傾向於互相連接,e.g:degree大的點都會連接degree大的點
averageDistance : 兩點間平均最短距離,衡量整體網絡連線的緊密程度
modularity : 網絡中群體間的獨立程度,值越大表示群體與群體間越獨立
以下為程式碼示例
若喜歡本文,請關注我們的臉書 Please Like our Facebook Page: Big Data In Finance
留下你的回應
以訪客張貼回應