LMSSitesePortfolioRegisterLogin
閒話腦神經科學_網絡新世界—社會網絡分析(SNA)
by 陳怡蓁, 2012-08-28 15:45, Views(968)

網絡新世界

社會網絡分析(SN A)

 

臺灣大學  謝豐舟教授

 

  20065月,媒體報導美國國家安全機構運用社會綱絡分析Social Netword Analysis, SNA)的技術來掃描電話通聯記錄,以追尋恐怖分子的行蹤。此一報導使SNA聲名大噪。

  SNA的研究已有70年的歷史,它在商業、生物學、社會政策、流行病學以及電腦網絡都有貢獻。近年來,有些電玩以及電視節目也以SNA為經緯。廣義而言,SNA是研究個人之間、機構之間、國家之間的連結架構。

SNA工作人員觀察人們或與之面談(nodes),獲知他們每天的例行生活,將之畫成圖表(path),加以分析,從而發現以前未為人知的結構。在只針對少數幾個人的分析中,看起來微不足道的連結(connections),換成較大的網絡時,卻可能呈現驚人的複雜性,特別是考慮一個個人可以有許多不同性質的連結時,更是如此。為了應付這些情況,SNA工作人員必須借用統計學,圖表理論(graph theory)、理論模擬(theoretical modeling),甚至認知分析(cognitive analysis)的方法。利用認知分析於SNA,可以研究個人對社會結構的感知,例如你認為是屬於某一派系跟誰真正是派系的一員之間的落差。

 

世界真小?關鍵在網絡!

  SNA研究的結果往往有異於我們的直覺(counterintuitive),例如,你想要與某一個新公司的經理接洽,你可能會找上那個公司裡人氣最旺的軸心人物(hub),然而這種hub人物可能太過忙碌,不易接觸。因此,反而是透過另外不是那麼中心的人物比較有效。許多公司開始利用SNA以獲知公司裡,實施上誰的跟誰對話,而不是只看誰是歸誰管。能夠正確地追蹤個人的社會網絡,而不自限於傳統的想法,在公共衛生和公共政策的規劃上至為必要。

  SNA傳統上就是跨領域的學門,90年代末期,物理學者發明了兩種模式,使更多學門加入SNA的行列。1998年康乃爾大學的Duncan WattsSteve StrogatzNature發表了Small world problem的模擬程式。1999年印第安那大學的Albert-László Barabási也在Science發表Scale fee network的模擬程式。

  所謂Small world problem其實是你我都有的經驗。例如在你表弟的婚禮宴席上,坐在你旁邊就是你以前老闆的離婚丈夫。1967年哈佛大學教授Stanley Milgram開始探討這些巧合是否只是傳奇,或是另有玄機。他請住在美國中西部的志願工作者郵寄包裹給在波士頓的陌生人。寄件者不能直接寄給收件者,而必須透過自己的親友或熟人轉寄。Milgram發現從寄件者到收件者之間,平均轉了五手,也就是形成六環的鎖鍊(6-linked chain)。這就是目前廣為流傳的句子six degrees of separation的起源。

  WattsStrogatz思索運用什麼樣的數學可以模擬Milgram小小世界。純粹隨機(random)的聚合不可能產生我們大部分人所身處的緊密朋友圈。不過,如果世界都是緊密的聚合,卻又為何會是相隔six degrees呢?他們的結論是:網絡必然分佈在聚合與隨機之間,既有緊密聚合的朋友圈,也有捷徑可以通到整個網絡的任何一點(Networks must exist on a sliding scale between clustered and random, producing tightly knit groups of friends but also short paths that reach throughout the whole network)。

這篇論文因為它可以模擬電力網絡電影演員的合作人脈,以及線蟲的神經網絡而大大出名。這篇論文提出clustering coefficient的觀念,以數學模擬朋友的朋友現象如果John認識MaryMary認識SueJohn認識Sue的可能性可以用clustering coefficients加以衡量。此一觀念已經廣泛運用於從神經科學到生物資訊學的生物網絡分析,例如clustering coefficient可以作為兩個基因是否同時表現的客觀標準。

 

 

命中目標的關鍵為何

雖然這篇論文造成轟動,不過卻忽略了一個要緊的問題,康乃爾大學的Jon Kleinberg 2000年在Nature指出這個理論可以解釋Milgram實驗中的包裹如何接近其設定定的目標,但卻不能解釋最後如何命中目標。真正隨機的連結可以讓你繞過半個地球,但在最後100公里都不能讓你命中標的Kleinberg提出另外一個模擬程式,只要使用一些運算,就可以在一個巨大的網絡中發現到達特定目標的路徑。此一方法成為許多電腦搜尋運算方式的基礎。Watts說:Jon指出了我們所忽略的searchability

  2002Watts等人又在Science發表另一篇論文,改進其原來的模擬程式,他們加入了multiple interest的元素。一個在加州的神經科學家如何與一個在德州的農人搭上線呢?原來兩人有一個共同的嗜好徒步旅行。Watts強調,真正重要的概念是人際網絡不是一個一維的圈圈,而是一個多維的網格。惟其如此,才能了解six degrees of separation中的short path

 

網絡連結存在「富者愈高」現象

  1998年許多因素的不期而遇:包括大量資料的運算與儲存,整個社會致力於將資訊放在網際網路上,這些現象刺激了數學家與社會學家的攜手合作。WattsStrogatz將傳統上互不對話的領域融合,淬鍊出經典之作。

  2000BarabásiAlbert的論文,又使研究細胞及神經網路的生物學家與神經科學家大為振奮。Barabasi對網絡可以是隨意分布相當不以為然。他認為Internet上這些電腦絕不可能是隨機的連結,細胞裡的諸多分子更絕不會是隨意的連結。他相信網路中必然有某種結構,而非隨機的連結,借用物理學上的辭彙,BarabasiAlbert提出scale free network的觀念。Scale fee network依循的是冪次法則(Power law),不像一般人熟知的高斯正常分布(bell curve)。冪次法則的分布是極為偏移的(skewed)。在網路上而言,這表示有些高度被連結的軸心擁有了大部分的連結。依循冪次法則,一個活躍而成長的網絡中會有優先連結preferential attachment)的現象,基本就是富者愈高。當你已經有許多連結時,新的連結將更容易產生。

  此說一出,科學家發現似乎到處都可見冪次法則的蹤跡。生物學研究者發現細胞訊息傳遞網絡中有軸心蛋白質(hub protein)存在,其上有密密麻麻的連結,而有些蛋白質的連結則少得可憐。

  當然,也有學者挑戰Barabasi的學說。有人認為Barabasi用的方法,物理學上可行,但用在技術層面及生物學上必然會出錯。不管是否如此,目前Barabasi有興趣的是網絡動力學(network dynamics)。他探討的是:網絡的結構如何響其內的活動。他與更多傳統的社會學家如政治學者合作,例如美國哈佛大學甘乃迪政府學院的David Lazar,結合物理學家處理大量資料庫的能力,與社會學者探討人類行為的能力,來一窺網絡內的活動。

  Lazar指出,這種新興的網絡科學(network science)在許多不同學門學者的合作下,有朝一日,將會成功串連人類與非人類的網絡,換句話說,SNA的影響將與日劇增。

 

 

推薦讀物

Heyman KMaking connections. Science 313:604, 4 August, 2006.