以圖像呈現(xiàn)高維數(shù)據(jù)
Professor Joe Qin Sizhao
秦泗釗教授

 

香港城市大學(城大)數(shù)據(jù)科學學院院長兼講座教授秦泗釗教授主講「校長講座系列:學術薈萃」時指出,數(shù)據(jù)科學工具幫助我們更清楚了解眾多領域的不同維度,包括失業(yè)數(shù)據(jù)、大學排名、城市電力供應、製造業(yè)生產(chǎn)等。

秦教授說:「數(shù)據(jù)分析帶來資訊與知識,可用於預測和推斷因果關係。我們先選定一個問題,然後收集數(shù)據(jù),再查找動態(tài)特徵。」他也是香港數(shù)據(jù)科學研究院院長。

秦教授說他選擇「以圖像呈現(xiàn)高維數(shù)據(jù)」作演講題目,是因為在充滿數(shù)據(jù)的世界,數(shù)據(jù)科學視覺化可廣泛應用。本次講座以網(wǎng)上形式進行,並設有限現(xiàn)場觀眾。

他指出,據(jù)估計每年約有200萬億條推特,維基百科網(wǎng)有逾5,200萬頁,科睿唯安科學網(wǎng)則有7,900萬篇學術論文。如果沒有視覺化工具,人們對這些數(shù)據(jù)集的龐大規(guī)模,幾乎無法形成明確的概念。

為了說明這個觀點,秦教授播放一段短片,展示新創(chuàng)意在某些歷史時刻匯聚、萌芽和演變的過程。錄像講述一篇開創(chuàng)性論文受學術研究影響的程度,這篇論文是1950年代由英國生物學家克里克與美國分子生物學家沃森發(fā)表關於雙螺旋的研究;以及後來的研究從兩位科學家最初發(fā)表的論著中獲益之廣。

此外,秦教授解釋了數(shù)據(jù)科學工具可揭示數(shù)據(jù)「暗面」(例如新技術開發(fā)中的不確定事項)的方法,而非僅是為了突出算法生成數(shù)據(jù)的積極「白面」。

在結論部分,秦教授指視覺化工具在很多領域均不可或缺,包括商業(yè)分析、金融科技、電子商務、社交媒體分析、健康資訊學、工程系統(tǒng)、智慧城市科技等。隨著大數(shù)據(jù)和數(shù)據(jù)科學迅速增長,對視覺化工具的需求將與日俱增。