「科技創(chuàng)新服務(wù)」涉及研究項(xiàng)目的管理、研究成果的推廣與技術(shù)轉(zhuǎn)移等範(fàn)疇,但往往因不同資訊系統(tǒng)的數(shù)據(jù)難以共享,而遇到科研資訊「碎片化」的挑戰(zhàn)。香港城市大學(xué)(城大)的科研團(tuán)隊(duì)全力開發(fā)生成式人工智能(GenAI)技術(shù),建立「科創(chuàng)GPT」,通過創(chuàng)建科研知識(shí)圖譜,勾勒出科研項(xiàng)目、論文、專利等之間的關(guān)係,並在數(shù)據(jù)安全及私隱保障前設(shè)下,以助成立不同領(lǐng)域的知識(shí)庫,促進(jìn)知識(shí)共享。項(xiàng)目最近更獲政府「產(chǎn)學(xué)研1+計(jì)劃」撥款資助。

為解決「資訊孤島」(information silos)的問題,自2007年起,城大資訊系統(tǒng)學(xué)系馬建教授及團(tuán)隊(duì)致力開發(fā)並不斷改良「科研之友」(ScholarMate.com)平臺(tái),使它成為中國最專業(yè)的協(xié)同創(chuàng)新網(wǎng)絡(luò)平臺(tái),成功連繫政府資助機(jī)構(gòu)、大學(xué)、科研機(jī)構(gòu)及科創(chuàng)公司,促進(jìn)合作與知識(shí)共享,實(shí)現(xiàn)科研成果(如學(xué)術(shù)論文與專利)共用。科研之友迄今有超過800萬名註冊(cè)用戶,收錄達(dá)7,800萬項(xiàng)研究成果。
憑藉科研之友的經(jīng)驗(yàn),馬教授的團(tuán)隊(duì)以此為基礎(chǔ),現(xiàn)正開發(fā)新一代的「聯(lián)邦學(xué)習(xí)技術(shù)」(Federated Learning Technology),結(jié)合了科研知識(shí)圖譜(knowledge graphs)與大型語言模型(Large Language models,LLMs),同時(shí)以去中心化模式,促進(jìn)創(chuàng)新網(wǎng)絡(luò)平臺(tái)上的用戶,共同訓(xùn)練及微調(diào)上述圖譜及模型,著力推動(dòng)及實(shí)現(xiàn)科技創(chuàng)新服務(wù)的數(shù)碼化轉(zhuǎn)型,從而釋放生成式人工智能的力量。
此項(xiàng)目近日獲得了香港特區(qū)政府創(chuàng)新科技署推出的「產(chǎn)學(xué)研1+計(jì)劃」資助。
圖譜勾勒科研項(xiàng)目關(guān)係 提供人工智能助理
項(xiàng)目旨在創(chuàng)建一個(gè)具有生成式人工智能能力的智慧協(xié)同創(chuàng)新網(wǎng)絡(luò)平臺(tái),保障數(shù)據(jù)安全、私隱,並具有運(yùn)營效率。新平臺(tái)將專注於創(chuàng)立及構(gòu)建內(nèi)容全面的科研知識(shí)圖譜,即以圖譜方式,勾勒出全球各間大學(xué)、研究機(jī)構(gòu)和科技公司內(nèi)部的研究人員、科研項(xiàng)目、研究論文和專利等之間的關(guān)係。按照國家研究學(xué)科的標(biāo)準(zhǔn)和相關(guān)新興產(chǎn)業(yè)來組織數(shù)據(jù),目標(biāo)是利用科研知識(shí)圖譜,生成針對(duì)特定領(lǐng)域的全面知識(shí)庫。

通過充分利用協(xié)同創(chuàng)新網(wǎng)絡(luò)平臺(tái)的大量研究論文和專利,城大科研團(tuán)隊(duì)將進(jìn)一步訓(xùn)練和微調(diào)一個(gè)基於大型語言模型的專業(yè)領(lǐng)域「科創(chuàng)GPT」,即STIGPT(Science, Technology and Innovation GPT)。這個(gè)生成式人工智能模型能夠利用語意搜索、智能推薦和度身訂造的個(gè)人化內(nèi)容生成,為研究機(jī)構(gòu)和科研人員,提供可促進(jìn)知識(shí)共創(chuàng)的人工智能助理服務(wù)。
同時(shí),團(tuán)隊(duì)將開發(fā)「聯(lián)邦學(xué)習(xí)技術(shù)」,以去中心化的訓(xùn)練方法,促進(jìn)平臺(tái)上的用戶,共同訓(xùn)練及微調(diào)科研知識(shí)圖譜和大型語言模型。這項(xiàng)技術(shù)能在提高大語言模型的準(zhǔn)確性和適應(yīng)性的同時(shí),確保數(shù)據(jù)安全和保障個(gè)人隱私,並通過科創(chuàng)GPT大模型,為用戶提供個(gè)人化及適用於其特定領(lǐng)域的科技創(chuàng)新服務(wù)。
開發(fā)低代碼智能系統(tǒng) 減程式編寫難度
再者,城大研究團(tuán)隊(duì)亦將開發(fā)一個(gè)「低代碼智能系統(tǒng)開發(fā)平臺(tái)」,可以簡化及降低程式編寫的難度,令機(jī)構(gòu)用家能夠以最少的編程工作量,制定及實(shí)現(xiàn)數(shù)碼轉(zhuǎn)型解決方案,從而顯著降低使用門檻,大幅提升營運(yùn)效率。

研究團(tuán)隊(duì)預(yù)期,通過整合科創(chuàng)GPT與科研之友,可以打造出全球首個(gè)具有生成式人工智能的智慧協(xié)同創(chuàng)新網(wǎng)絡(luò)平臺(tái),以連繫各間大學(xué)和企業(yè)的研究人員,共同創(chuàng)造知識(shí)產(chǎn)權(quán)。這項(xiàng)研發(fā)成果也可以推動(dòng)、加速各種科技創(chuàng)新服務(wù)的數(shù)碼化轉(zhuǎn)型,包括智慧科研管理、學(xué)術(shù)會(huì)議出版服務(wù)、研究成果推廣,以及技術(shù)轉(zhuǎn)移服務(wù)等。這些轉(zhuǎn)型將帶來更高效率的決策過程、更簡化的流程,並可以加強(qiáng)政產(chǎn)學(xué)研之間的合作。
事實(shí)上,科技創(chuàng)新服務(wù)的市場潛力極為巨大,尤其是中國在科研和技術(shù)發(fā)展領(lǐng)域的投資非常可觀。在城大的創(chuàng)新創(chuàng)業(yè)旗艦計(jì)劃HK Tech 300的支持之下,馬教授的科研團(tuán)隊(duì)已成立了初創(chuàng)「創(chuàng)新城技術(shù)服務(wù)有限公司」(InnoCity.com),藉此把研究成果商品化,尤其專注於生成式人工智能在技術(shù)轉(zhuǎn)移中的應(yīng)用,以開拓當(dāng)中充滿潛力及前景的市場機(jī)遇。
「通過在協(xié)同創(chuàng)新網(wǎng)絡(luò)平臺(tái)上充分運(yùn)用生成式人工智能技術(shù),這研究項(xiàng)目將可加速研究與創(chuàng)新的步伐。」馬教授總結(jié)上述新項(xiàng)目可能帶來的技術(shù)突破。他補(bǔ)充,項(xiàng)目可促進(jìn)產(chǎn)學(xué)研用戶的知識(shí)共創(chuàng),從而提升科技創(chuàng)新服務(wù)的質(zhì)量和效率,「這與政府有意把香港定位為國際創(chuàng)新科技樞紐的政策相一致。」