創(chuàng)意媒體學(xué)院學(xué)者研究語音控制文字編寫系統(tǒng) 榮獲谷歌獎(jiǎng)項(xiàng)
香港城市大學(xué)(城大)創(chuàng)意媒體學(xué)院助理教授劉燦博士獲谷歌研究頒發(fā)國(guó)際獎(jiǎng)項(xiàng),以表彰她對(duì)語音互動(dòng)文字編寫系統(tǒng)的開創(chuàng)性研究。
劉博士專注研究人機(jī)界面,榮獲2019/20年度谷歌教員研究獎(jiǎng),是該年度唯一獲獎(jiǎng)的香港學(xué)者。她的得獎(jiǎng)研究計(jì)劃名為「使用最少視像輔助的語音控制文字編寫系統(tǒng)」,屬於人機(jī)交互研究組別的項(xiàng)目。
本年度的谷歌研究獎(jiǎng)項(xiàng)競(jìng)爭(zhēng)激烈。經(jīng)谷歌1,100位專家嚴(yán)格評(píng)審所有遞交的研究計(jì)劃後,最終只有約15%的計(jì)劃獲得資助。
劉博士的研究主要以觀察和實(shí)證去了解人類的認(rèn)知和行為,從而設(shè)計(jì)未來的語音控制文字編寫介面。她的得獎(jiǎng)計(jì)劃指出,雖然目前智能電話一般設(shè)有語音打字功能,且辨認(rèn)語音的準(zhǔn)確度頗高,但當(dāng)用者須檢視或修改錄製的文字時(shí),用語音控制文字編寫的整體體驗(yàn)便會(huì)出現(xiàn)樽頸。用者須重新轉(zhuǎn)用鍵盤編寫文字,令語音交互體驗(yàn)被破壞,甚至失去價(jià)值。事實(shí)上現(xiàn)行的文字編輯介面設(shè)計(jì)並不適用於語音錄入及編輯。
有見及此,劉博士希望開發(fā)新的語音控制畫面支援系統(tǒng),令用者可在視覺和語音兩種輸入模式間暢順切換。新系統(tǒng)有別於用者須時(shí)刻注視畫面的傳統(tǒng)文字編輯介面,因此較能吸引用者在流動(dòng)裝置上使用語音輸入文字。劉博士希望了解用者在編寫及修改文字時(shí)的說話行為及注視規(guī)律後,再運(yùn)用機(jī)器學(xué)習(xí)及自然語文處理技術(shù)開發(fā)新的互動(dòng)方案。
她的目標(biāo)是開發(fā)一個(gè)只需自然地講話便可暢順編寫文字的系統(tǒng),用者在過程中可更快捷地編寫文字,而無須停止其他行動(dòng)及注視屏幕。
劉博士說:「我的研究計(jì)劃將有助進(jìn)一步開發(fā)語音互動(dòng)系統(tǒng)的範(fàn)式;也可減低用者注視畫面的要求,便利視障人士。」
谷歌教員研究獎(jiǎng)於2005年成立,旨在表彰及支持全球?qū)W府在電腦科學(xué)、工程學(xué)及相關(guān)領(lǐng)域的世界級(jí)研究,並鼓勵(lì)全球一流學(xué)者合作,為社會(huì)帶來具影響力的研究。
編輯注意:
檔案名稱:Photo_01
圖片說明:劉燦博士
新聞界查詢:城大傳訊及公關(guān)處黃慧婷(電話:3442 6819或9662 3518)
圖片下載 -- ( 注意:版權(quán)屬城大所有.此照片只供報(bào)導(dǎo)上述新聞故事之用.)?