Friday, May 25, 2012

CHI 2012 會議報告

The Association for Computing Machinery (ACM)是國際上資訊科學與工程最主要的學術組織之一,SIGCHI是ACM下幾個主要的特別興趣小組之一,其所舉辦的CHI國際會議一般公認為人機互動領域最盛大也最頂尖的國際會議。此次CHI 2012的會議為第三十屆,在美國德州奧斯汀(Austin, Texas)舉辦,一共吸引了1577篇主會議論文投稿(不含海報與workshop論文)的投稿,其中370篇被錄取於正式會議報告,錄取率(acceptance rate)為23%。

審稿參與 

此次個人雖有投稿,但未入選此次議程。個人此次最大貢獻在擴大審稿的參與,一共受邀審查了12篇正式會議的投稿。就個人過去幾年CHI與CSCW投稿與審稿的經驗,SIGCHI會議的學術品質並非僅依賴acceptance rate把關。Acceptance rate僅是表象,更重要的是總理各子領域審稿的召集人與副主席們(Associate Chair又稱Program Committee member 或meta-reviewer)都是各領域最具能見度與聲譽的研究者,審稿過程嚴謹,就個人經驗並不遜於許多期刊。

在SIGCHI最主要的幾個國際會議(CHI, CSCW, UIST, Ubicomp等),每篇投稿由一位領域相近的Associate Chair(AC)負責,邀集3-4位審稿者進行實質審稿,接著AC需整理所有審稿者意見,提供後設意見(meta-review)以呈現不同審稿者的意見間的異同,做一較概括, 總合性的陳述與評價。到此,論文審稿過程仍未結束,所有的意見與後設意見在此時會送回給論文作者閱讀,作者可對這些意見進行說明辯解(rebuttal)。接著AC還需要再閱讀作者的補充說明,然後所有的AC需參加為期一到兩天的審稿會議,面對面討論所有的審稿意見與作者說明,有爭議的論文在這個過程中還會再請其他AC提供意見。經過這樣縝密的審稿過程後,一篇論文才會被決定是否接受。個人過去的投稿有時可收到總長達七至八頁的審稿意見,審稿者這些表面上看不見的貢獻是SIGCHI整體社群之學術品質的維持與進步相當重要的一環。

會議經過

整體而言,此次會議維持CHI一貫的高品質與多元性,各個人機互動子領域像是電腦輔助合作工作, 互動技巧, 設計方法, 使用者經驗研究, 各領域應用(環保, 教育, 遊戲)等兼容並蓄,同時有10個以上的平行議程(parallel sessions)在進行,完整涵蓋各個子領域最前緣的研究現況。個人的研究專長在電腦輔助合作工作與社群運算等主題,因此也特別注意相關論文的發表。一個觀察是人智運算(human computation)及群眾外包(crowdsourcing)等利用「電腦中介人際互動」(非一人一機間的互動)來組織運用人們的計算能力以解決電腦上還未能有效解決的問題(例如文字或媒體之內容分析)已成為研究上的一個熱點。今年至少有三個sessions,十多篇論文報告這方面最新的研究,研究的內容相當多樣有趣,從人智運算流程/演算法到應用系統的設計與評估(例如利用群眾進行旅程規劃),相信近年這方面的研究還有一定發展空間,而實際的應用也將更為普遍。另外線上社群與社群網路的研究雖已發展一段時日,今年仍有相當不錯的研究,像是透過對Twitter訊息間內容相似度的分析來了解訊息內容多元性與線上社群維持間的關係。

大會所邀集的開幕與閉幕演講相當精彩,極富啓發性。開幕演講之講者為YouTube的使用者經驗部門的主管Margaret Gould Stewart談使用者如何透過影片上傳來形成社會性的連結以及產生前所未有的使用經驗。閉幕演講則邀請到MIT Media Lab的Hugh Herr教授。Herr教授談的是智慧型義肢的設計,談如何運用對人類行走背後生物力學與神經控制的了解來設計智慧義肢,使下肢障礙者能重新自然地行走甚至跑跳。Herr教授自身因為意外而喪失兩隻小腿,也因而投入智慧義肢的深度研究,其演講過程以自己穿著之義肢示範其成果,極具說服力,也讓許多聽眾印象極為深刻,成為會議結束前的另一個高潮。

綜合感想

人機互動研究旨在探討人與機器間既有與可能的關係,其涵蓋主題範圍相當廣泛,傳統「使用者介面」此一概念已經不能完整代表今天最前緣人機互動研究的面貌。就個人觀察,人機互動研究主題雖然多樣,方法取向雖然不同,核心精神確是相當一致且廣為國際研究社群所認同:亦即應重視使用者的本質與特性,注意到科技的價值並非絕對,而是相對於使用者與使用脈絡而存在。當科技無所不在,使用者遍及普羅大眾,科技設計已非「少數人會用就好」或者「勉強可用就好」,更需精益求精,深入瞭解使用者需求,使科技設計符合人性,並創造發現個別科技設計對人特有的價值與益處。

另一感想是今天的研究發展工作均須面對高度國際競爭。圖一為在開幕式時SIGCHI主席報告「各國與會人數」時的投影片。有兩個觀察,第一是與會人數的排序與國家總人口數並無絕對關係,比較像是反映了各國在人機科技設計面向上興盛繁榮的程度。第二個值得注意的是,韓國的與會人數已經超越日本,達到87人,位居第五位。而就台灣與會者非正式統計,此次代表台灣機構與會以及在海外留學或工作的台灣人與會者共約20位。而真正代表台灣機構與會者僅有11人。若再加上國內學界業界其他熟知且會參加CHI但此次不克參加者,總數可能仍不超過20人。相較於韓國87人的與會者數目,比例小於1/4。在會議論文集以 “Korea”與 “Taiwan”為關鍵字搜尋,前者出現超過100次,後者則為26次。基於韓國與台灣過去在社會與經濟發展上的相似與競爭,我想這些訊息某種程度上顯現了台灣學界與業界對這個領域的注意可能仍相對不足,與國際的接軌仍應繼續提升。我想我們需要積極努力提升國內整體人機互動之基礎研究, 教育與實務,一方面希望我們迎頭趕上,在此領域發展我們的特色,另一方面,也需注意到我們不要因為這方面發展的不足而造成整體不利的影響。


圖一: CHI 2012 各國與會人數

Monday, May 14, 2012

人機互動導向線上社群研究之概貌

國立清華大學資訊工程學系助理教授 王浩全

原文刊於<網路通訊國家型科技計畫簡訊> 2012年4月38期
http://www.ncp.org.tw/vanilla/index.php?id=164

隨著通訊技術與網際網路的發展與普及,人際間的遠距溝通與合作已經不再是一個那麼困難的問題。如同眾多的使用者所經驗的,人們從九零年代起便逐漸可以以低廉的代價與遠方的使用者進行單向或雙向即時的溝通,更可透過文字、聲音與影像等多種媒介傳達訊息。我們似乎可以樂觀地下結論:「距離已死」,我們已經解決了物理距離對人類溝通所造成的阻礙[1]。然而,故事尚未結束,近年來新一波網路應用浪潮再起,帶來了線上社群,今天人們不但可以在線上傳訊討論,更可透過「使用者產生內容」(將內容發佈的權利由網站擁有者下放到一般使用者)、「實名制」(使用真名發佈訊息)與「好友名單」(與特定使用者建立好友關係作為資訊存取限制的依據與資訊流通的管道)等機制在線上維持與擴增人際網路。這些設計概念的價值可從Facebook、Twitter等各類社群應用的普及程度得到一些佐證。新興線上社群在跨越物理距離的資訊傳播之外也帶給我們一些前所未有的社交互動體驗。

雖然新穎的社群科技帶來相當的便利,一個持續的課題是—在「物理的距離」之外,在線上溝通互動的當下,是否可能影響改變了人際間「心理的距離」?例如,當透過文字或視訊取代面對面的溝通,我們是否在表達個人想法與理解他人想法上遭遇一些困難?當我們能輕易在網路上集結聚會,線上形成的社群其組織特性是否與傳統社群有所不同?作為社群科技的設計研究者,我們是不是能透過社會與行為科學中累積對人的認識得到一些線索與啓發?

人機互動的研究者,例如ACM SIGCCHI [a]研究社群的參與者觀察到我們並未全然瞭解科技對使用者在心理、行為、社會各個層次上可能的影響,而科技設計者對於如何設計出對使用者有用有效的科技有時也缺乏足夠的理論與實證基礎作為依據或引導。當科技與人性的交會無所不在,對於線上社群的研究往往也難以劃出「科學工程」與「人文社會」的學科界線,在ACM SIGCHI更常見的是結合資訊科學工程技術與社會科學理論方法從事以解決實際問題為導向的研究工作。筆者在此試圖對幾個研究取向作大致介紹,希望能提供一個概貌。

根據筆者的觀察與分類,社群相關的人機互動研究大致有三個面向:(1)以科技輔助人們(using technology to support people),(2)以科技瞭解人們(using technology to understand people) 以及(3)以人們作為科技的一部分(involving people as part of technology)。這三個面向彼此間並非毫無交集,反而是相輔相成,透過研究社群進行對話影響彼此。

以科技輔助人們

「以科技輔助人們」的面向其中心議題在了解使用者的需求為何、現有科技之特性如何影響線上溝通合作、並進而提出設計以輔助使用者達成他們的任務。電腦中介傳播(computer-mediated communication, CMC)與電腦輔助合作工作(computer-supported cooperative work, CSCW)等主題可視為這個面向的代表。一個觀察是人們在線上能傳播的訊息類型較面對面模式較為有限。例如以文字為基礎的溝通像是email、MSN chat或Twitter便缺乏聽覺線索(auditory cues)與視覺線索(visual cues),使溝通中的兩人無法感知到對方在言語表達當下的聲調、臉部表情與身體姿勢所可能隱含的意義。即便以一般以臉部攝影為主的視訊工具作為輔助,人們仍無法取得某些面對面溝通時可輕易感知的線索,像是彼此對共處空間狀態的共享知識(shared knowledge)[1]。當溝通雙方共處一地時,人們很自然地能夠看到對方所看到的,知道對方所知道的(至少與空間相關的部分),並能感知對方當下狀態為何(例如是否在座位上或是否忙碌),以決定發言的時機與內容。

這樣的共享知識或「共有基礎」(common ground)[2]為諸多人際溝通與合作作業的基礎。例如當某甲向某乙詢問如何前往某個地點,若甲乙兩人共處一地,乙可使用「往那邊走,過紅綠燈」的措辭並搭配手勢指示與甲溝通此空間知識。但若甲乙兩人透過電話討論此事,則對話勢必變得更加複雜,例如某乙可能需要一再確認某甲所見景物以推論其確切位置以決定對話內容。這可能增加認知與溝通上的負荷,誤解的機會也隨之提高。

許多科技設計嘗試彌補線上溝通共有知識基礎之不足,像是NTT之t-room [b]使用涵蓋上半身並允許在一定範圍內活動而不會脫離視野的視訊使遠距溝通變得更為自然[3]。另外,將電腦中介傳播模式原先所遺失的訊息透過其他管道明確而外顯地傳達亦為一種可能的設計。例如將個人所在位置(在辦公室或在家)以及忙碌狀態直接在遠端合作者的介面上顯示便可對線上溝通有所幫助[4]。

以科技瞭解人們

「以科技瞭解人們」的面向泛指使用計算方法或工具對線上與傳統社群進行探究。相較於「以科技輔助人們」面向著重於微觀之人際互動與溝通歷程,「以科技瞭解人們」面向則著重於研究巨觀的社群現象與社會結構。微觀層次的研究一般希望能為互動設計提供較直接的啟發,因此常透過細緻的觀察詮釋與控制實驗以對線上互動背後之因果機制有所瞭解。巨觀層次的研究則希望能歸納整理出大規模社群資料背後所隱含的意義,在研究方法上多運用「科技」(在此指計算工具)來發掘量測線上行為或進行因素間關聯性或社會結構之建模,協助社會行為科學進行對社群本質的探究。
                                                                         
例如研究者利用能捕捉語言使用者在各心理面向上狀態的關鍵字計數工具LIWC [c]來剖析人們在Twitter所留上的大量訊息背後所代表之情緒狀態[5]。結果發現全球人們在早晨具有較好的情緒,而隨著一天時間慢慢流逝而情緒逐漸變差。類似地,以週為單位來看,人們在每週的開始情緒較差,而週末則擁有較好的心情。這些與我們直覺吻合的行為模式過去難以得到大規模資料的實證,線上社群提供給科學家一個新的研究空間來探討一些可能懸而未決的研究問題。

由於許多線上社群是以人際網路作為資訊傳播與線上互動的基礎,肇始於社會科學之社會網路分析(social network analysis, SNA)方法便可用於探討線上社群之網路結構特性[6]。例如研究者分析Twitter使用者間「追隨他人」(following)與「被追隨」(follower)的關係,發現Twitter的網路結構性質與一般的社會網路不太相同[8]。Twitter上人際關係並不對稱,A追隨B不代表A也會被B所追隨,根據分析只有22%的成對使用者具對稱關係,而部分類型的使用者明顯為他人單向追隨的對象,像是影視明星、政治人物或大眾媒體等。計算任何成對使用者間的「距離」或分離度(degree of separation,亦即兩者間透過第三者中介連結的數目),Twitter的分離度平均為4.12較一般社會網路常見的6度分離(例如MSN上成對使用者90%之分離度為7.8,中間數為6) 要更小,人際間的距離要更近[7]。這些分析顯示Twitter不是一個單純的社會網路,其社會網路結構反映其亦具備能廣泛散播個人訊息的媒體性質。

以人們作為科技的一部分

科技與人的關係除了以科技輔助人們活動及透過科技來增進我們對人的基礎認識之外,第三個可能的面向是以人的能力來彌補科技的不足,進而以人們作為科技的一部分。研究者注意到一些對人來說簡單自然的任務對於今天的電腦卻可能仍是相當困難,例如圖片內容的辨識或句子意義的解讀。從實用的觀點來看,或許解決這些問題的最好方法便是設法使人能投入從事這些作業。

一個觀察是雖然使用電腦模擬人類智能來解決這些問題可能相當不容易,我們卻可能可以設計簡單的機制來提升人們處理資訊的動機、收集資訊處理的結果,並進而利用這些處理過的資訊。舉例而言,圖片的文字標簽作為後設資料對於圖片的搜尋檢索相當重要,然而使用者在上傳圖片時未必有動機去花時間對圖片內容提供準確的文字標簽或敘述,降低了這些影像資料後續可被檢索利用的可能性。研究者就此提出ESP遊戲 [d],將線上玩家隨機配對,呈現一共同圖片讓雙方猜想圖片的關鍵字為何,一旦雙方關鍵字吻合則得分。類似這樣的遊戲機制一方面提供了玩家一些有趣的娛樂,一方面則有其嚴肅用途。此類「有目的的遊戲」(Games with a Purpose, GWAP)自然地提供了使用者從事資訊處理作業的動機,並透過互動遊戲機制的設計來巧妙的驗證人類作業結果的正確性[9]。

此考慮人類與電腦在資訊處理上各自的特性與限制並透過系統設計予以結合以最大化各自優點的典範統稱為「人智運算」(human computation)。在線上社群情境中,一個類似但不同的想法是改以群眾作為資訊處理作業的基礎,透過線上平台將任務「發包」轉由廣大非專業群眾處理。這樣「群眾外包」(crowdsourcing)的機制主要著重在其可快速進行大量作業的優點,但也注意到交由非專業大眾在無控制的線上環境下作業可能犧牲結果的部分品質。研究發現在Amazon的Mechanical Turk平台上進行群眾外包,其作業品質有時可能不能與專業人員相比,像是讓群眾評量Wikipedia文章的品質,發現群眾評分與專業人員的評分僅有中度相關(r=.5, p=.07)[10]。但有趣的是,一些小小的設計便可能改變群眾的作業行為增進整個「社群作業系統」的效能,當研究者在要求群眾在評分文章前回答一些內容性問題,像是該文章參考文獻的數目、圖片的數目及文章段落的數目,並要求群眾針對該文章提供一些關鍵字以促使群眾閱讀處理文章內容,結果顯示與專業人員的評分相關性有所提升(r=.66, p=.01)[10],更接近一般社會行為科學研究對於內容分析之信度(reliability)所要求的水準。

結語與下一步:文化差異的考慮

本文嘗試整理人機互動導向線上社群研究的幾個不同面向,提供一個初步的概貌。由於目的在提供概貌,為文過程不免遺漏,希望能集思廣益,進一步釐清人機互動研究在線上社群研究設計所能扮演的角色。另外,如同先前所述,區分這些不同面向主要目的在提供一個方便的概念架構以利學術討論,這些面向彼此間常有交集與相互影響,實際設計與研究工作可多考慮不同面向間可能的結合。

文末,筆者反思本土的使用者特性與科技使用情境,認為「文化差異」可能是下一個線上社群研究設計值得注意的議題。近年人機互動領域逐漸發現同樣的科技對不同文化背景的使用者的影響可能不同,例如筆者的研究觀察到華人文化背景的使用者在透過視訊從事合作工作時較西方文化背景的使用者表達明顯較少意見,但若只使用文字而無視訊進行溝通,華人使用者與西方使用者的發言頻率是極為接近的[11]。類似這樣的發現暗示了不同文化情境中的社群可能不適合「穿同樣大小的衣服」(“one size fits all”),在本土情境從事上述三個面向的工作時,或許都值得考慮文化因素可能扮演的角色。

筆者在另一個研究應用這樣的觀察於群體創意合作工作,比較同文化團隊與多文化團隊在腦力激盪作業(brainstorming task)的表現,發現多文化團隊在適合的想法產生輔助工具的輔助下,發揮了多元背景的優勢,產生最具廣度的想法[12]。若能對心理上、社群結構上的文化差異進一步深入瞭解,這方面或可成為我們在線上社群領域發展的優勢之一。


參考文獻

[1] Olson, G. M., & Olson, J. S. (2000). Distance matters. Human-Computer Interaction, 15, 139-178.
[2] Clark, H. H., & Brennan, S. E. (1991). Grounding in communication. In L. B. Resnick, J. M. Levine, & S. D. Teasley (Eds.), Perspectives on socially shared cognition (pp. 127-149). Washington, DC: American Psychological Association.
[3] Yamashita, N., Kuzuoka, H., Hirata, K., Aoyagi, S., & Shirai, Y. (2011). Supporting fluid tabletop collaboration across distance. Proceedings of ACM Conference on Human Factors in Computing Systems (CHI’11).
[4] Tang, J. C. (2007). Approaching and leave-taking: Negotiating contact in computer-mediated communication. ACM Transactions on Computer-Human Interaction, 14(1).
[5] Golder, S. A., & Macy, M. W. (2011). Diurnal and seasonal mood vary with work, sleep, and daylength across diverse cultures. Science, 333, 1878-1881.
[6] Garton, L., Haythonthwaite, C., & Wellman, B. (1997). Studying online social networks. Journal of Computer-Mediated Communication, 3. http://jcmc.indiana.edu/vol3/issue1/garton.html
[7] Kwak, H., Lee, C., Park, H., & Moon, S. (2010). What is Twitter, a social network or a news media. Proceedings of the International World Wide Web Conference (WWW’10).
[8] Quinn, A. J., & Bederson, B. B. (2011). Human computation: A survey and taxonomy of a growing field. Proceedings of ACM Conference on Human Factors in Computing Systems (CHI’11).
[9] von Ahn, L., & Dabbish, L. (2008). Designing games with a purpose. Communications of the ACM, 51(8), 58-67.
[10] Kittur, A., Chi, E. H., & Suh, B. (2008) Crowdsourcing user studies with Mechanical Turk. Proceedings of ACM Conference on Human Factors in Computing Systems (CHI’08).
[11] Wang, H.C., Fussell, S. R., & Setlock, L. D. (2009). Cultural difference and adaptation of communication styles in computer-mediated group brainstorming. Proceedings of ACM Conference on Human Factors in Computing Systems (CHI’09).
[12] Wang, H-C., Fussell, S. R., & Cosley, D. (2011). From diversity to creativity: Stimulating group brainstorming with cultural differences and conversationally-retrieved pictures. Proceedings of ACM Conference on Computer-Supported Cooperative Work (CSCW’11).



[a] 全名為The Association for Computing Machinery, Special Interest Group on Computer Human Interaction. 網址為http://www.sigchi.org/ 
[b] NTT’s t-room project- http://www.mirainodenwa.com/e_index.html
[c] Linguistic inquiry and word count (LIWC): http://www.liwc.net/