新一輪人機交互潮流 用眼睛控制一切
北京時間2013年03月02日消息,寶威科技網(wǎng),在2012年6月的臺北Computex大會上,通過一個紅外LED傳感器,加上自帶的校準軟件,一項被稱作Senseye的技術被展示了出來。它可以捕捉你的眼球運動,無情地切碎被你盯上的任何一個水果。
直到2007年蘋果發(fā)布了iPhone。后來,越來越多的人開始習慣于以觸摸屏幕的方式與設備進行互動。當人們開始在屏幕上點點劃劃的時候,那項此前遙遠的、一直扮演著實驗室技術角色的眼球控制,開始走進了普通用戶的視野—既然手可以與屏幕互動,為什么直接盯著屏幕的眼睛不可以? 在人們逐漸習慣用手指直接與屏幕互動的時候,與屏幕的接觸同樣直接的眼睛的作用被重新發(fā)現(xiàn)了。這可能會帶來新一輪人機交互的潮流。
這種技術有可能成為下一波人機交互技術的潮流。它通過控制眼球完成特定操作,大體上可以分為“眼球追蹤”、“做出指令”兩大部分。
在第一個追蹤階段,攝像頭會察覺和辨認電腦前的用戶,然后追蹤眼球的運動,并把獲得的數(shù)據(jù)傳送到控制器中;接下來,通過事先設定好的算法,系統(tǒng)會判斷用戶的用眼行為,作出對應的反饋。
它最初的構想誕生在軍事領域。1968年,美國空軍就曾嘗試研發(fā)并且應用這項技術,希望可以制造一種將導彈直接導向打擊目標的設備。1980年代,一些通過眼球控制和計算機進行簡單交互的技術被發(fā)明出來,但它們只局限在一些實驗室領域,并且也多集中在“追蹤”階段。Google用它來搜集用戶觀看屏幕的習慣,歐萊雅這樣的化妝品公司也把眼球追蹤技術用在了消費者行為調(diào)查中,觀察他們對于顏色、包裝等的喜好。
到今天,除了“追蹤”以外,“眼球控制”這項技術開始重新在商業(yè)領域獲得重視,與觸摸屏的流行有著極大關系。
“在軟件解決方案成形之前,其實這項技術本身已經(jīng)發(fā)展到允許人們利用它做許多具體動作的程度了。”在接受采訪時,瑞典隆德大學(Lund University)認知科學系教授Kenneth Holmqvist說。他舉的例子包括如何用眼睛準確地定位書、如何取消原來選定的菜單。
直到2007年蘋果發(fā)布了iPhone。后來,越來越多的人開始習慣于以觸摸屏幕的方式與設備進行互動。當人們開始在屏幕上點點劃劃的時候,那項此前遙遠的、一直扮演著實驗室技術角色的眼球控制,開始走進了普通用戶的視野—既然手可以與屏幕互動,為什么直接盯著屏幕的眼睛不可以?
在這個領域,一家名為Tobii的瑞典公司走在了前列,它的產(chǎn)品叫“眼動儀”。
相比過去的眼球控制設備,Tobii的眼動儀在多方面進行了升級。它是由近紅外微型投影器、光學傳感器、圖像處理模塊等幾大主要部分組成。
投影和光學傳感器可以精確采集用戶的目光方向、眼動軌跡,然后創(chuàng)建并實時記錄下這些圖像,包括用戶的眼球運動圖像和投射圖像。根據(jù)這些數(shù)據(jù),圖像處理模塊以數(shù)學模型準確地計算出眼球的位置和目光焦點。最后,通過事先編寫好的軟件,將用戶的用眼行為轉(zhuǎn)換成準確的指令。
Tobii的眼動儀眼下受到了不少合作伙伴的重視,聯(lián)想、富士通開始與Tobii合作,嘗試推出帶有眼球控制功能的PC;芯片巨頭英特爾更是自掏腰包,投資2100萬收購了該公司10%的股份。
“目前最主要的交互方式還是觸摸,它在手持移動設備上的體驗很好。但對于筆記本電腦或者臺式機來說,如果你需要長時間觸控操作,你的手大概會很酸很疼。”Tobii全球市場總監(jiān)Sara Hyléen告訴《第一財經(jīng)周刊》,“眼控,或者說注視交互,在指向上要顯得自然得多,它可以替代許多你以前用鼠標去完成的動作。”
Tobii大中華區(qū)銷售負責人王海濤則說,智能手機用戶操作的距離在10至15厘米,這個距離非常適合觸控操作;像XBOX、kinect這樣的交互距離在3米左右。這兩者之間的距離,就是用眼睛去控制最舒服的距離。
最典型的是筆記本電腦等桌面設備。與用鼠標相比,眼控技術在進行一些簡單操作,比如上下滾動屏幕、點擊或者識別注視區(qū)域方面更有優(yōu)勢。Tobii2012年8月推出了一款型號為C12的Windows平板設備,它預留了一個眼控接口,可以用眼球控制系統(tǒng)的各種界面。
他們開發(fā)的同名眼控產(chǎn)品PredictGaze,可以讓你家電腦上的普通攝像頭具備追蹤眼球的功能:看電子書時,文字會隨著你眼球的移動而跟著移動;盯著屏幕右下角就可以自動翻頁;只要距離設備不超過3.66米,即使你的身體不停地移動,也可以完成上述操作。
PredictGaze的技術不需要購買特殊的眼控裝置,也不需要安裝特殊的攝像頭和硬件,一臺普通的移動設備就可以實現(xiàn)。
這家公司不僅僅只是“眼控”技術公司,還在手勢操作、人臉識別等領域有所積累。“我們可以提供各種原先看起來并不相關的技術。如果想讓用戶在使用你的軟件時感到自然,技術的寬度是必要的。”Predict Gaze的聯(lián)合創(chuàng)始人Ketan Banjara說。
Banjara覺得在推廣新技術的時候也必須盡可能多方面考慮用戶習慣,讓用戶可以同時使用多種操控手段。“如果在使用人臉更方便的時候,你卻需要讓顧客強行去使用手勢,這會傷害用戶體驗。”他說。
Tobii,PredictGaze這樣的團隊已經(jīng)開發(fā)出了令人興奮的產(chǎn)品,它們都認為從長遠來看,眼控技術有可能會被整合進筆記本電腦中代替鼠標甚至是鍵盤,它們這樣的創(chuàng)業(yè)公司也正是為此而存在的。Google在已經(jīng)展示了的Google glass中,也曾經(jīng)設想過完全通過眼球控制設備的方案。
當然這些公司也知道,自己還需要繼續(xù)探索一段時間。其中有一個最重要的原因:在絕大多數(shù)日常適用環(huán)境下,外界的光線情況是千變?nèi)f化的,眼球控制技術目前還不能足夠準確地識別、追蹤和控制目標。
將這一技術用在移動設備上、形成一套完整的控制“手勢”,那就更難了。用戶可能用各種角度手持設備,需要在不同光照、距離、運動條件下使用,并且有不同的使用場景,這都給精準操作、以及背后的判斷模型的建立帶來了難題。
然而眼睛終究是人類最精密、最復雜的器官之一,正如凱文·凱利在著名的《失控》中所描述的那樣:一個眼球本身就是一臺超級計算機,人類的許多視覺感知在光線剛剛觸及纖薄的視網(wǎng)膜時就發(fā)生了。
Tobii、PredictGaze這些公司要做的,就是連接眼球與外界的計算設備,讓它們順利地“溝通”,準確理解大腦的意識。
現(xiàn)在,只是“天黑請閉眼”的階段。等天亮了,你就可以用眼睛控制一切。