草根影響力新視野 法藍瓷編譯
擴增實境 (Augmented reality, 簡稱AR) 始自2017年就是一個很紅的科技話題, 直到現在AR應用有趨於廣泛的趨勢。AR針對目前手機App來說也是一劑強心針, 它讓使用者透過模擬方式能為自己試衣與化妝, 透過AR我們也可在家中多出來的空間試擺一張沙發、在街道上抓寶可夢 也可讓自己變成一隻可愛的小狗。有關AR的主題在網路上已有許多討論, 而本篇目的是探討它如何運作。
電腦視覺(computer vision)介紹
從基礎定義來說, AR是透過堆疊感應技術來強化原本我們拍攝自環境的聲音與影像。某些人或許早已知道此過程, 但也許不清楚何謂電腦視覺與其背後運作原理。
電腦視覺是跨領域的科學, 意旨電腦能真實認知我們所拍攝之影像或者影片,換句話說, 將人類視覺系統數位化。電腦視覺擷取、處理、分析影像後, 進一步進行解讀, 而這與人類視網膜(Retina)運作原理相同。視網膜亦將收到的資料分析後, 以數字與符號方式呈現在我們眼前。如此也能解釋透過電腦視覺, 若我們上傳一張照片並將照片中人物加註標籤, 臉書(Facebook)即可通過自行開發的運算將人辨識出來。某些使用電腦視覺技術的銀行App也能透過拍照讓支票完成存款; 若更有趣一點, 我們也能將自己的臉變成一張墨西哥餅。
當我們使用智慧型手機相機拍照時, 所拍的每一張照片都會有一個小偵測格 (frame), 偵測格中每一小格又可視為一張更小的圖片, 電腦視覺將圖片切成小單位加以進行處理。例如: 全世界人臉皆有些共同特徵, 像我們眼睛區域會比其他 區域臉頰要稍微暗淡些, 而臉部表面有起伏之處會比額頭來得更暗淡些。電腦視覺掃描並收集相關資訊之後, 會對照片中明暗畫素對比做進一步偵測, 而偵測成功前提是人臉必須在指定框格內正面面對前方。
電腦視覺會被應用在AR主因是開發者也想嘗試讓電腦走出機殼, 來幫助使用者感受所處之環境, 例如:當我們掃描一個被放在餐桌上的披薩紙盒, 電腦視覺掃描紙盒位置、印刷、餐桌四周環境後, 就可讓使用者獲取披薩美食相關資訊 與折扣, 當然業者須事先設計好紙盒上的掃描定位點方便消費者快速掃描。(影片連結)
也有運用於定位(position-based)的AR程式App, 使用GPS定位資料與手機內建指南針(Compass)、加速規(accelerometer)及陀螺儀 (gyroscope)來做擴增實境。加速規讓使用者在看手機地圖時可確認自己方位, 而陀螺儀讓使用者手機轉換不同方向時跟著一起旋轉。
定位相關AR 使用地理定位(Geolocation)技術, 與之前Pizza紙盒的方式不同,透過地理定位技術我們可直接掃描披薩店門外招牌或路標, 從中直接取得相關美食或其他附近店家資訊。
目前AR熱度有漸漸超越VR的趨勢, 根據美國eMarketer 針對今年2019年統計, 現階段有將近4200萬美國人每月至少會使用一次與 VR有關的App。最後, AR對消費者來說, 更重要的是不需去購買新的設備來享受AR的技術, 而是透過現有手機規格, 每一個人都可實際沉浸在AR所帶來的視覺新感受。
Reference : You know what AR is. But do you understand how it works?
Polygon recent comments