2008年,漫威工作室(Marvel Studios)製作了至今仍瘋迷全球的漫威超級英雄電影宇宙系列的第一部影片—《鋼鐵人》。小勞勃道尼(Robert JohnDowney Jr.)飾演的東尼史塔克(Anthony Edward Stark)是位天才工程師,他在自己豪宅的地下室打造了一個相當科技化的工作室,與他的AI人工智慧夥伴JARVIS一起在這地下工作室完成許多先進、設備酷炫的鋼鐵裝。青少年們為鋼鐵人打擊罪惡的正義形象吸引時,同時也為史塔克那充滿魅力的科技力著迷;而史塔克的地下工作室只是電影故事中如夢似幻的想像嗎?其實不然,在現有的許多科技物件中,已經有個別的應用出現了。
史塔克的地下工作室有很多讓人印象深刻的事,首先,整個地下室都是他的工作檯,有許多數位物件立體地投射在空間中,史塔克可以隨意地抓取、修改、組裝這些數位物件。在現有的科技物件中,並沒有單一品項可以完成這樣子的作業方式,但是分開來看,這些技術都是有可能的。3D投影物件可以用很簡單的方式呈現,在網路上甚至可以搜尋到教人家如何DIY透過塑膠片配合智慧型手持裝置的3D程式投影出一個立體影像。但投影物件本身如果不能被使用,那它就只是一個有趣的展示品,無法在工作上進一步幫助人們。操作投影或數位物件有沒有可能?SONY在2017年春季就發表了一款名為「Xperia Touch」的投影機,它透過紅外線感光元件,來偵測人們的動作,藉此可以操作投影畫面,所以有人稱它是搭載著Android系統的投影機。關於偵測人體姿勢而進行數位演算的研究與應用並不少見,其技術原理也有很多種,包含飛時測距(Time of Flight,簡稱ToF)、結構光技術、多角成像技術、近電場感測技術等,基本上這些技術的目的都是為了讓人們的動作可以被電腦識別進而輸出回饋。換句話說,藉由影像的捕捉,當電腦懂了人們的動作後,原本透過電腦呈現的數位物件就可以跟人產生互動,那麼史塔克的工作方式就變得可能了。
其次,史塔克在地下工作室與穿上鋼鐵裝的時候,總有一個夥伴能夠幫他處理許多事情,像是分析鋼鐵裝效能、進行問題評估、提供資料整合與計算等,這夥伴不是像蝙蝠俠的管家阿福一樣真實的人,而是AI人工智慧夥伴 JARVIS。AI人工智能一直是人類科技發展中很重要的一塊,近期最有名的案例即是由Google DeepMind開發的AlphaGo在2016年3月以4勝1敗的成績打敗圍棋世界冠軍李世乭,在2016年5月中國烏鎮圍棋峰會上得到中國圍棋協會授予的「職業圍棋九段」稱號。AlphaGo是一個深度學習的神經網絡,它可以不斷與自己下棋來取得大量樣本(加上它一開始是從人類棋局資料庫中學習),並從棋局中計算出最佳解,而要得到這個解,則是依賴策略網絡來預測對手落子、透過評價網路來計算勝率、以及蒙地卡羅樹搜尋(Monte Carlo tree search,簡稱MCTS)的演算法來尋求最佳解。人們將AlphaGo這樣的人工智能稱作弱人工智慧,因為它其實並沒有任何自我意識的思考機制在其中,就像現在許多手持式智慧裝置上的語音助理一樣,他們也不是真的具備思考能力,而是透過自然語言與機器學習等方法來幫助人們取得特定的資訊。所以也就有許多為了特定目的而開發出來的智能程式,例如2016年由人工智慧寫成的《電腦寫小說的那一天》短篇小說入圍了日本「星新一」文學獎,但基本上還是要先由人類架構一些元素與方向,電腦才有辦法開始行文;也有人開始運用大數據資料,讓機器進行學習並自主對話,來開發聊天機器人。由這些案例可以看到,目前AI人工智慧要能像JARVIS一樣以一套程式完成多功能似乎還有很長的一段路要走,但在特定項目上開發演算法來幫助人們解決相關問題已經有了一定的成果。
最後,史塔克能夠邊工作邊跟女主角小辣椒(Virginia "Pepper" Potts,由女星Gwyneth Paltrow飾演)通電話、視訊。在現今的電腦作業界面中要做到這些項目並不困難,甚至已經深入常民之中。但我們仍不可忽略網路技術的發展以及即時通訊的建立,不只讓資訊取得變得更為便利、也讓人與人之間的距離變得更短。倘若搭配鏡頭、上網與3D投影技術,遠在他國的人們甚至可以同時出現在自己的工作室裡開會、共同創作,或者是最一般的社交。Microsoft在2015年公布的HoloLens計畫就是很重要的技術整合性案例,它透過鏡片成像讓人們可以在實體空間中看見數位物件,並搭載多顆鏡頭來進行手勢識別,以完成與數位物件的互動,也可以透過鏡頭來對環境進行即時定位與地圖建構(Simultaneous localization and mapping,簡稱SLAM),讓數位物件能夠更貼合於物理實景。當數位物件能貼合於實景的時候,只要加上連網功能就可以把疊合實景與數位物件的影像分享給其他人,以達到跨空間共同即時合作工作的目標。而且Microsoft也希望將AI晶片技術運用到他們下一代的HoloLens中,以提升圖像與語音辨識上的精準度。
HoloLens 是現有科技中最接近鋼鐵人式的作業系統,但它仍然有很多缺點有待改進,比如說手勢辨識不易、操作方式不夠直覺、視角狹窄、裝置笨重、相對物理世界過於昏暗、內容缺乏等。但長遠來看,把數位世界與物理世界疊合起來、跟電腦智能合作、串聯起廣大的資訊,並讓人們可以在其中工作的這個方向想必是未來的趨勢。就目前的科技技術來說,個別技術確實已經有相當程度的發展,但離鋼鐵人式的作業系統目標還有很長的距離,不只單個技術本身有許多待突破的瓶頸,還有技術整合、設備微型化等重要的技術高牆等著被克服。也許人類科技的發展最後不會完全像是電影《鋼鐵人》中的那樣,但可以肯定的是,現有的作業模式將會逐步地被取代、超越,讓人們在數位世界的工作變得更為便利、也更為直覺。