與 EyeToy 概念類似的誕生計畫,同樣是以影像辨識為核心技術,最大的差異在於誕生計畫採用了更為先進的 3D 影像辨識技術。除了拍攝傳統 2D 全彩影像之外,也同時還拍攝 3D 距離影像,偵測被攝物體(玩家)與攝影機之間的距離,建構出立體化的影像資料,藉以精確掌握玩家的身形、姿勢與動作,提供以往 2D 影像辨識所無法達成的效果。
誕生計畫採用的 USB 視訊攝影機結合 2 組感光元件,1 組可拍攝傳統的 2D 全彩影像,另 1 組可拍攝嶄新的 3D 距離影像。測距方式推測是採用時差測距法(Time-Of-Flight),由攝影機發出遠紅外線脈衝光照射被攝物體,再以感光元件偵測紅外線反射回來的時間,由於反射時間與物體距離成正比,因此可以藉此建構出深淺不一的灰階距離影像。攝影機並內建專屬處理器,提供 3D 影像辨識與動作捕捉應用所需的輔助運算。
結合 2D 全彩影像與 3D 距離影像
目前微軟並未公布誕生計畫所採用的攝影機詳細規格,以微軟日前併購的以色列 3D 測距攝影產品技術研發廠商 3DV Systems 研發的「ZCam」3D 攝影機規格來看,該攝影機的測距攝影解析度為 320 × 240(※)60fps,採 8bit 灰階取樣,測距範圍為 0.5~2.5 公尺,精確度為 1~2 公分,推測誕生計畫所採用的攝影機規格應該與 ZCam 相去不遠。
※此為 3D 攝影解析度,2D 攝影解析度為 130 萬像素
ZCam 所拍攝的灰階距離影像,越白代表距離越近
由於 3D 影像可以清楚判斷被攝物體的距離,因此可以藉由距離的不同來將玩家身形輪廓與背景精確分離開來,達成去背的效果,不像 2D 影像會因為顏色近似或混雜而難以正確判斷。3D 攝影還能精確掌握玩家四肢前後的位置,只要搭配動作分析技術來追蹤人體各處的關節,就能精確捕捉玩家的一舉一動,並將動作反應在遊戲操控上。
在後續的閉門媒體體驗行程中,現場也可以從開發套件的監測螢幕中見識到以顏色區分距離的視覺化 3D 距離影像,以及即時追蹤的人體關節點。由於誕生計畫追蹤的是人體骨架,而不只是單純偵測影像的變動,因此就算有與玩家距離近似的干擾出現,系統也能透過對人體骨架的分析來排除這些不屬於玩家身體的干擾。由於 3D 測距攝影是由攝影機主動發出紅外線,因此就算在昏暗的使用環境下,也不影響動作捕捉的結果。
雖然目前的展示中並未提及,不過 3D 測距攝影其實還具備了容易與虛擬 3D 繪圖整合的特性。由於拍攝下來的影像是由 2D 與 3D 影像組合而成的 RGB+D(紅綠藍 + 距離)格式,與 3D 繪圖的 RGB+Z(紅綠藍 + 深度)格式非常近似,因此很容易就能整合拍攝影像與 3D 繪圖,做到像是虛擬蝴蝶環繞玩家身體飛舞這樣的進階擴增實境效果。
除了結合 2D + 3D 影像辨識的動作捕捉之外,誕生計畫同時也導入了臉部辨識與語音辨識技術,透過 2D 全彩影像攝影來辨識臉部特徵,麥克風陣列來進行清晰的語音輸入,讓 Xbox 360 可以辨識玩家的身分,自動選擇對應的玩家帳號登入,並透過語音手勢下達指令,不需要動用控制器來進行繁複的操作,就能自然便利的使用系統功能。
PS 動態控制器可說是 EyeToy 團隊多年技術研發累積的成果,雖然沒有採用原本預期的 3D 影像辨識技術,不過仍應用了多年研發的 2D 影像辨識物件追蹤技術,搭配內建的動態偵測技術,同樣可以達成精確的 3D 空間定位,算是另闢蹊徑的折衷方案。不過沒有採用 3D 影像辨識技術,也使得許多先前曾發表過的研發成果未能實際應用到遊戲上。