聽技術牛人講解:手勢識別技術是什麼?
發布時間:2015-03-02 責任編輯:sherryyu
【導讀】說到手勢識別大家並不陌生,想得到的是二維手型識別、二維手勢識別、三維手勢識別這幾個名詞,但是到底手勢識別技術是什麼?怎麼定義的?又是如何工作的呢?請看下文詳解!
談起手勢識別技術,由簡單粗略的到複雜精細的,大致可以分為三個等級:二維手型識別、二維手勢識別、三維手勢識別。在具體討論手勢識別之前,我們有必要先知道二維和三維的差別。二維隻是一個平麵空間,我們可以用(X坐標,Y坐標)組成的坐標信息來表示一個物體在二維空間中的坐標位置,就像是一幅畫出現在一麵牆上的位置。三維則在此基礎上增加了“深度”(Z坐標)的信息,這是二維所不包含的。這裏的“深度”並不是咱們現實生活中所說的那個深度,這個“深度”表達的是“縱深”,理解為相對於眼睛的“遠度”也許更加貼切。就像是魚缸中的金魚,它可以在你麵前上下左右的遊動,也可能離你更遠或者更近。

qianliangzhongshoushishibiejishu,wanquanshijiyuerweicengmiande,tamenzhixuyaobuhanshenduxinxideerweixinxizuoweishurujike。jiuxiangpingshipaizhaosuodedexiangpianjiubaohanleerweixinxiyiyang,womenzhixuyaoshiyongdangeshexiangtoubuzhuodaodeerweituxiangzuoweishuru,ranhoutongguojisuanjishijiaojishuduishurudeerweituxiangjinxingfenxi,huoquxinxi,congershixianshoushishibie。
erdisanzhongshoushishibiejishu,shijiyusanweicengmiande。sanweishoushishibieyuerweishoushishibiedezuigenbenqubiejiuzaiyu,sanweishoushishibiexuyaodeshurushibaohanyoushendudexinxi,zhejiushidesanweishoushishibiezaiyingjianheruanjianliangfangmiandoubierweishoushishibieyaofuzadeduo。duiyuyibandejiandancaozuo,biruzhishixiangzaibofangshipindeshihouzantinghuozhejixufangying,erweishoushiyejiuzugoule。danshiduiyuyixiefuzaderenjijiaohu,biruwanyouxihuozheyingyongzaiVR(虛擬現實)上,三維手勢實在是居家旅行必備、舍我其誰的不二之選。
手勢識別分類
二維手型識別
erweishouxingshibie,yekechengweijingtaierweishoushishibie,shibiedeshishoushizhongzuijiandandeyilei。zhezhongjishuzaihuoquerweixinxishuruzhihou,keyishibiejigejingtaideshoushi,biruwoquanhuozhewuzhizhangkai。qidaibiaogongsishiyinianqianbeiGoogle收購的Flutter。在使用了他家的軟件之後,用戶可以用幾個手型來控製播放器。用戶將手掌舉起來放到攝像頭前,視頻就開始播放了;再把手掌放到攝像頭前,視頻又暫停了。
“靜態”是這種二維手勢識別技術的重要特征,這種技術隻能識別手勢的“狀態”,而不能感知手勢的“持續變化”。舉個例子來說,如果將這種技術用在猜拳上的話,它可以識別出石頭、剪(jian)刀(dao)和(he)布(bu)的(de)手(shou)勢(shi)狀(zhuang)態(tai)。但(dan)是(shi)對(dui)除(chu)此(ci)之(zhi)外(wai)的(de)手(shou)勢(shi),它(ta)就(jiu)一(yi)無(wu)所(suo)知(zhi)了(le)。所(suo)以(yi)這(zhe)種(zhong)技(ji)術(shu)說(shuo)到(dao)底(di)是(shi)一(yi)種(zhong)模(mo)式(shi)匹(pi)配(pei)技(ji)術(shu),通(tong)過(guo)計(ji)算(suan)機(ji)視(shi)覺(jiao)算(suan)法(fa)分(fen)析(xi)圖(tu)像(xiang),和(he)預(yu)設(she)的(de)圖(tu)像(xiang)模(mo)式(shi)進(jin)行(xing)比(bi)對(dui),從(cong)而(er)理(li)解(jie)這(zhe)種(zhong)手(shou)勢(shi)的(de)含(han)義(yi)。
這種技術的不足之處顯而易見:zhikeyishibieyushehaodezhuangtai,tuozhanxingcha,kongzhiganhenruo,yonghuzhinengshixianzuijichuderenjijiaohugongneng。danshitashishibiefuzashoushidediyibu,erqiewomendequekeyitongguoshoushihejisuanjihudongle,haishihenkudebushime?xiangxiangyixianimangzhechifan,zhiyaopingkongzuogeshoushi,jisuanjijiukeyiqiehuandaoxiayigeshipin,bishiyongshubiaolaikongzhikeshifangbianduole!
二維手勢識別
二(er)維(wei)手(shou)勢(shi)識(shi)別(bie),比(bi)起(qi)二(er)維(wei)手(shou)型(xing)識(shi)別(bie)來(lai)說(shuo)稍(shao)難(nan)一(yi)些(xie),但(dan)仍(reng)然(ran)基(ji)本(ben)不(bu)含(han)深(shen)度(du)信(xin)息(xi),停(ting)留(liu)在(zai)二(er)維(wei)的(de)層(ceng)麵(mian)上(shang)。這(zhe)種(zhong)技(ji)術(shu)不(bu)僅(jin)可(ke)以(yi)識(shi)別(bie)手(shou)型(xing),還(hai)可(ke)以(yi)識(shi)別(bie)一(yi)些(xie)簡(jian)單(dan)的(de)二(er)維(wei)手(shou)勢(shi)動(dong)作(zuo),比(bi)如(ru)對(dui)著(zhe)攝(she)像(xiang)頭(tou)揮(hui)揮(hui)手(shou)。其(qi)代(dai)表(biao)公(gong)司(si)是(shi)來(lai)自(zi)以(yi)色(se)列(lie)的(de)PointGrab,EyeSight和ExtremeReality。
erweishoushishibieyongyouledongtaidetezheng,keyizhuizongshoushideyundong,jinershibiejiangshoushiheshoubuyundongjiehezaiyiqidefuzadongzuo。zheyangyilai,womenjiubashoushishibiedefanweizhenzhengtuozhandaoerweipingmianle。womenbujinkeyitongguoshoushilaikongzhijisuanjibofang/暫停,我們還可以實現前進/後退/向上翻頁/向下滾動這些需求二維坐標變更信息的複雜操作了。
這(zhe)種(zhong)技(ji)術(shu)雖(sui)然(ran)在(zai)硬(ying)件(jian)要(yao)求(qiu)上(shang)和(he)二(er)維(wei)手(shou)型(xing)識(shi)別(bie)並(bing)無(wu)區(qu)別(bie),但(dan)是(shi)得(de)益(yi)於(yu)更(geng)加(jia)先(xian)進(jin)的(de)計(ji)算(suan)機(ji)視(shi)覺(jiao)算(suan)法(fa),可(ke)以(yi)獲(huo)得(de)更(geng)加(jia)豐(feng)富(fu)的(de)人(ren)機(ji)交(jiao)互(hu)內(nei)容(rong)。在(zai)使(shi)用(yong)體(ti)驗(yan)上(shang)也(ye)提(ti)高(gao)了(le)一(yi)個(ge)檔(dang)次(ci),從(cong)純(chun)粹(cui)的(de)狀(zhuang)態(tai)控(kong)製(zhi),變(bian)成(cheng)了(le)比(bi)較(jiao)豐(feng)富(fu)的(de)平(ping)麵(mian)控(kong)製(zhi)。這(zhe)種(zhong)技(ji)術(shu)已(yi)經(jing)被(bei)集(ji)成(cheng)到(dao)了(le)電(dian)視(shi)裏(li),但(dan)是(shi)目(mu)前(qian)還(hai)是(shi)以(yi)噱(xue)頭(tou)為(wei)主(zhu),還(hai)不(bu)能(neng)成(cheng)為(wei)電(dian)視(shi)的(de)主(zhu)要(yao)常(chang)用(yong)控(kong)製(zhi)方(fang)式(shi)。
三維手勢識別
接下來我們要談的就是當今手勢識別領域的重頭戲——三維手勢識別。三維手勢識別需要的輸入是包含有深度的信息,可以識別各種手型、手shou勢shi和he動dong作zuo。相xiang比bi於yu前qian兩liang種zhong二er維wei手shou勢shi識shi別bie技ji術shu,三san維wei手shou勢shi識shi別bie不bu能neng再zai隻zhi使shi用yong單dan個ge普pu通tong攝she像xiang頭tou,因yin為wei單dan個ge普pu通tong攝she像xiang頭tou無wu法fa提ti供gong深shen度du信xin息xi。要yao得de到dao深shen度du信xin息xi需xu要yao特te別bie的de硬ying件jian,目mu前qian世shi界jie上shang主zhu要yao有you3種(zhong)硬(ying)件(jian)實(shi)現(xian)方(fang)式(shi)。加(jia)上(shang)新(xin)的(de)先(xian)進(jin)的(de)計(ji)算(suan)機(ji)視(shi)覺(jiao)軟(ruan)件(jian)算(suan)法(fa)就(jiu)可(ke)以(yi)實(shi)現(xian)三(san)維(wei)手(shou)勢(shi)識(shi)別(bie)了(le)。下(xia)麵(mian)就(jiu)讓(rang)小(xiao)編(bian)為(wei)大(da)家(jia)一(yi)一(yi)道(dao)來(lai)三(san)維(wei)手(shou)勢(shi)識(shi)別(bie)的(de)三(san)維(wei)成(cheng)像(xiang)硬(ying)件(jian)原(yuan)理(li)。
1結構光(Structure Light)
結構光的代表應用產品就是PrimeSense公司為大名鼎鼎的微軟家XBOX 360所做的Kinect一yi代dai了le。這zhe種zhong技ji術shu的de基ji本ben原yuan理li是shi,加jia載zai一yi個ge激ji光guang投tou射she器qi,在zai激ji光guang投tou射she器qi外wai麵mian放fang一yi個ge刻ke有you特te定ding圖tu樣yang的de光guang柵zha,激ji光guang通tong過guo光guang柵zha進jin行xing投tou射she成cheng像xiang時shi會hui發fa生sheng折zhe射she,從cong而er使shi得de激ji光guang最zui終zhong在zai物wu體ti表biao麵mian上shang的de落luo點dian產chan生sheng位wei移yi。當dang物wu體ti距ju離li激ji光guang投tou射she器qi比bi較jiao近jin的de時shi候hou,折zhe射she而er產chan生sheng的de位wei移yi就jiu較jiao小xiao;當(dang)物(wu)體(ti)距(ju)離(li)較(jiao)遠(yuan)時(shi),折(zhe)射(she)而(er)產(chan)生(sheng)的(de)位(wei)移(yi)也(ye)就(jiu)會(hui)相(xiang)應(ying)的(de)變(bian)大(da)。這(zhe)時(shi)使(shi)用(yong)一(yi)個(ge)攝(she)像(xiang)頭(tou)來(lai)檢(jian)測(ce)采(cai)集(ji)投(tou)射(she)到(dao)物(wu)體(ti)表(biao)麵(mian)上(shang)的(de)圖(tu)樣(yang),通(tong)過(guo)圖(tu)樣(yang)的(de)位(wei)移(yi)變(bian)化(hua),就(jiu)能(neng)用(yong)算(suan)法(fa)計(ji)算(suan)出(chu)物(wu)體(ti)的(de)位(wei)置(zhi)和(he)深(shen)度(du)信(xin)息(xi),進(jin)而(er)複(fu)原(yuan)整(zheng)個(ge)三(san)維(wei)空(kong)間(jian)。
以Kinect一yi代dai的de結jie構gou光guang技ji術shu來lai說shuo,因yin為wei依yi賴lai於yu激ji光guang折zhe射she後hou產chan生sheng的de落luo點dian位wei移yi,所suo以yi在zai太tai近jin的de距ju離li上shang,折zhe射she導dao致zhi的de位wei移yi尚shang不bu明ming顯xian,使shi用yong該gai技ji術shu就jiu不bu能neng太tai精jing確que的de計ji算suan出chu深shen度du信xin息xi,所suo以yi1米到4米是其最佳應用範圍。
2光飛時間(Time of Flight)
光飛時間是SoftKinetic公司所采用的技術,該公司為業界巨鱷Intel提供帶手勢識別功能的三維攝像頭。同時,這一硬件技術也是微軟新一代Kinect所使用的。這種技術的基本原理是加載一個發光元件,發光元件發出的光子在碰到物體表麵後會反射回來。使用一個特別的CMOS傳感器來捕捉這些由發光元件發出、又you從cong物wu體ti表biao麵mian反fan射she回hui來lai的de光guang子zi,就jiu能neng得de到dao光guang子zi的de飛fei行xing時shi間jian。根gen據ju光guang子zi飛fei行xing時shi間jian進jin而er可ke以yi推tui算suan出chu光guang子zi飛fei行xing的de距ju離li,也ye就jiu得de到dao了le物wu體ti的de深shen度du信xin息xi。
就計算上而言,光飛時間是三維手勢識別中最簡單的,不需要任何計算機視覺方麵的計算。
3多角成像(Multi-camera)
多角成像這一技術的代表產品是Leap Motion公司的同名產品和Usens公司的Fingo。
這種技術的基本原理是使用兩個或者兩個以上的攝像頭同時攝取圖像,就好像是人類用雙眼、昆蟲用多目複眼來觀察世界,通過比對這些不同攝像頭在同一時刻獲得的圖像的差別,使用算法來計算深度信息,從而多角三維成像。
在這裏我們以兩個攝像頭成像來簡單解釋一下:

雙shuang攝she像xiang頭tou測ce距ju是shi根gen據ju幾ji何he原yuan理li來lai計ji算suan深shen度du信xin息xi的de。使shi用yong兩liang台tai攝she像xiang機ji對dui當dang前qian環huan境jing進jin行xing拍pai攝she,得de到dao兩liang幅fu針zhen對dui同tong一yi環huan境jing的de不bu同tong視shi角jiao照zhao片pian,實shi際ji上shang就jiu是shi模mo擬ni了le人ren眼yan工gong作zuo的de原yuan理li。因yin為wei兩liang台tai攝she像xiang機ji的de各ge項xiang參can數shu以yi及ji它ta們men之zhi間jian相xiang對dui位wei置zhi的de關guan係xi是shi已yi知zhi的de,隻zhi要yao找zhao出chu相xiang同tong物wu體ti(楓葉)在不同畫麵中的位置,我們就能通過算法計算出這個物體(楓葉)距離攝像頭的深度了。
多duo角jiao成cheng像xiang是shi三san維wei手shou勢shi識shi別bie技ji術shu中zhong硬ying件jian要yao求qiu最zui低di,但dan同tong時shi是shi最zui難nan實shi現xian的de。多duo角jiao成cheng像xiang不bu需xu要yao任ren何he額e外wai的de特te殊shu設she備bei,完wan全quan依yi賴lai於yu計ji算suan機ji視shi覺jiao算suan法fa來lai匹pi配pei兩liang張zhang圖tu片pian裏li的de相xiang同tong目mu標biao。相xiang比bi於yu結jie構gou光guang或huo者zhe光guang飛fei時shi間jian這zhe兩liang種zhong技ji術shu成cheng本ben高gao、功耗大的缺點,多角成像能提供“價廉物美”的三維手勢識別效果。
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 邊緣AI的發展為更智能、更可持續的技術鋪平道路
- 每台智能體PC,都是AI時代的新入口
- IAR作為Qt Group獨立BU攜兩項重磅汽車電子應用開發方案首秀北京車展
- 構建具有網絡彈性的嵌入式係統:來自行業領袖的洞見
- 數字化的線性穩壓器
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
SATA連接器
SD連接器
SII
SIM卡連接器
SMT設備
SMU
SOC
SPANSION
SRAM
SSD
ST
ST-ERICSSON
Sunlord
SynQor
s端子線
Taiyo Yuden
TDK-EPC
TD-SCDMA功放
TD-SCDMA基帶
TE
Tektronix
Thunderbolt
TI
TOREX
TTI
TVS
UPS電源
USB3.0
USB 3.0主控芯片
USB傳輸速度



