国产午夜精品一区二区-国产午夜精品视频-国产午夜精品免费一二区-国产午夜精品理论片在线-国产午夜精品理论片影院-国产午夜精品理论片


首頁
產(chǎn)品系列
行業(yè)應(yīng)用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng)澤
| En
 
  當(dāng)前位置:首頁 > 新聞資訊 > 機(jī)器人趨勢 > 手勢識別:AI 交互的正確打開方式  
 

手勢識別:AI 交互的正確打開方式

來源:--      編輯:創(chuàng)澤      時(shí)間:2020/4/25      主題:其他   [加盟]

一、概述

“手勢是人類溝通的最自然的方式。硬件限制是我們不能很好地控制我們的設(shè)備的唯一限制”,這里的硬件限制指的是傳統(tǒng)的手勢識別算法需要額外的深度傳感器。感謝近十多年不斷發(fā)展的可適應(yīng) AI 和邊緣計(jì)算崛起,使得這一切逐漸變?yōu)榭赡堋?

我們或?qū)⒃谥悄苁謾C(jī)、平板電腦、臺式電腦、筆記本電腦、智能手表和智能電視,IOT 設(shè)備中看到更多結(jié)合空中手勢來操作的未來功能。
今年我們已經(jīng)看到有這樣的趨勢,科技巨頭都紛紛推出了自己的手勢識別能力:谷歌在自己的手機(jī)和智能音箱上提供了手勢交互的能力,華為在旗艦手機(jī) Mate30 上推出了自己的手勢操控等等,蘋果也剛剛提交了手勢在智能音箱上應(yīng)用的相關(guān)專利,實(shí)際上,手勢作為人機(jī)交互最自然的方式場景簡直是不言自明,想像一下這些場景:
  • 在看電視的時(shí)候想要換臺,想要調(diào)整音量,找不到遙控器的時(shí)候,直接使用手勢來操作,免去找不到遙控器的抓狂煩惱。

  • 在駕駛汽車,如果你聽到了一首很難聽的歌,希望趕快切掉,如果需要與觸摸屏顯示器進(jìn)行交互,駕駛員必須將視線從道路上移開,這樣有潛在的危險(xiǎn),使用手勢識別使得駕駛更安全。

  • 在使用 iPad 看劇時(shí),這個時(shí)候老板/老婆電話突然進(jìn)來了,我們對著 iPad 使用靜音手勢操控設(shè)備靜音,科技以人為本。

  • 在智能家居場景,使用手勢操作你的電燈,空調(diào),甚至抽油煙機(jī)都是可以想象的場景

總結(jié)來說:“You are the only interface you need”。


二、我們現(xiàn)在的業(yè)務(wù)場景

我們所屬天貓精靈 M 實(shí)驗(yàn)室,主要負(fù)責(zé)跟天貓精靈相關(guān)的視覺算法,我們的主要研究方向人機(jī)交互視覺算法,包括手勢識別,肢體識別,還有多模態(tài)視覺語音交互等。

去年,我們推出了基于天貓精靈智能音箱的超輕量手勢識別算法,今年我們更進(jìn)一步,在技術(shù),業(yè)務(wù),算法上進(jìn)行了更為深入的探索:
  • 在天貓精靈大屏產(chǎn)品 CC, CCH, CCL 等上線了手勢操控能力。

  • 我們同優(yōu)酷iPad客戶端的小伙伴一起,在優(yōu)酷 iPad 版也成功應(yīng)用了我們的手勢識別能力。

  • 我們在教育領(lǐng)域,我們嘗試了使用手指作為輸入,實(shí)現(xiàn)了手指點(diǎn)讀的相關(guān)能力,讓小朋友“哪里不會點(diǎn)哪里”。

  • 目前我們在跟電視廠商等 IOT 生態(tài)廠商合作,實(shí)現(xiàn)大屏手勢交互第一步,未來丟掉遙控器將不是夢。


三、無處不在的單點(diǎn)(靜態(tài))手勢

3.1 從天貓精靈到優(yōu)酷 iPad 手勢識別
去年,我們推出了基于天貓精靈智能音箱的超輕量手勢識別算法,今年我們與優(yōu)酷的小伙伴合作,把單點(diǎn)手勢能力進(jìn)一步移植到了優(yōu)酷 iPad 場景中。
3.1.1  單點(diǎn)手勢應(yīng)用:優(yōu)酷吃飯看劇神器
來自用戶的聲音:吃飯看劇神器
這是在優(yōu)酷上線后用戶自發(fā)介紹的使用視頻,也非常符合我們的場景預(yù)期和用戶痛點(diǎn):
  • 在看劇的時(shí)候,經(jīng)常有需要跳過某一小段,快進(jìn)或者快退的時(shí)刻,解決不便直接操作的時(shí)刻(例如吃飯,手里不方便等場景)。

  • 在 iPad 場景:1)受設(shè)備體積和重量影響,很少手持設(shè)備;2)屏幕較大,用戶距離設(shè)備通常有一定距離,手勢識別帶來了更為極致的體驗(yàn)提升。


3.2  走的更遠(yuǎn):大屏遠(yuǎn)距手勢交互
3.2.1  大屏交互場景
近年來,智能電視(智屏)正越來越多的進(jìn)入千家萬戶。據(jù)工信部預(yù)測,到 2020 年,智能電視市場滲透率有望達(dá)到 90% 以上。除了數(shù)量優(yōu)勢,強(qiáng)大的交互能力是智慧家庭入口的必備特質(zhì)。作為智慧家庭 IoT 的另一個重要入口,智能電視的大屏幕更易實(shí)現(xiàn)交互。
3.2.2  挑戰(zhàn)
要走的更遠(yuǎn),也常常伴隨更大的挑戰(zhàn)。和天貓精靈 CC 或 iPad 這種近身設(shè)備相比,在智能電視場景進(jìn)行手勢算法研發(fā)面臨主要面臨的挑戰(zhàn)有:
  • 更遠(yuǎn)的距離。智能電視有一塊大屏幕,往往 3-5 米是一個對人較為舒適和健康的觀看距離。在這樣一個距離下,人手在畫面占比非常小。

  • 更多的人數(shù)。可能有多人同時(shí)在看電視,因此我們要能及時(shí)甄別和響應(yīng)每一位觀眾的交互需求。

  • 更復(fù)雜的背景。不同家庭不同電視的擺放位置千變?nèi)f化,我們的算法要在變化中找不變(手勢識別)

  • 有限的算力。雖然智能電視越來越普及,但是它們配置的硬件性能依然非常有限。


3.2.3  大屏方案
針對以上挑戰(zhàn),經(jīng)過我們算法研發(fā)探索,提出語義注意力機(jī)制導(dǎo)引的快速人手檢測和分類方法(Contextual-attention-guided fast tiny hand detection and classification)。
大屏解決方案: Contextual-attention-guided fast tiny hand detection and classification
1)Lightweight hourglass-like backbone
輕量級類 hourglass 模塊對輸入進(jìn)行下采樣,在獲取具有高層語義信息的特征圖的同時(shí),盡量保留細(xì)節(jié)性特征,有利于對 tiny hand 的檢測。
2)Contextual attention
3-5 米場景下,人手在整個輸入圖像中占的像素比非常小。手雖然很小,但是手一般長“人”身上,而且距離人體特定的部位(如手腕、胳膊、人臉)較近,同時(shí)與這些部位可能會有相近的顏色。這些人體或人體部位往往較手要更大,為我們 tiny hand 的檢測提供了額外的 clues,利用這些 clues,可以更好的對 tiny hand 進(jìn)行檢測。基于此,我們利用 Similarity Context 和 Semantics Context 來作為 Contextual attention ,從而指導(dǎo)網(wǎng)絡(luò)獲取手區(qū)域以外的語義信息,增強(qiáng)檢測能力。


四、落地與優(yōu)化閉環(huán)

相信任何一個做過 AI 算法落地的同學(xué),都會遇到各種各樣的實(shí)際算法問題,不管是科大訊飛的語音交互,到現(xiàn)在無處不在的人臉識別,甚至谷歌的搜索詞排名算法,基于深度學(xué)習(xí)的AI算法的非常重要的一個特點(diǎn)就是越用越好,并漸漸形成數(shù)據(jù)相關(guān)壁壘。
我們在手勢先后在天貓精靈和優(yōu)酷上線后,我們同樣也經(jīng)歷了這樣的一個過程,為了讓我們的算法“越用越好”:
  • 提出了新的檢測算法,應(yīng)用了前沿的 Overflow-aware 量化方案,極致算法體驗(yàn)。

  • 我們接入了 AutoML 助力 AI 應(yīng)用快速落地,以動態(tài)閉環(huán)的形式優(yōu)化我們的算法。


4.1  更快更強(qiáng)的端上檢測算法 + overflow-aware 量化應(yīng)用
4.1.1  更強(qiáng)的端上檢測算法
基于 anchor-free 方案,更高效的算法框架,使用 heatmap 輔助 anchor 方案
基于天貓精靈音箱,IOT 視覺模組等不同設(shè)備算力的硬件條件,對端上的手勢識別提出了更加高的要求,我們進(jìn)一步提升手勢識別算法能力框架:基于流行的 anchor-free centernet 算法,提出了 centernet-lite 的端上檢測算法,不過在實(shí)際算法的落地的過程中,我們發(fā)現(xiàn)目前流行的 anchor-free 方案在小網(wǎng)絡(luò)有一些天然劣勢:
  • 由于其天然基于 heatmap,最終精度與 heatmap 有很大關(guān)系,這對小型化不利。

  • 同時(shí),由于 heatmap 的原因,這種方案無法很好的解決同一類物體重疊的情況。


4.1.2  應(yīng)用 Overflow-aware 低比特量化算法
端上量化
加速目前業(yè)界流行的方案為谷歌 8bit 量化算法,事實(shí)上,有更優(yōu)秀的低比特量化算法:通過學(xué)習(xí)的方法,學(xué)習(xí)每一層的 min/max 范圍,動態(tài)的調(diào)整每一層的量化方案,目前在推理引擎端加速比為 70%。
最終我們采用使用 heatmap 方案來輔助 anchor 檢測方案且融合 Overflow,這取得了比較好的精度和效果的平衡,在天貓精靈硬件上。

4.2  優(yōu)化閉環(huán):AUTOAI 的手勢線上識別優(yōu)化框架 (讓算法越用越好)
我們利用在 deep learning 中有類似模型蒸餾的思想,通過采用預(yù)先訓(xùn)練好的復(fù)雜模型(Teacher model)的輸出作為監(jiān)督信號去訓(xùn)練線上網(wǎng)絡(luò)(student model)。我們可以在不直接接觸業(yè)務(wù)數(shù)據(jù)的情況下,不斷進(jìn)行算法的優(yōu)化。
使用圍欄的優(yōu)化結(jié)果:

五、產(chǎn)品級的序列(動態(tài))手勢
5.1  為什么要做動態(tài)手勢識別
我們在單點(diǎn)手勢已經(jīng)做了非常多的嘗試和應(yīng)用落地,但是動態(tài)手勢作為一種更自然更“爽”的交互方式,是我們一直在不斷鉆研的實(shí)際方向。
從產(chǎn)品的思路上來說,動態(tài)手勢提供了更多的交互感和參與感,其應(yīng)用的場景可能也是不一樣的,比如單點(diǎn)手勢可能應(yīng)用與 IOT 設(shè)備等操控類型的算法場景,動態(tài)手勢其獨(dú)特的參與感讓其更適用于教育,娛樂,線下運(yùn)營等實(shí)際場景,這也是我們不斷突破這個場景的原因。
5.2  基于 skeleton 的動態(tài)手勢識別算法
去年,我們實(shí)現(xiàn)了基于 skeleton-based 的動態(tài)手勢識別算法(相關(guān)工作已經(jīng)投稿ISMAR2019,并成功發(fā)表,鏈接:https://ieeexplore.ieee.org/document/8951971):
但是在實(shí)際的產(chǎn)品化過程中,我們發(fā)現(xiàn)對于通用的動態(tài)手勢識別,純粹的 skeleton-based 方案可能并不實(shí)用,主要原因有:
  • 算力:完成 skeleton-based 的一系列操作:手勢檢測+指尖回歸+時(shí)序網(wǎng)絡(luò)等需要較高算力,在天貓精靈等 IOT 設(shè)備上無法達(dá)到產(chǎn)品級別的能力。

  • motion blur:由于手勢運(yùn)動較快的原因,大部分動態(tài)手勢都有運(yùn)動模糊的情況,對檢測+關(guān)鍵點(diǎn)這類算法非常不友好。


因此,我們把目光投到了以動作識別為基礎(chǔ)、指尖回歸為輔助的時(shí)序推理方案。
5.3  基于視頻理解的動態(tài)手勢識別算法
時(shí)序推理
原理:圖像關(guān)系的時(shí)序推理(temporal reasoning)能力,要讓計(jì)算機(jī)認(rèn)識這兩個行為,需要兩張及以上的幀圖像來相互輔助識別。一個行為需要被多個幀協(xié)作來解釋。這種方案很好的解決了 motion blur 的問題,且算力上更可控。
Our Temporal Generation Network_
為解決運(yùn)動模糊等問題,采用基于 RGB 時(shí)序序列為主框架的視頻識別方案,提取連續(xù)采樣幀的特征,并使用改良的高效快速的非退化 3D 卷積網(wǎng)絡(luò),對時(shí)序特征進(jìn)行融合。
同時(shí)針對特定手勢的識別,提出一種基于手指關(guān)鍵點(diǎn)的輔助分支,使用 heatmap 分支對指尖關(guān)鍵點(diǎn)進(jìn)行多任務(wù)學(xué)習(xí)并回歸,檢測出手指的運(yùn)動軌跡,與 RGB 分支進(jìn)行特征融合,輔助動態(tài)手勢識別。算法整體結(jié)合了基于 RGB 和關(guān)鍵點(diǎn)方案的優(yōu)勢,達(dá)到了速度與精度的平衡。

六、未來展望
我們已經(jīng)在單點(diǎn)手勢識別,序列手勢識別在算法、業(yè)務(wù)都進(jìn)行了較多的探索和嘗試,關(guān)于手勢識別的未來算法探索方向和業(yè)務(wù)發(fā)力點(diǎn),我們也有一些自己的展望:
6.1  3D 手勢崛起
3D 人手姿勢估計(jì)是指基于輸入的 RGB 或 RGB-D 圖片進(jìn)行人手建模并找到關(guān)鍵部件(如,骨節(jié)點(diǎn))位置的過程。我們生活在三維世界,三維手勢交互必然帶來更自然更舒適的交互體驗(yàn)。我們也在 3D 人手交互方面正進(jìn)行積極探索,未來在電商產(chǎn)品交互式展示、VR/AR、手語識別、在線教育等方面,我們會推出更多的交互性更強(qiáng)的產(chǎn)品,提供更人性化的交互體驗(yàn)和服務(wù)。
Oculus Quest 在今年推出的 3D 手勢操控
6.2  手勢在 IOT 場景的應(yīng)用
手勢控制能否超越語音控制成為智能家居設(shè)備最自然不過的設(shè)備呢?在 IOT 場景,如果可以使用手勢控制電視,燈泡,空調(diào)等等。目前已經(jīng)有一些 startup 開始了在這方面的探索。
比如 Bixi,Bixi 是一款手勢小遙控器,感應(yīng)你的空中手勢,可以指揮你最喜歡的智能手機(jī)應(yīng)用程序、LifX 或者 Hue 燈泡、互聯(lián)網(wǎng)揚(yáng)聲器、GoPro 和許多其他 IoT 設(shè)備。
再比如如下圖的 Bearbot 萬用遙控器,除了萌系的外觀以外,還可以支持自定義手勢控制全屋家電,讓你從此擺脫一堆遙控器的束縛。
Bearbot 手勢遙控器,圖片來源:https://www.indiegogo.com/projects/bearbot#/
6.3  手勢在教育場景的更多應(yīng)用
除了手指點(diǎn)讀,手勢在教育行業(yè)其實(shí)應(yīng)該有更多的應(yīng)用,比如現(xiàn)在大火的在線教育,手勢可以增加虛擬課堂的互動感和,同時(shí)對于小朋友來說,手勢/視覺提供的有趣新奇的操控體驗(yàn)也是對幼兒提高課堂注意力非常重要的一環(huán),例如,引導(dǎo)舉手回答問題。再比如,我們需要做一些課堂小練習(xí),普通的模式太枯燥,使用動態(tài)手勢識別“畫對勾”,“畫叉叉”讓小朋友以互動游戲的方式完成這些練習(xí)。



  

協(xié)作機(jī)器人國內(nèi)外發(fā)展情況

協(xié)作機(jī)器人,其操作精度完全取決于核心零部件控制精度,更換作業(yè)時(shí)需要人工重設(shè)機(jī)械臂運(yùn)動軌跡

ai產(chǎn)品評測與抗疫支撐

研究領(lǐng)域覆蓋人工智能全產(chǎn)業(yè)鏈,建設(shè)開源生態(tài)、打造相關(guān)技術(shù)標(biāo)準(zhǔn)、推動可信AI落地,促進(jìn)產(chǎn)業(yè)融合

基于服務(wù)機(jī)器人的避障能力測試方法研究

機(jī)器人避障是機(jī)器人技術(shù)中一項(xiàng)最基礎(chǔ)也是關(guān)鍵的功能,在讓機(jī)器人行動過程中保證不發(fā)生碰撞,避免結(jié)構(gòu)的過度老化、脫落

我國工業(yè)機(jī)器人的發(fā)展趨勢

2019年工業(yè)機(jī)器人市場規(guī)模呈現(xiàn)下降趨勢,但總體市場規(guī)模仍然呈現(xiàn)穩(wěn)定上升趨勢,預(yù)計(jì)到2022年,達(dá)到552.3億元

國內(nèi)機(jī)器人發(fā)展現(xiàn)狀與趨勢

2019年中國機(jī)器人市場規(guī)模持續(xù)增長,預(yù)計(jì)到2022年市場規(guī)模將達(dá)到991.9億元,2020-2022三年復(fù)合增長率為19.0%。

服務(wù)機(jī)器人發(fā)展趨勢

新冠肺炎讓服務(wù)機(jī)器人承擔(dān)了必要的責(zé)任,讓服務(wù)機(jī)器人迎來黃金發(fā)展期

物流機(jī)器人優(yōu)勢-發(fā)展趨勢和應(yīng)用前景

物流機(jī)器人是在倉儲、物流、運(yùn)輸行業(yè),用于貨物輸送與分揀等作業(yè)的機(jī)器人,能夠自主或按預(yù)定路線自動行駛,將貨物或物料自動從起始點(diǎn)運(yùn)送到目的地,有效提高運(yùn)送和分揀效率,減少人工操作帶來的風(fēng)險(xiǎn)

物流機(jī)器人-國內(nèi)外發(fā)展情況

物流機(jī)器人國外起步較早,在機(jī)械結(jié)構(gòu)、導(dǎo)航定位、運(yùn)動控制、傳感器等方面較為成熟,國內(nèi)物流機(jī)器人雖起步較晚,但發(fā)展迅猛,在電商、汽車、煙草、印鈔、新聞紙等行業(yè)已有大規(guī)模應(yīng)用。

清潔機(jī)器人優(yōu)勢-發(fā)展趨勢和應(yīng)用前景

清潔機(jī)器人,能夠?qū)κ覂?nèi)或室外環(huán)境進(jìn)行自動清潔工作,具有環(huán)境識別、路徑規(guī)劃、自主導(dǎo)航、智能避障、自動清潔等功能

清潔機(jī)器人-國內(nèi)外發(fā)展情況

清潔機(jī)器人,國外步較早,產(chǎn)品形態(tài)和應(yīng)用場景也較為成熟,國內(nèi)依托于逐漸成熟的低速自動駕駛技術(shù),推出商用清潔機(jī)器人產(chǎn)品

陪護(hù)機(jī)器人優(yōu)勢-發(fā)展趨勢和應(yīng)用前景

陪護(hù)機(jī)器人,能夠協(xié)助醫(yī)護(hù)人員或家屬對患者或老人進(jìn)行護(hù)理,監(jiān)測被陪護(hù)對象的健康情況,并提供陪伴服務(wù)

陪護(hù)機(jī)器人-國內(nèi)外發(fā)展情況

陪護(hù)機(jī)器人能夠協(xié)助醫(yī)護(hù)人員或家屬對患者或老人進(jìn)行護(hù)理,國內(nèi)陪護(hù)機(jī)器人的研究與國外相比起步較晚,存在一定的差距
 
資料獲取
新聞資訊
== 資訊 ==
» 人形機(jī)器人未來3-5年能夠?qū)崿F(xiàn)產(chǎn)業(yè)化的方
» 導(dǎo)診服務(wù)機(jī)器人上崗門診大廳 助力醫(yī)院智慧
» 山東省青島市政府辦公廳發(fā)布《數(shù)字青島20
» 關(guān)于印發(fā)《青海省支持大數(shù)據(jù)產(chǎn)業(yè)發(fā)展政策措
» 全屋無主燈智能化規(guī)范
» 微波雷達(dá)傳感技術(shù)室內(nèi)照明應(yīng)用規(guī)范
» 人工智能研發(fā)運(yùn)營體系(ML0ps)實(shí)踐指
» 四驅(qū)四轉(zhuǎn)移動機(jī)器人運(yùn)動模型及應(yīng)用分析
» 國內(nèi)細(xì)分賽道企業(yè)在 AIGC 各應(yīng)用場景
» 國內(nèi)科技大廠布局生成式 AI,未來有望借
» AIGC領(lǐng)域相關(guān)初創(chuàng)公司及業(yè)務(wù)場景梳理
» ChatGPT 以 GPT+RLHF 模
» AIGC提升文字 圖片滲透率,視頻 直播
» AI商業(yè)化空間前景廣闊應(yīng)用場景豐富
» AI 內(nèi)容創(chuàng)作成本大幅降低且耗時(shí)更短 優(yōu)
 
== 機(jī)器人推薦 ==
 
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人底盤

機(jī)器人底盤

 

商用機(jī)器人  Disinfection Robot   展廳機(jī)器人  智能垃圾站  輪式機(jī)器人底盤  迎賓機(jī)器人  移動機(jī)器人底盤  講解機(jī)器人  紫外線消毒機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  服務(wù)機(jī)器人底盤  智能送餐機(jī)器人  霧化消毒機(jī)  機(jī)器人OEM代工廠  消毒機(jī)器人排名  智能配送機(jī)器人  圖書館機(jī)器人  導(dǎo)引機(jī)器人  移動消毒機(jī)器人  導(dǎo)診機(jī)器人  迎賓接待機(jī)器人  前臺機(jī)器人  導(dǎo)覽機(jī)器人  酒店送物機(jī)器人  云跡科技潤機(jī)器人  云跡酒店機(jī)器人  智能導(dǎo)診機(jī)器人 
版權(quán)所有 © 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司     中國運(yùn)營中心:北京·清華科技園九號樓5層     中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728

主站蜘蛛池模板: | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |