国产午夜精品一区二区-国产午夜精品视频-国产午夜精品免费一二区-国产午夜精品理论片在线-国产午夜精品理论片影院-国产午夜精品理论片


首頁
產品系列
行業應用
渠道合作
新聞中心
研究院
投資者關系
技術支持
關于創澤
| En
 
  當前位置:首頁 > 新聞資訊 > 機器人開發 > 如何更高效地壓縮時序數據?基于深度強化學習的探索  
 

如何更高效地壓縮時序數據?基于深度強化學習的探索

來源:阿里機器智能      編輯:創澤      時間:2020/6/4      主題:其他   [加盟]

隨著移動互聯網、IoT、5G 等的應用和普及,一步一步地我們走進了數字經濟時代。隨之而來的海量數據將是一種客觀的存在,并發揮出越來越重要的作用。時序數據是海量數據中的一個重要組成部分,除了挖掘分析預測等,如何高效的壓縮存儲是一個基礎且重要的課題。同時,我們也正處在人工智能時代,深度學習已經有了很多很好的應用,如何在更多更廣的層面發揮作用?本文總結了當前學術界和工業界數據壓縮的方法,分析了大型商用時序數據壓縮的特性,提出了一種新的算法,分享用深度強化學習進行數據壓縮的研究探索及取得的成果。

深度學習的本質是做決策,用它解決具體的問題時很重要的是找到契合點,合理建模,然后整理數據優化 loss 等最終較好地解決問題。在過去的一段時間,我們在用深度強化學習進行數據壓縮上做了一些研究探索并取得了一些成績,已經在 ICDE 2020 research track 發表(Two-level Data Compression using Machine Learning in Time Series Database)并做了口頭匯報。在這里做一個整體粗略介紹,希望對其它的場景,至少是其它數據的壓縮等,帶來一點借鑒作用。

背景描述

1 時序數據

時序數據顧名思義指的是和時間序列相關的數據,是日常隨處可見的一種數據形式。下圖羅列了三個示例:a)心電圖,b)股票指數,c)具體股票交易數據。

關于時序數據庫的工作內容,簡略地,在用戶的使用層面它需要響應海量的查詢,分析,預測等;而在底層它則需要處理海量的讀寫,壓縮解壓縮,采用聚合等操作,而這些的基本操作單元就是時序數據 <timestamp, value>,一般(也可以簡化)用兩個 8 byte 的值進行統一描述。

可以想象,任何電子設備每天都在產生各種各樣海量的時序數據,需要海量的存儲空間等,對它進行壓縮存儲及處理是一個自然而然的方法。而這里的著重點就是如何進行更高效的壓縮。

2  強化學習

機器學習按照樣本是否有 groundTruth 可分為有監督學習,無監督學習,以及強化學習等。強化學習顧名思義是不停地努力地去學習,不需要 groundTruth,真實世界很多時候也沒有 groundTruth,譬如人的認知很多時候就是不斷迭代學習的過程。從這個意義上來說,強化學習是更符合或更全面普遍的一種處理現實世界問題的過程和方法,所以有個說法是:如果深度學習慢慢地會像 C/Python/Java 那樣成為解決具體問題的一個基礎工具的話,那么強化學習是深度學習的一個基礎工具。

強化學習的經典示意圖如下,基本要素為 State,Action,和 Environment;具^程為:Environment 給出 State,Agent 根據 state 做 Action 決策,Action 作用在 Environment 上產生新的 State 及 reward,其中 reward 用來指導 Agent 做出更好的 Action 決策,循環往復….

而常見的有監督學習則簡單很多,可以認為是強化學習的一種特殊情況,目標很清晰就是 groudTruth,因此對應的 reward 也比較清晰。

強化學習按照個人理解可以歸納為以下三大類:

1)DQN

Deep Q network,比較符合人的直觀感受邏輯的一種類型,它會訓練一個評估 Q-value 的網絡,對任一 state 能給出各個 Action 的 reward,然后最終選擇 reward 最大的那個 action 進行操作即可。訓練過程通過評估 “估計的 Q-value” 和 “真正得到的 Q-value” 的結果進行反向傳遞,最終讓網絡估計 Q-value 越來越準。

2)Policy Gradient

是更加端到端的一種類型,訓練一個網絡,對任一 state 直接給出最終的 action。DQN 的適用范圍需要連續 state 的 Q-value 也比較連續(下圍棋等不適用這種情況),而 Policy Gradient 由于忽略內部過程直接給出 action,具有更大的普適性。但它的缺點是更難以評價及收斂。一般的訓練過程是:對某一 state,同時隨機的采取多種 action,評價各種 action 的結果進行反向傳遞,最終讓網絡輸出效果更好的 action。

3)Actor-Critic

試著糅合前面兩種網絡,取長補短,一方面用 policy Gradient 網絡進行任一 state 的 action 輸出,另外一方面用 DQN 網絡對 policy gradient 的 action 輸出進行較好的量化評價并以之來指導 policy gradient 的更新。如名字所示,就像表演者和評論家的關系。訓練過程需要同時訓練 actor(policy Graident)和 critic(QN)網絡,但 actor 的訓練只需要 follow critic 的指引就好。它有很多的變種,也是當前 DRL 理論研究上不停發展的主要方向。

時序數據的壓縮

對海量的時序數據進行壓縮是顯而易見的一個事情,因此在學術界和工業界也有很多的研究和探索,一些方法有:

Snappy:對整數或字符串進行壓縮,主要用了長距離預測和游程編碼(RLE),廣泛的應用包括 Infuxdb。

Simple8b:先對數據進行前后 delta 處理,如果相同用RLE編碼;否則根據一張有 16 個 entry 的碼表把 1 到 240 個數(每個數的 bits 根據碼表)pack 到 8B 為單位的數據中,有廣泛的應用包括 Infuxdb。

Compression planner:引入了一些 general 的壓縮 tool 如 scale, delta, dictionary, huffman, run length 和 patched constant 等,然后提出了用靜態的或動態辦法組合嘗試這些工具來進行壓縮;想法挺新穎但實際性能會是個問題。

ModelarDB:側重在有損壓縮,基于用戶給定的可容忍損失進行壓縮。基本思想是把維護一個小 buff,探測單前數據是否符合某種模式(斜率的直線擬合),如果不成功,切換模式重新開始buff等;對支持有損的 IoT 領域比較合適。

Sprintz:也是在 IoT 領域效果會比較好,側重在 8/16 bit 的整數處理;主要用了 scale 進行預測然后用 RLC 進行差值編碼并做 bit-level 的 packing。

Gorilla:應用在 Facebook 高吞吐實時系統中的當時 sofa 的壓縮算法,進行無損壓縮,廣泛適用于 IoT 和云端服務等各個領域。它引入 delta-of-delta 對時間戳進行處理,用 xor 對數據進行變換然后用 Huffman 編碼及 bit-packing。示例圖如下所示。

MO:類似 Gorilla,但去掉了 bit-packing,所有的數據操作基本都是字節對齊,降低了壓縮率但提供了處理性能。











基于深度學習目標檢測模型優缺點對比

深度學習模型:OverFeat、R-CNN、SPP-Net、Fast、R-CNN、Faster、R-CNN、R-FCN、Mask、R-CNN、YOLO、SSD、YOLOv2、416、DSOD300、R-SSD

傳統目標檢測算法對比

SIFT、PCA-SIFT、SURF 、ORB、 VJ 等目標檢測算法優缺點對比及使用場合比較

基于深度學習和傳統算法的人體姿態估計,技術細節都講清楚了

人體姿態估計便是計算機視覺領域現有的熱點問題,其主要任務是讓機器自動地檢測場景中的人“在哪里”和理解人在“干什么”

讓大規模深度學習訓練線性加速、性能無損,基于BMUF的Adam優化器并行化實踐

Adam 算法便以其卓越的性能風靡深度學習領域,該算法通常與同步隨機梯度技術相結合,采用數據并行的方式在多臺機器上執行

音樂人工智能、計算機聽覺及音樂科技

音樂科技、音樂人工智能與計算機聽覺以數字音樂和聲音為研究對象,是聲學、心理學、信號處理、人工智能、多媒體、音樂學及各行業領域知識相結合的重要交叉學科,具有重要的學術研究和產業開發價值

【深度】未來5-10年計算機視覺發展趨勢為何?

專家(查紅彬,陳熙霖,盧湖川,劉燁斌,章國鋒)從計算機視覺發展歷程、現有研究局限性、未來研究方向以及視覺研究范式等多方面展開了深入的探討

華南理工大學羅晶博士和楊辰光教授團隊發文提出遙操作機器人交互感知與學習算法

羅晶博士和楊辰光教授團隊提出,遙操作機器人系統可以自然地與外界環境進行交互、編碼人機協作任務和生成任務模型,從而提升系統的類人化操作行為和智能化程度

實時識別卡扣成功裝配的機器學習框架

卡扣式裝配廣泛應用于多種產品類型的制造中,卡扣裝配是結構性的鎖定機制,通過一個機器學習框架將人類識別成功快速裝配的能力遷移到自主機器人裝配上。

基于多任務學習和負反饋的深度召回模型

基于行為序列的深度學習推薦模型搭配高性能的近似檢索算法可以實現既準又快的召回性能,如何利用這些豐富的反饋信息改進召回模型的性能

張帆博士與Yiannis Demiris教授團隊提出高效的機器人學習抓取衣服方法

機器人輔助穿衣通常人工的將衣服附在機器人末端執行器上,忽略機器人識別衣服抓取點并進行抓取的過程,從而將問題簡化

百度算法大牛35頁PPT講解基于EasyDL訓練并部署企業級高精度AI模型

百度AI開發平臺高級研發工程師餅干老師,為大家系統講解企業在AI模型開發中的難點,以及針對這些難點,百度EasyDL專業版又是如何解決的

Technica公司發布智能霧計算平臺技術白皮書

SmartFog可以輕松地將人工智能分析微服務部署到云、霧和物聯網設備上,其架構支持與現有系統的靈活集成,提供了大量的實現方案,要用下一代人工智能算法來彌補現有解決方案的不足。
 
資料獲取
新聞資訊
== 資訊 ==
» 人形機器人未來3-5年能夠實現產業化的方
» 導診服務機器人上崗門診大廳 助力醫院智慧
» 山東省青島市政府辦公廳發布《數字青島20
» 關于印發《青海省支持大數據產業發展政策措
» 全屋無主燈智能化規范
» 微波雷達傳感技術室內照明應用規范
» 人工智能研發運營體系(ML0ps)實踐指
» 四驅四轉移動機器人運動模型及應用分析
» 國內細分賽道企業在 AIGC 各應用場景
» 國內科技大廠布局生成式 AI,未來有望借
» AIGC領域相關初創公司及業務場景梳理
» ChatGPT 以 GPT+RLHF 模
» AIGC提升文字 圖片滲透率,視頻 直播
» AI商業化空間前景廣闊應用場景豐富
» AI 內容創作成本大幅降低且耗時更短 優
 
== 機器人推薦 ==
 
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人底盤

機器人底盤

 

商用機器人  Disinfection Robot   展廳機器人  智能垃圾站  輪式機器人底盤  迎賓機器人  移動機器人底盤  講解機器人  紫外線消毒機器人  大屏機器人  霧化消毒機器人  服務機器人底盤  智能送餐機器人  霧化消毒機  機器人OEM代工廠  消毒機器人排名  智能配送機器人  圖書館機器人  導引機器人  移動消毒機器人  導診機器人  迎賓接待機器人  前臺機器人  導覽機器人  酒店送物機器人  云跡科技潤機器人  云跡酒店機器人  智能導診機器人 
版權所有 © 創澤智能機器人集團股份有限公司     中國運營中心:北京·清華科技園九號樓5層     中國生產中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728

主站蜘蛛池模板: 新版天堂资源中文8在线| 亚洲天堂视频一区| 国产一区在线观看免费| 日日摸摸| 成人影院app| 欧美在线高清视频| 91久久精品一区二区三区| 啦啦啦视频在线观看影院| 亚洲精品一二三四| 国产真实乱子伦xxxx仙踪| 色综合91| 国产h视频在线| 青青青青在线成人视99| 91天堂在线视频| 免费成人高清视频| 夜色成人网| 九九热精| 日韩一级在线| 成人免费观看视频| 欧美一区二区二区| 91伊人网| 男女性高爱潮免费网站| 永久免费影院| 久久国产精品女| 亚洲激情 欧美| 国内精品在线观看视频| 四虎影视在线看免费观看| 国产高清一区二区| 欧美在线视频免费看| 91手机看片国产永久免费| 毛片一级黄色| 一区二区三区欧美日韩国产| 九色国产在视频线精品视频| 亚洲va久久久久综合| 国产一区二区三区亚洲综合| 视频一区 中文字幕| 国产动漫在线| 日产国产欧美视频一区精品| 成人高清网站| 青青在线精品| aa级国产女人毛片好多水|