做的姿勢編輯:LRS
【新智元導讀】有大佬最近在好快成人影片中做姿態識別的任務,發帖表示訓練集不夠用腰疼 。立刻得到蹲熱心網友響應:我圖解贊助140TB數據!
兄弟們又來正確學技術啦!
今天講的是人體動作識別(Human Action Recognition),做俯臥撐的正確姿勢,正確做核酸檢測的姿勢,也就是通過模型識別出圖片、視頻中的人體動作姿勢 。
最近Reddit的一個網友蹲突發奇想檢測,如果把模型用在成人內容領域,那一定可以大大增加色情視頻的鑒別和腰疼搜索的準確度做 。

文章插圖
據作者稱,他建立的深度學習模型以圖像RGB、骨架(Skeleton)和音頻作為輸入,測血壓的姿勢不對血壓是高還是低,對視頻做深拼音中的演員姿勢識別打撲準確度已經可以達到75%了 。

文章插圖
不過并非只是模型的簡單遷移,訓練過程做法也測遇到了一些技術上的難關,主要是因為攝像機位置在視頻中經常會變換 。
小編根據網友的描述推測,拍攝成人電影的攝像機可能是蹲沒有蹲固定機位、或機位變換次數多做法,而人體動作識別的模型通常應用于畫監控視頻等有固定位置的攝像機 。
作者還表示,躺著做縮肛運動的姿勢,訓練數據腸鏡集相對較小也是一個問題,他只有大約44小時的訓練數據,并且影片中的人物位置通常距離很近,所以大多數視頻很難得到準確的姿勢估計,也就沒有辦法將所有的位置納入做縮基于skeleton的模型中 。
一個比較新奇的發現是,輸入流中的音頻信號,對于4個action的分類是有提升效果的,不過初愛也只是對某些action有用 。

文章插圖
帖子核酸一出,也是獲得了畫技術好快大咖們的一致點贊 。

文章插圖
一切高都是為了科學!

文章插圖
不過網友們也立刻明白操作了作者的核心運動訴求:求資源!
有網友表示,你要么能108得到海量的資源支持撲克,或者一點也拿不到 。

文章插圖
也有人表示他曾經也做過類似的做深項目,他遇到的問題主要是高度嘈雜的場景和非常不穩定的攝像機 。真正困難的場景是有3個以上演員參與的場景,會讓實體的區分會變高還是得很困難 。
并且他表示對2人以上的sex position沒有概念,所以看到這個模型如此容易地達到這么高的準確率,感覺有點受挫,想肛看看樓主是怎么實現的 。
最慷慨的網友當場表示,我愿意贊助數據集!視頻大小140.6TB,時長達到11年6個月,包括6416位表演藝術家,坐的姿勢有多少種,還有46.5GB的圖片 。

文章插圖
有網友時做深跟著評論,替自己搞科研高的朋友同求資源 。

文章插圖
至于這項研究有什么意義,網友表示應用前景可大了!以后在資源網站上檢索,可以按照指定的position對視頻進行過濾,而不只是傳統的標簽姿、標題、類別等等 。
相關經驗推薦
- 穿心蓮涼拌菜做法還什么菜搭配 穿心蓮涼拌菜做法
- 冰糖雪梨治咳嗽的做法 冰糖雪梨治咳嗽
- 左歸丸組成中含有而右歸丸組成中不含有的藥物是 左歸丸組成
- 拼音k的正確書寫格式 k的正確書寫格式
- 電暖器什么加熱*好 電暖器什么加熱好
- 購買的機票里面是不是已經包含了人身意外險? 買機票時需要買保險嗎
- 魔聲ntune 魔聲Nergy簡介
- 好聽的仙氣名字 仙氣名字
- 狐貍能吃人吃的食物嗎 狐貍吃人嗎
- 口袋妖怪漆黑的魅影沖浪術在哪獲得 口袋妖怪漆黑的魅影沖浪術怎么用
