iconLogo
Published:2025/12/3 14:36:59

タイトル & 超要約:最新HAR技術✨RGB動画から行動認識を爆速で精度UP!

ギャル的キラキラポイント✨ ● 動画から人間の行動を認識する技術、HAR(ハー)がスゴいの💖 ● ヒートマップっていう、熱さみたいな情報を使って、動きをキャッチ👀 ● FPMっていう、賢いモジュールで、精度爆上がりらしい!

詳細解説 • 背景 動画から人間の行動を認識する研究が進んでるよ! 監視カメラとか、色んな場面で役立つからね。でも、ノイズに弱かったり、データが多すぎたりって問題があったの😢

• 方法 ヒートマッププーリングネットワーク(HP-Net)っていう新しい方法を開発したんだって! FPM(フィードバックプーリングモジュール)を使って、情報を効率的に抽出するんだってさ!

• 結果 行動認識の精度が上がったんだって! しかも、色んな情報(マルチモーダルデータ)も組み合わせられるから、さらにすごいことになってるみたい😳

続きは「らくらく論文」アプリで

Heatmap Pooling Network for Action Recognition from RGB Videos

Mengyuan Liu / Jinfu Liu / Yongkang Jiang / Bin He

Human action recognition (HAR) in videos has garnered widespread attention due to the rich information in RGB videos. Nevertheless, existing methods for extracting deep features from RGB videos face challenges such as information redundancy, susceptibility to noise and high storage costs. To address these issues and fully harness the useful information in videos, we propose a novel heatmap pooling network (HP-Net) for action recognition from videos, which extracts information-rich, robust and concise pooled features of the human body in videos through a feedback pooling module. The extracted pooled features demonstrate obvious performance advantages over the previously obtained pose data and heatmap features from videos. In addition, we design a spatial-motion co-learning module and a text refinement modulation module to integrate the extracted pooled features with other multimodal data, enabling more robust action recognition. Extensive experiments on several benchmarks namely NTU RGB+D 60, NTU RGB+D 120, Toyota-Smarthome and UAV-Human consistently verify the effectiveness of our HP-Net, which outperforms the existing human action recognition methods. Our code is publicly available at: https://github.com/liujf69/HPNet-Action.

cs / cs.CV