iconLogo
Published:2025/12/16 15:21:33

SignITで手話の世界をかわいく変革💖✨

LIS(イタリア手話)のデータセットで、手話認識を爆速(ばくはや)にする研究だよ!

🌟 ギャル的キラキラポイント✨ ● LISのデータセット不足を、かわいく解決! 94種類のサイン、644個の動画で勝負だよ💪 ● 2Dポーズキーポイントとか視覚情報(RGB画像)を組み合わせて、手話認識の精度を上げてるのがスゴすぎ💖 ● 聴覚(ちょうかく)障害者(しょうがいしゃ)と健聴(けんちょう)者のコミュニケーションをスムーズにする未来が楽しみだね🎶

詳細解説いくよ~!

背景 手話って、聴覚障害者の大切なコミュニケーションツールじゃん?でも、LISみたいなマイナーな言語は、データセットが全然足りなくて、研究が進みにくかったんだよね😭 IT業界でも、AIで手話認識する技術が求められてるけど、現状じゃ難しいって状況だったの!

続きは「らくらく論文」アプリで

SignIT: A Comprehensive Dataset and Multimodal Analysis for Italian Sign Language Recognition

Alessia Micieli / Giovanni Maria Farinella / Francesco Ragusa

In this work we present SignIT, a new dataset to study the task of Italian Sign Language (LIS) recognition. The dataset is composed of 644 videos covering 3.33 hours. We manually annotated videos considering a taxonomy of 94 distinct sign classes belonging to 5 macro-categories: Animals, Food, Colors, Emotions and Family. We also extracted 2D keypoints related to the hands, face and body of the users. With the dataset, we propose a benchmark for the sign recognition task, adopting several state-of-the-art models showing how temporal information, 2D keypoints and RGB frames can be influence the performance of these models. Results show the limitations of these models on this challenging LIS dataset. We release data and annotations at the following link: https://fpv-iplab.github.io/SignIT/.

cs / cs.CV