iconLogo
Published:2026/1/2 21:44:02

ゲームエンジンで爆誕!✨ 超リアルな3D人間データセット!

  1. タイトル & 超要約(15字以内) ゲームエンジンで高品質な3D人間データ爆誕!

  2. ギャル的キラキラポイント✨ ×3

    • ● UE5 (ゲームエンジン) で爆速データ生成!
    • ● 約100万フレームの高品質データセット「UnrealPose-1M」を公開!
    • ● AIモデルの精度爆上げ、未来がアツい🔥
  3. 詳細解説

    • 背景 3D人間ポーズデータって、色んな分野でめっちゃ重要じゃん? でも、高品質なデータは高かったり、集めるのが大変だったりするんだよね😭 そこで、ゲームエンジンを使って、高品質なデータを大量に作っちゃおう!ってのが今回の研究だよ🌟
    • 方法 ゲームエンジン「Unreal Engine 5 (UE5)」の運動学 (動きの計算とかのこと) を使って、人間が色んなポーズを取ってる3Dデータを合成 (合成ってのは、データを作ることね) するよ! 色んな環境 (場所とか) やアクション (動き) をカバーして、リアリティのあるデータを作るんだって😎
    • 結果 高品質な画像データを作るパイプライン「UnrealPose-Gen」を開発して、約100万フレームのデータセット「UnrealPose-1M」を公開したんだって! 画像から3Dポーズを推定したり、2Dのポイントを検出したりするタスクで、めっちゃ良い結果が出たみたい✨
    • 意義(ここがヤバい♡ポイント) この研究で、AIモデルが人間の動きをめっちゃ良く理解できるようになるかも! ロボットとかAR/VR (拡張現実/仮想現実) の技術がさらに進化する予感😍 ゲームとかメタバース (仮想空間) の世界も、もっとリアルになるかもね!
  4. リアルでの使いみちアイデア💡 ×2

    • AIを使って、お店の防犯カメラの映像から、怪しい行動をしてる人を見つけ出すシステムとか作れるかも!👀
    • 自分のアバター (分身) を作って、オンライン会議で使えるようにするサービスとか、面白そうじゃん?💻

続きは「らくらく論文」アプリで

UnrealPose: Leveraging Game Engine Kinematics for Large-Scale Synthetic Human Pose Data

Joshua Kawaguchi / Saad Manzur / Emily Gao Wang / Maitreyi Sinha / Bryan Vela / Yunxi Wang / Brandon Vela / Wayne B. Hayes

Diverse, accurately labeled 3D human pose data is expensive and studio-bound, while in-the-wild datasets lack known ground truth. We introduce UnrealPose-Gen, an Unreal Engine 5 pipeline built on Movie Render Queue for high-quality offline rendering. Our generated frames include: (i) 3D joints in world and camera coordinates, (ii) 2D projections and COCO-style keypoints with occlusion and joint-visibility flags, (iii) person bounding boxes, and (iv) camera intrinsics and extrinsics. We use UnrealPose-Gen to present UnrealPose-1M, an approximately one million frame corpus comprising eight sequences: five scripted "coherent" sequences spanning five scenes, approximately 40 actions, and five subjects; and three randomized sequences across three scenes, approximately 100 actions, and five subjects, all captured from diverse camera trajectories for broad viewpoint coverage. As a fidelity check, we report real-to-synthetic results on four tasks: image-to-3D pose, 2D keypoint detection, 2D-to-3D lifting, and person detection/segmentation. Though time and resources constrain us from an unlimited dataset, we release the UnrealPose-1M dataset, as well as the UnrealPose-Gen pipeline to support third-party generation of human pose data.

cs / cs.CV