iconLogo
Published:2025/12/16 6:54:20

CVモデル爆速化計画!TorchTraceAPでアンチパターン見つけちゃお💖

  1. 超要約: CVモデルの動きを分析して、遅さの原因「アンチパターン」を特定するよ!

  2. ギャル的キラキラポイント✨ ● CVモデル(画像とか認識するAI)の動きを分析するよ! ● 遅くなる原因の「アンチパターン」を見つけるんだって! ● LLM(すごいAI)を使って、自動で解析しちゃうんだね!

  3. 詳細解説

    • 背景: CVモデルって、画像認識とかでめっちゃ活躍してるけど、処理が遅いと困るよね?😭 この研究は、その遅さの原因を特定して、早くする研究だよ!
    • 方法: CVモデルの動きを記録(トレース)して、遅延の原因になる部分(アンチパターン)を、LLMとか使って見つけ出すんだって!✨
    • 結果: いろんなCVモデルで試したら、めっちゃ高い精度でアンチパターン見つけられた!ルールベースとか、他のやり方よりスゴイらしい!
    • 意義(ここがヤバい♡ポイント): CVモデルが爆速になれば、自動運転とか医療とか、色んな分野で役立つじゃん?💖 開発も楽になるから、もっと色んなAIが出てくるかもね!
  4. リアルでの使いみちアイデア💡

    • 自分のスマホアプリの画像処理が遅い!って時に、原因を特定して爆速にできるかも!📱💨
    • ゲームとかで、グラフィックが重くてカクカクするのを、改善できるかもしれないね!🎮✨

続きは「らくらく論文」アプリで

TorchTraceAP: A New Benchmark Dataset for Detecting Performance Anti-Patterns in Computer Vision Models

Hanning Chen / Keyu Man / Kevin Zhu / Chenguang Zhu / Haonan Li / Tongbo Luo / Xizhou Feng / Wei Sun / Sreen Tallam / Mohsen Imani / Partha Kanuparthy

Identifying and addressing performance anti-patterns in machine learning (ML) models is critical for efficient training and inference, but it typically demands deep expertise spanning system infrastructure, ML models and kernel development. While large tech companies rely on dedicated ML infrastructure engineers to analyze torch traces and benchmarks, such resource-intensive workflows are largely inaccessible to computer vision researchers in general. Among the challenges, pinpointing problematic trace segments within lengthy execution traces remains the most time-consuming task, and is difficult to automate with current ML models, including LLMs. In this work, we present the first benchmark dataset specifically designed to evaluate and improve ML models' ability to detect anti patterns in traces. Our dataset contains over 600 PyTorch traces from diverse computer vision models classification, detection, segmentation, and generation collected across multiple hardware platforms. We also propose a novel iterative approach: a lightweight ML model first detects trace segments with anti patterns, followed by a large language model (LLM) for fine grained classification and targeted feedback. Experimental results demonstrate that our method significantly outperforms unsupervised clustering and rule based statistical techniques for detecting anti pattern regions. Our method also effectively compensates LLM's limited context length and reasoning inefficiencies.

cs / cs.CV / cs.AI