iconLogo
Published:2026/1/11 15:08:05

手書き図面をAIが採点!?SketchJudge爆誕!✍️✨

  1. タイトル & 超要約(15字以内) 手書き図面を採点するAI「SketchJudge」爆誕!💯

  2. ギャル的キラキラポイント✨ ×3 ● 手書き図面のエラーをAIが診断する時代!😳 ● STEM教育(理系教育)をAIでサポート💖 ● AIが図面を理解して、業務効率UPも夢じゃない🌟

  3. 詳細解説

    • 背景 MLLM(マルチモーダル大規模言語モデル)ってすごいんだけど、手書き図面みたいな複雑なものは苦手だったの💦 教育現場とかで、手書き図面の評価ってめちゃくちゃ大事じゃん? だから、AIがもっと図面を理解できるようにしよ!って研究なんだって✨
    • 方法 SketchJudgeっていう、手書き図面評価用の新しいベンチマーク(基準)を作ったみたい!📐 幾何学とか、物理とか、色んな分野の手書き図面を集めて、AIがエラーを診断できるように訓練するんだって!😳 参照図面(正解)がある場合と、ない場合の両方でテストするらしい!🧐
    • 結果 SketchJudgeのおかげで、AIが手書き図面のエラーを「種類別に」特定できるようになったんだって!🎉 今まで難しかった、図面の曖昧さとか、色んな描き方の違いにも対応できるようになったってこと!👏
    • 意義(ここがヤバい♡ポイント) AIが手書き図面を理解できるようになれば、教育現場での自動採点とか、設計とかエンジニアリングの分野で、図面を解析するツールとかが作れるようになるじゃん?😍 そうすれば、先生たちの負担も減るし、もっと効率的に仕事ができるようになるってこと!✨
  4. リアルでの使いみちアイデア💡 ×2 ● 宿題で書いた図面をAI先生が秒速で採点!間違いを教えてくれるアプリ📱 ● CADソフトにAIが搭載されて、手書きのラフ図から設計図を自動生成!💻

続きは「らくらく論文」アプリで

SketchJudge: A Diagnostic Benchmark for Grading Hand-drawn Diagrams with Multimodal Large Language Models

Yuhang Su / Mei Wang / Yaoyao Zhong / Guozhang Li / Shixing Li / Yihan Feng / Hua Huang

While Multimodal Large Language Models (MLLMs) have achieved remarkable progress in visual understanding, they often struggle when faced with the unstructured and ambiguous nature of human-generated sketches. This limitation is particularly pronounced in the underexplored task of visual grading, where models should not only solve a problem but also diagnose errors in hand-drawn diagrams. Such diagnostic capabilities depend on complex structural, semantic, and metacognitive reasoning. To bridge this gap, we introduce SketchJudge, a novel benchmark tailored for evaluating MLLMs as graders of hand-drawn STEM diagrams. SketchJudge encompasses 1,015 hand-drawn student responses across four domains: geometry, physics, charts, and flowcharts, featuring diverse stylistic variations and distinct error types. Evaluations on SketchJudge demonstrate that even advanced MLLMs lag significantly behind humans, validating the benchmark's effectiveness in exposing the fragility of current vision-language alignment in symbolic and noisy contexts. All data, code, and evaluation scripts are publicly available at https://github.com/yuhangsu82/SketchJudge.

cs / cs.CV / cs.AI