🌟 ギャル的キラキラポイント✨ ● AEC図面(建築・エンジニアリング図面)に特化したAI評価キター!🎉 ● AIが図面のオブジェクト数えたり、質問に答えたりするよ!賢すぎ😳 ● IT企業、AEC業界向けサービスでガッポリ儲けられるチャンス💰
背景 AEC業界(建築・エンジニアリング・建設)の図面って、めっちゃ大事じゃん?📐 でも人間が見るの大変だし、AIにも読ませたい! 自然言語処理(文章を理解するAI)とか画像認識(画像を見るAI)は進化してるけど、専門的な図面は難しいってことで、新しいベンチマーク(性能を測るもの)が必要になったんだって😉
方法 AEC図面をAIに読ませて、オブジェクト(ドアとか窓とか)の数を数えさせたり、質問に答えさせたりして、AIの能力をチェック!👀 具体的には、オブジェクトカウントとQA(質問応答)の2つのタスクで評価するよ! いろんなAIモデルで試して、どれが一番優秀か競わせる感じ💖
結果 AIモデルによって得意不得意があるみたい😳 例えば、窓とドアのカウントは苦手だけど、OCR(文字認識)とか空間的な関係を理解するのは得意だったり! まだまだ改善の余地ありってことね🧐
続きは「らくらく論文」アプリで
AEC drawings encode geometry and semantics through symbols, layout conventions, and dense annotation, yet it remains unclear whether modern multimodal and vision-language models can reliably interpret this graphical language. We present AECV-Bench, a benchmark for evaluating multimodal and vision-language models on realistic AEC artefacts via two complementary use cases: (i) object counting on 120 high-quality floor plans (doors, windows, bedrooms, toilets), and (ii) drawing-grounded document QA spanning 192 question-answer pairs that test text extraction (OCR), instance counting, spatial reasoning, and comparative reasoning over common drawing regions. Object-counting performance is reported using per-field exact-match accuracy and MAPE results, while document-QA performance is reported using overall accuracy and per-category breakdowns with an LLM-as-a-judge scoring pipeline and targeted human adjudication for edge cases. Evaluating a broad set of state-of-the-art models under a unified protocol, we observe a stable capability gradient; OCR and text-centric document QA are strongest (up to 0.95 accuracy), spatial reasoning is moderate, and symbol-centric drawing understanding - especially reliable counting of doors and windows - remains unsolved (often 0.40-0.55 accuracy) with substantial proportional errors. These results suggest that current systems function well as document assistants but lack robust drawing literacy, motivating domain-specific representations and tool-augmented, human-in-the-loop workflows for an efficient AEC automation.