iconLogo
Published:2026/1/4 16:41:58

SAGE-32B爆誕!AIエージェント、IDAで進化💖

  1. タイトル & 超要約(15字以内) SAGE-32B!IDAで賢くなったAIエージェント🤖✨

  2. ギャル的キラキラポイント✨ ● IDA(反復蒸留)で頭脳パンプアップ!賢さ爆上がり⤴️ ● 逆推論アーキテクチャでエラー知らず!最強💪 ● 32Bパラメーターなのに高性能!コスパ最強じゃん?💰

  3. 詳細解説

    • 背景 LLM(大規模言語モデル)ちゃん、すごいけどマルチステップ(複数段階)の作業はちょっぴり苦手だったの🥺。エラーが出やすかったり、1回の会話にしか対応できなかったり…🌀IT業界では、もっと賢いAIが求められてたんだよね!
    • 方法 SAGE-32BはIDA(反復蒸留)ってテクニックで鍛えられたんだって!🤼‍♀️Qwen2.5-32Bをベースに、複雑な作業をこなす合成データでみっちりトレーニングしたらしい💖 あと、「逆推論」っていうすごい仕組みもあって、失敗を予測してエラーを回避するんだって!😳
    • 結果 マルチタスク(複数の作業)で大成功🎉 他のLLMよりずっと優秀なんだって! しかも、32Bパラメーターっていう、ちょっと控えめなサイズなのにすごいんだから驚き👀✨
    • 意義(ここがヤバい♡ポイント) IT業界が抱える課題を解決できる可能性大!🎉 業務の自動化、AIアシスタント、データ分析… 色んなことに役立つから、私たちの生活ももっと便利になるかも😻
  4. リアルでの使いみちアイデア💡

    • お仕事アシスタント🤖: 複雑な書類作成とか、会議の議事録作成とか、SAGE-32Bが代わりにやってくれる時代が来るかも⁉️
    • スマート家電の頭脳🧠: 家電が勝手に動いて、生活がもっと快適になる未来も夢じゃない💖

続きは「らくらく論文」アプリで

SAGE-32B: Agentic Reasoning via Iterative Distillation

Basab Jha / Firoj Paudel / Ujjwal Puri / Ethan Henkel / Zhang Yuting / Mateusz Kowalczyk / Mei Huang / Choi Donghyuk / Wang Junhao

We demonstrate SAGE-32B, a 32 billion parameter language model that focuses on agentic reasoning and long range planning tasks. Unlike chat models that aim for general conversation fluency, SAGE-32B is designed to operate in an agentic loop, emphasizing task decomposition, tool usage, and error recovery. The model is initialized from the Qwen2.5-32B pretrained model and fine tuned using Iterative Distillation, a two stage training process that improves reasoning performance through rigorously tested feedback loops. SAGE-32B also introduces an inverse reasoning approach, which uses a meta cognition head to forecast potential failures in the planning process before execution. On agentic reasoning benchmarks including MMLU-Pro, AgentBench, and MATH-500, SAGE-32B achieves higher success rates in multi tool usage scenarios compared to similarly sized baseline models, while remaining competitive on standard reasoning evaluations. Model weights are publicly released at https://huggingface.co/sagea-ai/sage-reasoning-32b

cs / cs.AI / cs.CL / cs.LG