iconLogo
Published:2025/8/22 17:41:27

MurakkabでクラウドAIが超進化✨

  1. 超要約: クラウドでAI使うならコレ!リソース節約して爆速&低コストで動かすシステム🚀

  2. ギャル的キラキラポイント✨

    • ● クラウドAIの無駄をなくして、コストカット!💰✨
    • ● パフォーマンスも爆上がり!処理速度が劇的に速くなるよ💖
    • ● ワークフローを賢く管理して、常に最高の状態をキープ!💯
  3. 詳細解説

    • 背景: 最近のAIブームで、クラウド上で色んなAIを使うようになったじゃん? でも、リソースを無駄遣いしてたり、処理が遅かったりって問題があったの!😢
    • 方法: 「Murakkab(ムラッカブ)」っていうスゴイシステムが登場!ワークフロー(AIのお仕事の流れ)を効率化するんだって✨ 仕様と実行を分けて、賢く調整するから、無駄がない!
    • 結果: コストが安くなって、処理速度もアップ!AIがもっと使いやすくなるってこと💖 SLO(目標)もちゃんと達成できるから、サービスも安定するね!
    • 意義(ここがヤバい♡ポイント): 開発者はAIの仕組みに集中できるし、システムが勝手にいい感じに動いてくれるから、マジ神🥺 クラウドAIの世界がガラッと変わるかも!
  4. リアルでの使いみちアイデア💡

      1. 動画編集アプリで、AIが自動で編集してくれる機能とかに使えるかも!✨
      1. チャットボットの応答速度が速くなって、ユーザー満足度もアップ!🥰

続きは「らくらく論文」アプリで

Murakkab: Resource-Efficient Agentic Workflow Orchestration in Cloud Platforms

Gohar Irfan Chaudhry / Esha Choukse / Haoran Qiu / \'I\~nigo Goiri / Rodrigo Fonseca / Adam Belay / Ricardo Bianchini

Agentic workflows commonly coordinate multiple models and tools with complex control logic. They are quickly becoming the dominant paradigm for AI applications. However, serving them remains inefficient with today's frameworks. The key problem is that they expose workflows as opaque sequences of model and tool calls that tightly couple agent logic with model and hardware choices. Often, these workflow components are fragmented across different entities, preventing systems from reasoning about trade-offs across accuracy, latency, energy, and cost. This leads to resource waste and degraded service-level objectives (SLOs). We present Murakkab, a resource-efficient serving system for agentic workflows. Murakkab introduces a declarative abstraction that decouples workflow specification from execution configuration. A profile-guided optimizer and adaptive runtime jointly manage the full stack: orchestrating workflow components, mapping them to models and hardware, and dynamically reconfiguring execution to satisfy user-defined SLOs. By exposing the internal structure of agentic workflows, Murakkab enables cross-layer optimization that existing frameworks and cloud schedulers cannot achieve. Our evaluation on diverse workflows shows that \sysname{} reduces GPU usage by up to 2.8$\times$, energy consumption by 3.7$\times$, and cost by 4.3$\times$ while maintaining SLOs.

cs / cs.MA / cs.AI / cs.SE