iconLogo
Published:2025/12/16 10:00:01
  1. タイトル & 超要約 Gödel's Poetry:AIで数学の証明を爆速にする方法、見つけちゃった💖

  2. ギャル的キラキラポイント✨

    • ● LLM(大規模言語モデル)とLean 4(証明支援システム)を合体!最強タッグで証明を生成するんだって🌟
    • ● 複雑な問題を「再帰的分解」ってテクで細かくして、LLMでも解けるようにしたのがすごい!✨
    • ● 論文がPyPIで公開されてるから、誰でも試せる!GitHubでコードも見れちゃう太っ腹っぷり💖
  3. 詳細解説

    • 背景 数学の証明って、めっっちゃ難しいじゃん?それをAIでやろう!って研究が最近アツいの🔥 でも、LLM(AI)だけだとミスっちゃうことも…🤯 そこで、賢いAIと、証明をチェックするシステムを組み合わせたら、最強なんじゃない?って話なんだよね!
    • 方法 難しい証明を、まず「再帰的分解」(問題を細かく分けること)で、簡単にするの。✨ そして、AI(Goedel-Prover-V2)に証明を作らせて、Lean 4っていう証明チェックシステムで確認! RAG(検索拡張生成)っていう技術も使って、証明に役立つ情報も引っ張ってくるんだって!賢すぎ🥺
    • 結果 この方法で、難しい証明も結構うまくいくようになったらしい!🎉 しかも、オープンソースで公開されてるから、誰でも試せるのがすごいよね!GitHubでコードも見れるから、色んな人が協力して、もっと進化するかもね😉
    • 意義(ここがヤバい♡ポイント) AIが数学の問題を解けるようになったら、ソフトウェアのバグ(プログラムのミス)を発見したり、AI自体の信頼性を高めたりできるじゃん?😳 自動運転とか、金融システムとか、色んな分野で役立つ未来が待ってるかも!✨ 夢広がる~!
  4. リアルでの使いみちアイデア💡

    • AIに「このプログラム、安全?」って聞けるようになるかも!✨セキュリティチェックが楽々💖
    • 数学の問題集アプリ作って、AIに「この証明、合ってる?」って確認してもらうの!間違え知らず💯
  5. もっと深掘りしたい子へ🔍 キーワード

    • LLM (大規模言語モデル)
    • Lean 4 (形式的証明支援システム)
    • 再帰的分解

続きは「らくらく論文」アプリで

G\"odel's Poetry

Kelly J. Davis

Formal, automated theorem proving has long been viewed as a challenge to artificial intelligence. We introduce here a new approach to computer theorem proving, one that employs specialized language models for Lean4 proof generation combined with recursive decomposition of difficult theorems into simpler entailing propositions. These models are coordinated through a multi-agent architecture that orchestrates autoformalization (if required), proof generation, decomposition of difficult theorems into simpler entailing propositions, and recursive proof (and/or decomposition) of these propositions. Without decomposition, we achieve a 90.4% pass rate on miniF2F. With decomposition, this is significantly improved. A key technical contribution lies in our extension of the Kimina Lean Server with abstract syntax tree (AST) parsing capabilities to facilitate automated, recursive proof decomposition. The system is made available on PyPI as goedels-poetry (at https://pypi.org/project/goedels-poetry ), and the open-source implementation KellyJDavis/goedels-poetry (at https://github.com/KellyJDavis/goedels-poetry ) facilitates both adaptation to alternative language models and extension with custom functionality.

cs / cs.AI / cs.LG