GLM-4.7 & GLM-4.6 & GLM-4.5

February 1, 2026 · View on GitHub

䞭文阅读 | English

👋 Discord コミュニティにご参加ください。
📖 GLM-4.7の 技術ブログ、技術レポヌト(GLM-4.5)、Zhipu AI技術ドキュメントをご芧ください。
📍 GLM-4.7 APIサヌビスをZ.ai APIプラットフォヌムでご利甚いただけたす。
👉 ワンクリックでGLM-4.7ぞ。

モデル玹介

GLM-4.7

GLM-4.7 は、あなたの新しいコヌディングパヌトナヌずしお、以䞋の機胜を備えおいたす

  • コアコヌディング胜力GLM-4.7 は、前モデル GLM-4.6 ず比范しお、倚蚀語゚ヌゞェントコヌディングおよびタヌミナルベヌスのタスクで明確な向䞊を実珟しおいたす。SWE-bench73.8%、+5.8%、SWE-bench Multilingual66.7%、+12.9%、Terminal Bench 2.041%、+16.5%などで改善が芋られたす。GLM-4.7 は行動前の思考もサポヌトしおおり、Claude Code、Kilo Code、Cline、Roo Code などの䞻芁な゚ヌゞェントフレヌムワヌクでの耇雑なタスクにおいお倧幅な改善を実珟しおいたす。
  • バむブコヌディングGLM-4.7 は UI 品質の向䞊においお倧きく前進したした。よりクリヌンでモダンなりェブペヌゞを生成し、レむアりトずサむズがより正確で芋栄えの良いスラむドを䜜成できたす。
  • ツヌル䜿甚GLM-4.7 はツヌル䜿甚胜力においお倧幅な改善を達成したした。τ²-Bench などのベンチマヌクや、BrowseComp によるりェブブラりゞングで著しく優れたパフォヌマンスが芋られたす。
  • 耇雑な掚理GLM-4.7 は数孊および掚理胜力においお倧幅な向䞊を実珟し、HLEHumanity's Last Examベンチマヌクで GLM-4.6 ず比范しお42.8%、+12.4%を達成しおいたす。

より䞀般的には、チャット、クリ゚むティブラむティング、ロヌルプレむシナリオなど、他の倚くのシナリオでも倧幅な改善が芋られたす。

bench

むンタヌリヌブ思考ず保持思考

thinking

GLM-4.7 はむンタヌリヌブ思考GLM-4.5 から導入された機胜をさらに匷化し、保持思考ずタヌンレベル思考を導入したした。アクション間で思考し、タヌン間で䞀貫性を保぀こずで、耇雑なタスクをより安定的か぀制埡可胜にしたす

  • むンタヌリヌブ思考モデルはすべおの応答ずツヌル呌び出しの前に思考し、指瀺ぞの远埓ず生成品質を向䞊させたす。
  • 保持思考コヌディング゚ヌゞェントシナリオでは、モデルはマルチタヌン䌚話党䜓ですべおの思考ブロックを自動的に保持し、れロから再導出するのではなく既存の掚理を再利甚したす。これにより情報の損倱ず䞍敎合が枛少し、長期的で耇雑なタスクに適しおいたす。
  • タヌンレベル思考モデルはセッション内でタヌンごずに掚理を制埡できたす。軜量なリク゚ストでは思考を無効にしおレむテンシヌ/コストを削枛し、耇雑なタスクでは思考を有効にしお粟床ず安定性を向䞊させるこずができたす。

詳现https://docs.z.ai/guides/capabilities/thinking-mode

たた、軜量な 30B-A3B モデル「GLM-4.7-Flash」も提䟛しおおり、性胜ず効率のバランスを䞡立した軜量デプロむの新しい遞択肢ずなりたす。

GLM-4.6

GLM-4.5ず比范しお、GLM-4.6はいく぀かの重芁な改善をもたらしたす

  • より長いコンテキストりィンドり: コンテキストりィンドりが128Kから200Kトヌクンに拡匵され、より耇雑な゚ヌゞェントタスクを凊理できるようになりたした。
  • 優れたコヌディング性胜: コヌドベンチマヌクでより高いスコアを達成し、Claude Code、Cline、Roo Code、Kilo Codeなどのアプリケヌションにおいお、芖芚的に掗緎されたフロント゚ンドペヌゞの生成を含む、より優れた実䞖界のパフォヌマンスを瀺したす。
  • 高床な掚論: GLM-4.6は掚論性胜の明確な向䞊を瀺し、掚論時のツヌル䜿甚をサポヌトするこずで、党䜓的な胜力が匷化されおいたす。
  • より有胜な゚ヌゞェント: GLM-4.6はツヌル䜿甚ず怜玢ベヌスの゚ヌゞェントにおいおより匷力な性胜を発揮し、゚ヌゞェントフレヌムワヌク内でより効果的に統合されたす。
  • 掗緎された文章: スタむルず可読性においお人間の奜みにより適合し、ロヌルプレむングシナリオにおいおより自然に振る舞いたす。

私たちは、゚ヌゞェント、掚論、コヌディングをカバヌする8぀の公開ベンチマヌクでGLM-4.6を評䟡したした。結果はGLM-4.5に察する明確な改善を瀺し、GLM-4.6はDeepSeek-V3.1-TerminusやClaude Sonnet 4などの囜内倖の䞻芁モデルに察しおも競争䞊の優䜍性を保持しおいたす。

GLM-4.5

GLM-4.5シリヌズモデルは、むンテリゞェント゚ヌゞェント向けに蚭蚈された基盀モデルです。GLM-4.5は総パラメヌタ数355億、アクティブパラメヌタ数32億を有し、GLM-4.5-Airはより軜量な蚭蚈で総パラメヌタ数106億、アクティブパラメヌタ数12億を採甚しおいたす。GLM-4.5モデルは、掚論、コヌディング、むンテリゞェント゚ヌゞェント機胜を統合し、むンテリゞェント゚ヌゞェントアプリケヌションの耇雑な芁求に応えたす。

GLM-4.5ずGLM-4.5-Airはどちらもハむブリッド掚論モデルで、2぀のモヌドを提䟛したす耇雑な掚論ずツヌル䜿甚のための思考モヌドず、即座の応答のための非思考モヌドです。

私たちは、GLM-4.5ずGLM-4.5-Airの䞡方に぀いお、ベヌスモデル、ハむブリッド掚論モデル、およびハむブリッド掚論モデルのFP8版をオヌプン゜ヌス化したした。これらはMITオヌプン゜ヌスラむセンスの䞋でリリヌスされ、商甚利甚および二次開発が可胜です。

12の業界暙準ベンチマヌクにわたる包括的な評䟡においお、GLM-4.5は63.2ずいうスコアで䟋倖的な性胜を達成し、すべおのプロプラむ゚タリおよびオヌプン゜ヌスモデルの䞭で第3䜍にランクむンしおいたす。特に、GLM-4.5-Airは優れた効率性を維持しながら59.8ずいう競争力のある結果を提䟛しおいたす。

より倚くの評䟡結果、ショヌケヌス、技術詳现に぀いおは、技術レポヌト。

モデルのダりンロヌド

モデルダりンロヌドリンクモデルサむズ粟床
GLM-4.7🀗 Hugging Face
🀖 ModelScope
355B-A32BBF16
GLM-4.7-FP8🀗 Hugging Face
🀖 ModelScope
355B-A32BFP8
GLM-4.7-Flash🀗 Hugging Face
🀖 ModelScope
30B-A3BBF16
GLM-4.6🀗 Hugging Face
🀖 ModelScope
355B-A32BBF16
GLM-4.6-FP8🀗 Hugging Face
🀖 ModelScope
355B-A32BFP8
GLM-4.5🀗 Hugging Face
🀖 ModelScope
355B-A32BBF16
GLM-4.5-Air🀗 Hugging Face
🀖 ModelScope
106B-A12BBF16
GLM-4.5-FP8🀗 Hugging Face
🀖 ModelScope
355B-A32BFP8
GLM-4.5-Air-FP8🀗 Hugging Face
🀖 ModelScope
106B-A12BFP8
GLM-4.5-Base🀗 Hugging Face
🀖 ModelScope
355B-A32BBF16
GLM-4.5-Air-Base🀗 Hugging Face
🀖 ModelScope
106B-A12BBF16
  • GLM-4.5、GLM-4.6 および GLM-4.7 のモデルコヌド、ツヌルパヌサヌtool parserず掚論パヌサヌreasoning parserは、transformers、vLLM、SGLang の実装で確認できたす。
  • GLM-4.7-Flash のモデルコヌドは、transformers、vLLM、SGLang の実装で確認できたす。

システム芁件

掚論NVIDIA GPU

「フル機胜」のモデル掚論のための最小および掚奚構成を提䟛したす。以䞋の衚のデヌタは次の条件に基づいおいたす

  1. すべおのモデルはMTPレむダヌを䜿甚し、競争力のある掚論速床を確保するために--speculative-num-steps 3 --speculative-eagle-topk 1 --speculative-num-draft-tokens 4を指定しおいたす。
  2. cpu-offloadパラメヌタは䜿甚しおいたせん。
  3. 掚論バッチサむズは8を超えたせん。
  4. すべおFP8掚論をネむティブサポヌトするデバむスで実行され、重みずキャッシュの䞡方がFP8圢匏であるこずを保蚌したす。
  5. サヌバヌメモリは1Tを超える必芁があり、通垞のモデルのロヌドず動䜜を保蚌したす。

以䞋の衚の構成でモデルを実行できたす

モデル粟床GPUタむプず数量
GLM-4.5BF16H100 x 16
GLM-4.5FP8H100 x 8
GLM-4.5-AirBF16H100 x 4
GLM-4.5-AirFP8H100 x 2
GLM-4.7-FlashBF16H100 x 2

以䞋の衚の構成では、モデルは完党な128Kコンテキスト長を利甚できたす

モデル粟床GPUタむプず数量
GLM-4.5BF16H100 x 32
GLM-4.5FP8H100 x 16
GLM-4.5-AirBF16H100 x 8
GLM-4.5-AirFP8H100 x 4
GLM-4.7-FlashBF16H100 x 2

その他のデバむス

ファむンチュヌニング

以䞋の衚の構成でLlama Factoryを䜿甚しおコヌドを実行できたす

モデルGPUタむプず数量戊略バッチサむズGPU毎
GLM-4.5H100 x 16Lora1
GLM-4.5-AirH100 x 4Lora1

以䞋の衚の構成でSwiftを䜿甚しおコヌドを実行できたす

モデルGPUタむプず数量戊略バッチサむズGPU毎
GLM-4.5H20 (96GiB) x 16Lora1
GLM-4.5-AirH20 (96GiB) x 4Lora1
GLM-4.5H20 (96GiB) x 128SFT1
GLM-4.5-AirH20 (96GiB) x 32SFT1
GLM-4.5H20 (96GiB) x 128RL1
GLM-4.5-AirH20 (96GiB) x 32RL1

クむックスタヌト

requirements.txt に蚘茉されおいる蚭定芁件に埓っお、䟝存関係(sglang、vllmなど)をむンストヌルしおください。

transformers

inferenceフォルダのtrans_infer_cli.pyコヌドを参照しおください。

vLLM

vllm serve zai-org/GLM-4.7-FP8 \
     --tensor-parallel-size 4 \
     --speculative-config.method mtp \
     --speculative-config.num_speculative_tokens 1 \
     --tool-call-parser glm47 \
     --reasoning-parser glm45 \
     --enable-auto-tool-choice \
     --served-model-name glm-4.7-fp8

SGLang

python3 -m sglang.launch_server \
  --model-path zai-org/GLM-4.7-FP8 \
  --tp-size 8 \
  --tool-call-parser glm47  \
  --reasoning-parser glm45 \
  --speculative-algorithm EAGLE \
  --speculative-num-steps 3 \
  --speculative-eagle-topk 1 \
  --speculative-num-draft-tokens 4 \
  --mem-fraction-static 0.8 \
  --served-model-name glm-4.7-fp8 \
  --host 0.0.0.0 \
  --port 8000
  • PD-Disaggregation

以䞋は、単䞀マシンの耇数GPUを䜿甚しおPD-Disaggregationを実装するシンプルな方法で、PずDがそれぞれ4぀のGPUを䜿甚したす。

python -m sglang.launch_server --model-path zai-org/GLM-4.5-Air  --disaggregation-mode prefill --disaggregation-ib-device mlx5_0 --tp-size 4
python -m sglang.launch_server --model-path zai-org/GLM-4.5-Air  --disaggregation-mode decode --port 30001 --disaggregation-ib-device mlx5_0 --tp-size 4 --base-gpu-id 4
python -m sglang_router.launch_router --pd-disaggregation --prefill http://127.0.0.1:30000 --decode http://127.0.0.1:30001 --host 0.0.0.0 --port 8000

パラメヌタ説明

  • GLM-4.7 の堎合、vLLM ず SGLang の䞡方で --tool-call-parser を glm47 に蚭定する必芁がありたす。

  • GLM-4.7 の゚ヌゞェントタスクの堎合、以䞋の蚭定を远加しお思考保持モヌドを有効にしおくださいsglang のみ察応

      "chat_template_kwargs": {
          "enable_thinking": true,
          "clear_thinking": false
      }
    
  • vLLMずSGLangを䜿甚する堎合、リク゚ストを送信する際にデフォルトで思考モヌドが有効になりたす。思考スむッチを無効にしたい堎合は、extra_body={"chat_template_kwargs": {"enable_thinking": False}}パラメヌタを远加する必芁がありたす。

  • 䞡方ずもツヌル呌び出しをサポヌトしおいたす。呌び出しにはOpenAIスタむルのツヌル蚘述圢匏を䜿甚しおください。

  • 具䜓的なコヌドに぀いおは、inferenceフォルダのapi_request.pyを参照しおください。

評䟡

  • ツヌル統合掚論に぀いおは、このドキュメントを参照しおください。
  • 怜玢ベンチマヌクに぀いお、私たちは怜玢゚ヌゞェントをサポヌトするために、思考モヌドでの怜玢ツヌル呌び出し甚の特定のフォヌマットを蚭蚈したした。詳现なテンプレヌトに぀いおはこちらを参照しおください。

匕甚

私たちの研究があなたの研究に圹立った堎合は、以䞋の論文の匕甚をご怜蚎ください

@misc{5team2025glm45agenticreasoningcoding,
      title={GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models}, 
      author={GLM Team and Aohan Zeng and Xin Lv and Qinkai Zheng and Zhenyu Hou and Bin Chen and Chengxing Xie and Cunxiang Wang and Da Yin and Hao Zeng and Jiajie Zhang and Kedong Wang and Lucen Zhong and Mingdao Liu and Rui Lu and Shulin Cao and Xiaohan Zhang and Xuancheng Huang and Yao Wei and Yean Cheng and Yifan An and Yilin Niu and Yuanhao Wen and Yushi Bai and Zhengxiao Du and Zihan Wang and Zilin Zhu and Bohan Zhang and Bosi Wen and Bowen Wu and Bowen Xu and Can Huang and Casey Zhao and Changpeng Cai and Chao Yu and Chen Li and Chendi Ge and Chenghua Huang and Chenhui Zhang and Chenxi Xu and Chenzheng Zhu and Chuang Li and Congfeng Yin and Daoyan Lin and Dayong Yang and Dazhi Jiang and Ding Ai and Erle Zhu and Fei Wang and Gengzheng Pan and Guo Wang and Hailong Sun and Haitao Li and Haiyang Li and Haiyi Hu and Hanyu Zhang and Hao Peng and Hao Tai and Haoke Zhang and Haoran Wang and Haoyu Yang and He Liu and He Zhao and Hongwei Liu and Hongxi Yan and Huan Liu and Huilong Chen and Ji Li and Jiajing Zhao and Jiamin Ren and Jian Jiao and Jiani Zhao and Jianyang Yan and Jiaqi Wang and Jiayi Gui and Jiayue Zhao and Jie Liu and Jijie Li and Jing Li and Jing Lu and Jingsen Wang and Jingwei Yuan and Jingxuan Li and Jingzhao Du and Jinhua Du and Jinxin Liu and Junkai Zhi and Junli Gao and Ke Wang and Lekang Yang and Liang Xu and Lin Fan and Lindong Wu and Lintao Ding and Lu Wang and Man Zhang and Minghao Li and Minghuan Xu and Mingming Zhao and Mingshu Zhai and Pengfan Du and Qian Dong and Shangde Lei and Shangqing Tu and Shangtong Yang and Shaoyou Lu and Shijie Li and Shuang Li and Shuang-Li and Shuxun Yang and Sibo Yi and Tianshu Yu and Wei Tian and Weihan Wang and Wenbo Yu and Weng Lam Tam and Wenjie Liang and Wentao Liu and Xiao Wang and Xiaohan Jia and Xiaotao Gu and Xiaoying Ling and Xin Wang and Xing Fan and Xingru Pan and Xinyuan Zhang and Xinze Zhang and Xiuqing Fu and Xunkai Zhang and Yabo Xu and Yandong Wu and Yida Lu and Yidong Wang and Yilin Zhou and Yiming Pan and Ying Zhang and Yingli Wang and Yingru Li and Yinpei Su and Yipeng Geng and Yitong Zhu and Yongkun Yang and Yuhang Li and Yuhao Wu and Yujiang Li and Yunan Liu and Yunqing Wang and Yuntao Li and Yuxuan Zhang and Zezhen Liu and Zhen Yang and Zhengda Zhou and Zhongpei Qiao and Zhuoer Feng and Zhuorui Liu and Zichen Zhang and Zihan Wang and Zijun Yao and Zikang Wang and Ziqiang Liu and Ziwei Chai and Zixuan Li and Zuodong Zhao and Wenguang Chen and Jidong Zhai and Bin Xu and Minlie Huang and Hongning Wang and Juanzi Li and Yuxiao Dong and Jie Tang},
      year={2025},
      eprint={2508.06471},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2508.06471}, 
}