QA 合集 🧣📋114

December 1, 2025 · View on GitHub

create date last modify

Keywords: QA

Transformer · 基础模型 · 23
Transformer · 位置编码 · 24
Transformer · BERT (Encoder-only) · 7
RLHF · 基础 · 13
RLHF · 策略梯度算法 · 6
SFT · 基础概念 · 9
SFT · PEFT · LoRA · 10
Agent · Promptint · 4
LLM · MoE (Mixture of Experts) · 8
LLM · 基座模型 · 6
LLM · 训练优化 · 2
Other · 非专业问题 · 2

Transformer · 基础模型 · `23`

Transformer · 位置编码 · `24`

Transformer · BERT (Encoder-only) · `7`

RLHF · 基础 · `13`

RLHF · 策略梯度算法 · `6`

SFT · 基础概念 · `9`

SFT · PEFT · LoRA · `10`

Agent · Promptint · `4`

LLM · MoE (Mixture of Experts) · `8`

LLM · 基座模型 · `6`

LLM · 训练优化 · `2`

Other · 非专业问题 · `2`

待整理