( by gemini 2.5 pro + screenshot )

好的,這張圖片是 LM Studio 載入 GGUF 格式模型時的設定畫面。我將為您逐一說明每個選項的功能與建議設定。


主要設定

1. 上下文長度 (Context Length)

2. GPU 卸載 (GPU Offload)

3. CPU 執行緒大小 (CPU Thread Count)

4. 評估批次大小 (Evaluation Batch Size)

進階設定

5. RoPE 頻率基數 (RoPE Frequency Base) & 頻率比例 (RoPE Frequency Scale)

6. 將 KV 快取即載到 GPU 記憶體 (Load KV cache to GPU memory)

7. 保留模型在記憶體中 (Keep model in memory)

8. 嘗試 mmap()

9. 種子 (Seed)

10. Flash Attention (高速注意力機制)

11. K 快取量化類型 & V 快取量化類型 (K/V Cache Quantization)


視窗下方選項

希望這份詳細的說明能幫助您更好地設定與使用 LM Studio!