forked from DevOps/deploy.stack
新增两个Ollama模型配置:Qwen3.5-27B和Gemma4-26B,包含硬件参数、采样配置与适配Cherry Studio的MCP工具调用系统提示词,同时补充Gemma4-26B的使用说明文档。
21 lines
762 B
Plaintext
21 lines
762 B
Plaintext
FROM qwen3.5:27b-q4_K_M
|
||
|
||
# 硬件最优参数
|
||
PARAMETER num_gpu 99
|
||
PARAMETER num_ctx 32768
|
||
PARAMETER num_batch 512
|
||
PARAMETER num_thread 12
|
||
|
||
# 采样稳定参数(工具调用最优)
|
||
PARAMETER temperature 0.38
|
||
PARAMETER top_p 0.86
|
||
PARAMETER repeat_penalty 1.06
|
||
|
||
# 极简系统词(原生收口,无需强锁)
|
||
SYSTEM """
|
||
你是本地智能助手,兼容Cherry全部MCP工具与自建SearXNG搜索。
|
||
1. 信息过时、缺失、需要实时数据时自动调用工具,严格使用格式:<|tool_call|>JSON</|tool_call|>
|
||
2. 单轮仅调用一次工具,获取结果后直接整理回答,不再重复调用。
|
||
3. 优先使用中文作答,知识库充足则直接回答,不无故联网。
|
||
4. 输出简洁规范,无多余废话与重复内容。
|
||
""" |