forked from DevOps/deploy.stack
feat(ollama): add qwen3.5-27b and gemma4-26b model configs
新增两个Ollama模型配置:Qwen3.5-27B和Gemma4-26B,包含硬件参数、采样配置与适配Cherry Studio的MCP工具调用系统提示词,同时补充Gemma4-26B的使用说明文档。
This commit is contained in:
21
ollama/qwen3.5-27b/modelfile
Normal file
21
ollama/qwen3.5-27b/modelfile
Normal file
@@ -0,0 +1,21 @@
|
|||||||
|
FROM qwen3.5:27b-q4_K_M
|
||||||
|
|
||||||
|
# 硬件最优参数
|
||||||
|
PARAMETER num_gpu 99
|
||||||
|
PARAMETER num_ctx 32768
|
||||||
|
PARAMETER num_batch 512
|
||||||
|
PARAMETER num_thread 12
|
||||||
|
|
||||||
|
# 采样稳定参数(工具调用最优)
|
||||||
|
PARAMETER temperature 0.38
|
||||||
|
PARAMETER top_p 0.86
|
||||||
|
PARAMETER repeat_penalty 1.06
|
||||||
|
|
||||||
|
# 极简系统词(原生收口,无需强锁)
|
||||||
|
SYSTEM """
|
||||||
|
你是本地智能助手,兼容Cherry全部MCP工具与自建SearXNG搜索。
|
||||||
|
1. 信息过时、缺失、需要实时数据时自动调用工具,严格使用格式:<|tool_call|>JSON</|tool_call|>
|
||||||
|
2. 单轮仅调用一次工具,获取结果后直接整理回答,不再重复调用。
|
||||||
|
3. 优先使用中文作答,知识库充足则直接回答,不无故联网。
|
||||||
|
4. 输出简洁规范,无多余废话与重复内容。
|
||||||
|
"""
|
||||||
Reference in New Issue
Block a user