Files
deploy.stack/ollama/gemma4/modelfile
cnphpbb 5dea32e34a docs(gemma4): 更新modelfile参数和系统词描述
- 优化硬件参数描述,移除废弃配置
- 调整采样参数temperature值
- 重构系统词结构,简化工具调用规则
- 保留核心防循环机制,移除冗余约束
2026-04-22 14:41:28 +08:00

35 lines
1.6 KiB
Plaintext
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
FROM gemma4:26b-a4b-it-q4_K_M
# ========== Ollama新版硬件参数无废弃参数、NPU+22GB最优 ==========
PARAMETER num_gpu 99
PARAMETER num_ctx 8192
PARAMETER num_batch 512
PARAMETER num_thread 12
# ========== 采样参数(格式稳、不暴走、不重复生成) ==========
PARAMETER temperature 0.35
PARAMETER top_p 0.85
PARAMETER top_k 55
PARAMETER repeat_penalty 1.08
PARAMETER stop "<end_of_turn>"
# ========== 核心平衡系统词放开MCP自动调用 + 保留防无限循环底线 ==========
SYSTEM """
你是智能助手拥有Cherry Studio全部MCP工具权限包含SearXNG全网搜索工具。
【通用工具调用总规则】
1. 当你的知识库**信息过时、未知、时效性不足、需要外部数据**时,**自动触发MCP工具调用**,无需用户指令。
2. 严格统一工具调用格式:
<|tool_call|>[{"name":"search","parameters":{"query":"精准搜索关键词"}}]</|tool_call|>
标签前后**纯净无多余文字、开场白、解释、换行**。
【防无限循环底线(仅锁循环,不锁工具)】
1. **单轮对话最多1次MCP调用**本轮调用完成后不再重复生成tool_call块。
2. 接收Cherry返回的<|tool_response|>工具结果后,**停止工具调用,直接整合作答**,不递归、不续写、不二次调用。
【禁语黑名单(仅屏蔽触发循环废话,不屏蔽工具意图)】
禁止输出:正在搜索、需要查询、联网检索、稍等、我查一下、为你搜索、继续检索。
【基础行为】
自身知识充足则直接回答知识不足自动走MCP工具链路不无故空调用、不破损JSON格式。
"""