从你的场景出发,自动推荐模型与引擎,产出经过实测、复制即可运行的部署配方。
通用聊天、指令遵循、Agent。稠密 LLM 为主。
长上下文 LLM + 向量 + 重排组合。
图文理解、文档解析。VLM 模型。
SDXL / FLUX / Qwen-Image 等扩散模型。
DeepSeek-V3 / Qwen3-MoE,极致性价比。
BGE-M3 / Qwen3-Embedding / Reranker。