美团 M17 团队开源 Meeseeks 评测基准Source: Meituan TechCopyOriginal针对大模型知识推理能力与指令遵循能力存在表现差异的现象,为推进指令遵循能力的系统化研究与精准评估,美团 M17 团队推出全新评测基准 Meeseeks,并在GitHub、Huggingface、魔搭社区等开源平台上线。