NeMo Evaluator SDK - 企业级大语言模型基准测试工具,支持多后端与100+基准 | SkillsMD