大模型评测智能体评测
岗位职责:
1.负责Agent的效果和质量评测工作,与产品、工程、算法、运营团队紧密沟通协作,深入理解评测需求,制定评测标准,搭建评测体系;
2.探索智能、高效的Agent自动化评测方案,主导评测系统的架构设计和开发工作;
3.关注行业前沿,持续吸收学习业界最佳评测实践,优化完善Agent评测工作;
任职资格:
1.大学本科及以上学历,计算机科学与技术、软件工程、大数据技术、人工智能等技术专业;
2.精通Java或Python开发;
3.有Agent或大模型评测经验,熟悉Agent或大模型评测方法。
拉勾安全提示