跳转到内容

FreeEval

一个模块化、可扩展的框架，用于对大语言模型进行可信且高效的自动化评测

开始使用 GitHub

模块化设计

采用模块化设计理念，便于评测组件的扩展和自定义。

可信结果

集成元评测技术，包括人工评测和数据污染检测。

高性能

高效的基础设施，支持多节点、多GPU的大规模评测。

全面支持

通过统一接口支持开源和专有大语言模型。