跳转到内容
FreeEval logo

FreeEval

一个模块化、可扩展的框架,用于对大语言模型进行可信且高效的自动化评测

模块化设计

采用模块化设计理念,便于评测组件的扩展和自定义。

可信结果

集成元评测技术,包括人工评测和数据污染检测。

高性能

高效的基础设施,支持多节点、多GPU的大规模评测。

全面支持

通过统一接口支持开源和专有大语言模型。