1作者: www_xiangyi_li21 天前原帖
我们刚刚开源了 [*BenchFlow*](<a href="https://github.com/benchflow-ai/benchflow" rel="nofollow">https://github.com/benchflow-ai/benchflow</a>)——一个为人工智能开发者和研究人员提供的评估基础设施和基准中心。无论您是构建还是运行基准,BenchFlow 都能帮助您快速且可重复地完成任务。 - 易于使用的 `BaseAgent`/`BaseBench` 接口 - 通过一条命令在多个代理和模型之间运行任务 - 添加您自己的基准和代理 - 收集结果、比较运行并加快迭代速度 - 支持 Docker 的基准部署 - 公共基准中心:[benchflow.ai](<a href="https://benchflow.ai" rel="nofollow">https://benchflow.ai</a>) 我们支持 OpenAI、HuggingFace、本地模型等。欢迎反馈或贡献! GitHub: <a href="https://github.com/benchflow-ai/benchflow" rel="nofollow">https://github.com/benchflow-ai/benchflow</a> 文档: <a href="https://docs.benchflow.ai/introduction" rel="nofollow">https://docs.benchflow.ai/introduction</a> Discord: <a href="https://discord.gg/mZ9Rc8q8W3" rel="nofollow">https://discord.gg/mZ9Rc8q8W3</a>