返回首页
最新
Mutatr 是一个端到端的 A/B 测试代理。<p>在实际操作中,它连接到一个代码库,然后:<p>1. 提出 A/B 处理方案<p>2. 在代码库中实现不同的变体<p>3. 使用模拟用户进行测试,这些用户模拟了您网站的预期受众<p>4. 返回关注图,帮助您在上线前了解哪些方案有效<p>有趣的是:Mutatr 最初是一个 YC 申请项目,但被拒绝了,因此我决定还是要构建它并开源。
有没有人正在做税务申报,觉得需要一个专门用于税务申报的无头SaaS服务?Claude / ChatGPT通过MCP与该服务集成……引导您填写税务申报表等,您审核后,它会提交,支付少量费用。完成。
DGS-1100是一款约40美元的管理型千兆交换机,具备真实的功能(802.1Q VLAN、STP、IGMP、端口安全),但其唯一的管理接口是2015年的JavaScript网页用户界面。没有SSH,没有REST API,SNMP对于任何有用的功能都是只读的。
我需要配置几个这样的交换机,但通过网页用户界面进行点击操作非常痛苦,因此我编写了一个CLI,通过Selenium驱动无头Chrome浏览器。它可以登录,抓取交换机通过XHR填充的JS数据文件,并向CGI端点提交表单以进行更改。每个写入命令在执行后都会读取配置,以验证交换机是否接受了该配置。
涵盖交换机所有暴露功能的63个命令——VLAN、PVID、STP、IGMP、风暴控制、端口安全、镜像、QoS、带宽限制、SNMP、流量分段等。此外,还有一个推荐命令,可以爬取13个数据文件并检查20类问题(如PVID不匹配、孤立端口、禁用的安全功能等),以及一个自动应用发现问题的修复命令。
此外,这个项目还实现了配置转储/差异/恢复以进行版本控制、生成可重复的批处理文件的模板命令、多交换机支持、Prometheus导出器、文本TUI和Shell补全功能。
使用Nix构建,因此运行命令`nix run github:bobberb/dgs-cli -- status`可以正常工作。进行了179个离线测试。
在DGS-1100-08V2上进行了测试。`--1210`标志为未来的DGS-1210支持而预留。
我正在构建OpenCastor,这是一个位于机器人硬件与其AI代理之间的运行时层。有一点让我感到惊讶:技能管道的排列顺序(上下文构建器 → 模型路由器 → 错误处理器等)以及像思考预算和上下文预算这样的参数,对任务成功率的影响与模型选择一样重要。
因此,我构建了一个分布式评估器。机器人将闲置的计算资源贡献出来,以基准测试配置与OHB-1进行比较,OHB-1是一个包含30个真实世界机器人任务(抓取、导航、响应等)的简单基准,使用Ollama进行本地LLM调用。搜索空间有263,424种配置(8个维度:模型路由、上下文预算、重试逻辑、漂移检测等)。演示排行榜显示了到目前为止的结果,并按硬件层级(Pi5+Hailo、Jetson、服务器、预算板)进行了分类。
当前的冠军配置可以免费下载为YAML格式,并应用于任何机器人。应用时会剥离P66安全参数——没有任何基准配置可以触及电机限制或紧急停止逻辑。
我希望获得以下方面的反馈:(1)基准任务是否具有代表性,(2)硬件层级的分类是否有用,以及(3)是否有任何人进行过针对机器人或其他领域的全舰队分布式评估代理配置。