返回首页

一周热榜

1作者: oliveskin3 天前原帖
嘿,HN, 我开发了Tinman,因为在生产环境中发现大型语言模型(LLM)的失败实在太麻烦了。传统的测试只检查你已经想到的内容,而Tinman则试图发现你未曾想到的问题。 它是一个自主研究代理,能够: - 生成关于潜在失败模式的假设 - 设计并运行实验来测试这些假设 - 对失败进行分类(推理错误、工具使用、上下文问题等) - 提出干预措施并通过模拟进行验证 核心循环持续运行,每个周期都会为下一个周期提供信息。 为什么是现在:随着像OpenClaw/ClawdBot这样的工具为代理提供真实系统访问,失败的表面远比“糟糕的聊天机器人响应”要大得多。Tinman拥有一个网关适配器,可以连接到OpenClaw的WebSocket流,以便在请求流动时进行实时分析。 三种模式: - LAB:对开发环境进行无限制研究 - SHADOW:观察生产环境,标记问题 - PRODUCTION:需要人工批准 技术: - Python,全面支持异步 - 可扩展的GatewayAdapter ABC,适用于任何代理/网关 - 内存图,用于跟踪何时知道了什么 - 兼容OpenAI、Anthropic、Ollama、Groq、OpenRouter、Together ``` pip install AgentTinman tinman init && tinman tui ``` GitHub: [https://github.com/oliveskin/Agent-Tinman](https://github.com/oliveskin/Agent-Tinman) 文档: [https://oliveskin.github.io/Agent-Tinman/](https://oliveskin.github.io/Agent-Tinman/) OpenClaw适配器: [https://github.com/oliveskin/tinman-openclaw-eval](https://github.com/oliveskin/tinman-openclaw-eval) Apache 2.0。没有遥测,没有付费层。欢迎反馈和贡献。
1作者: dammdanyal3 天前原帖
嗨,HN!我创建了 Rechain(<a href="https:&#x2F;&#x2F;rechain.me" rel="nofollow">https:&#x2F;&#x2F;rechain.me</a>),这是一个每日单词谜题游戏,您需要通过一系列逻辑联想将两个看似无关的词连接起来。 例如:OCEAN → WAVE → HEAT → GLASS。每个词与前一个词都有关系(海洋波浪、热浪、热 + 玻璃 = 融化,等等)。 技术栈:React、Firebase、Gemini API 用于谜题生成,Vercel 托管。无需登录——您可以匿名玩,也可以选择登录以保存统计数据。 我为什么要创建它:我想要一个更像解决逻辑谜题而不是词汇测试的单词游戏。挑战不在于知道冷僻词汇,而在于找到两个概念之间的逻辑路径。 我希望获得的反馈包括: <p>谜题难度曲线(太简单?令人沮丧?) 移动端用户体验 “揭示字母”提示系统——有用还是过于依赖?<p>这是一个个人的副项目,我会根据反馈快速迭代。代码尚未开源,但很乐意讨论架构。
1作者: allenwowo20153 天前原帖
这里是OP。我昨天构建了这个工具,因为在尝试将整个源文件夹输入DeepSeek R1进行重构时,我不断遇到“上下文壁垒”。 我发现的大多数复制粘贴工具要么太复杂,要么无法正确处理node_modules(我曾经不小心将一个5MB的锁定文件粘贴到Claude中,瞬间消耗了我的限额)。 这个命令行工具(pack-repo-4ai)非常简单: 它会扫描你的代码库(忽略像__pycache__、.venv和二进制文件这样的垃圾文件)。 将每个文件用&lt;file path=&quot;...&quot;&gt; XML标签包裹起来。我发现推理模型在XML边界下比在标准Markdown中更好地遵循目录结构。 然后将结果复制到你的剪贴板。 这只是一个简单的Python脚本,但每天为我节省了大约10分钟的时间。很想知道这种XML格式是否对你的R1输出有帮助,就像对我的帮助一样。
1作者: bigtech3 天前原帖
我开发了Magpie,这是一个自托管的电子邮件聚合器,可以将多个IMAP/SMTP账户整合到一个收件箱中。<p>我之所以开始这个项目,是因为谷歌停止支持从我的雅虎账户提取邮件(Gmailify),我希望有一个私密的自托管解决方案。<p>主要特点: * 统一的收件箱,支持搜索和线程功能 * 轻量级后端 + 现代化网页用户界面 * 易于部署(支持Docker或手动部署) * 以隐私为优先,完全开源<p>这是基础版本,旨在简单、实用且易于扩展。我非常欢迎任何对电子邮件工具或自托管软件感兴趣的人提供反馈、报告bug或贡献代码。<p><a href="https:&#x2F;&#x2F;github.com&#x2F;FynleyMsg&#x2F;Magpie" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;FynleyMsg&#x2F;Magpie</a>
1作者: ritvikarya983 天前原帖
我想分享一下Minimal——这是一个开源的强化容器镜像集合,使用Apko、Melange和Wolfi软件包构建。该镜像每天构建,定期检查更新,并在上游源和Wolfi软件包中有修复可用时立即解决。它利用现有开源解决方案的优势,并提供商业可用的镜像,且完全免费。Minimal展示了我们可以自己构建和维护强化容器镜像的可能性。 Minimal将增加对更多镜像的支持,目标是由社区驱动,根据需要添加镜像,并实现完全自定义。