想收集一些关于因人工智能被解雇的人的故事。不是那种通用的“重组”,也不是新闻稿中所说的,而是因为人工智能的真实原因。有没有相关的证据?
返回首页
一周热榜
你好,
我创建了Axiomeer,这是一个开源的AI代理市场协议。这个想法是:与其将工具集成硬编码到每个代理中,不如让代理在运行时浏览目录,市场负责对所有内容进行排名、执行、验证和审计。
它的工作原理如下:
- 提供者通过10行JSON清单发布产品(API、数据集、模型端点)
- 代理用自然语言或结构化标签描述他们的需求
- 路由器根据能力匹配(70%)、延迟(20%)、成本(10%)以及硬性约束过滤器对所有选项进行评分
- 最高得分的选项被执行,输出结果经过验证(需要引用吗?时间戳?),证据质量被确定性地评估
- 如果证据是虚假/伪造/低质量的,代理会选择放弃,而不是产生幻觉
- 每次执行都会记录为不可变的收据
我认为现有方法中缺失的部分是信任层。MCP标准化了你如何连接到工具服务器。Axiomeer在更高的层面上运作:使用哪个工具,来自哪个提供者,你能信任返回的结果吗?
技术栈:Python、FastAPI、SQLAlchemy、Ollama(本地LLM,无需API密钥)。v1版本配备天气提供者(Open-Meteo + 模拟数据)。该架构支持返回结构化JSON的任何HTTP端点。
我们正在寻找贡献者,以便在各个领域(金融、搜索、文档、代码执行)添加真实的提供者。每个提供者大约需要30行代码加一个清单。
几周前,我发布了关于 GoodToGo 的帖子 <a href="https://news.ycombinator.com/item?id=46656759">https://news.ycombinator.com/item?id=46656759</a> —— 这是一个为 AI 代理提供确定性答案的工具,回答“这个 PR 准备好合并了吗?”许多人询问我提到的更大规模的协调系统。这就是那个系统。
我厌倦了作为 Claude Code 的项目经理。它写代码没问题,但将生产代码交付出去需要七八个工作——研究、规划、设计审查、实施、代码审查、安全审计、PR 创建、CI 监控。我一直在自己协调所有工作。虽然代理的输入速度很快,但我仍然是瓶颈。我真正需要的是一个协调者的协调者——成群的代理和具有确定性质量检查的群体。
因此,我构建了 metaswarm。它将工作分解为多个阶段,并将每个阶段分配给一个专业的群体协调者。它管理交接,并使用 BEADS 作为在 /compact、/clear 甚至跨会话的确定性门控。只需将其指向一个 GitHub 问题或进行头脑风暴(它使用 Superpowers 提出澄清问题),它就会创建史诗、任务和依赖关系,然后运行完整的管道,直到合并 PR——包括像 CodeRabbit、Greptile 和 Bugbot 这样的外部代码审查。
让我最惊讶的是设计审查门控。五个代理——项目经理、架构师、设计师、安全专家、CTO——在每行代码写入之前并行审查每个计划。所有五个都必须批准。最多三轮审查,然后升级到人工。我原以为只是走个过场,但它确实捕捉到了真实的设计问题、依赖关系问题和安全漏洞。
这个周末,我将其指向我的待办事项列表。合并了 127 个 PR。每一个都达到了 100% 的测试覆盖率。没有人编写代码、审查代码或点击合并。好吧,我稍微引导了一下,主要是帮助一些史诗的计划。
一些经验教训:
代理的检查清单只是形式。代理跳过了覆盖率检查、误读了阈值,或者决定它们不适用。仅靠提示是不够的。解决方案是确定性门控——BEADS、预推送钩子、CI 任务,所有这些都在代理完成检查之上。无论代理是否合作,这些门控都能阻止不良代码。
这些代理只是 markdown 文件。没有自定义运行时,没有服务器,虽然我是在 TypeScript 上构建的,但代理是语言无关的。你可以阅读它们,编辑它们,添加自己的内容。
它也会自我反思。在每次合并 PR 后,系统会提取模式、注意事项和决策,形成一个 JSONL 知识库。代理只加载与它们正在处理的文件相关的条目。它交付的越多,犯错的机会就越少。它在不断学习中进步。
metaswarm 基于两个项目:<a href="https://github.com/steveyegge/beads" rel="nofollow">https://github.com/steveyegge/beads</a>(由 Steve Yegge 提供,支持 git 原生任务跟踪和知识准备)和 <a href="https://github.com/obra/superpowers" rel="nofollow">https://github.com/obra/superpowers</a>(由 Jesse Vincent 提供,支持有纪律的代理工作流程——TDD、头脑风暴、系统调试)。这两个项目都是必不可少的。
背景:我创办了 Technorati、Linuxcare 和 Warmstart;曾在 Lyft 和 Reddit 担任技术高管。我构建 metaswarm 是因为我需要能够以与我对人类团队相同的标准交付生产代码的自主代理。
$ cd my-project-name
$ npx metaswarm init
MIT 许可证。我不是律师。具体情况可能有所不同。欢迎提出问题/PR!
嗨,HN
我创建了一个名为 TheBaduk 的围棋(Baduk/Weiqi)平台。
<p>技术栈与主要特点:
前端:使用原生 JavaScript(无框架),针对桌面和移动设备进行了性能优化。
人工智能:客户端集成 KataGo(在浏览器中运行)。
后端:使用 Socket.io 实现实时匹配。
我希望创造一个无障碍的体验,让你可以立即开始游戏,而无需加载大量内容。
我很想听听你们对代码性能和用户界面响应速度的反馈。谢谢!
嗨,HN!我开发了 codex.nvim,这是一个与 Codex 集成的 IDE 风格的 Neovim 插件。
**亮点:**
- 支持 OpenAI Codex 计划(无需 API 密钥)
- 完全融入 Neovim(嵌入式终端工作流程)
- 右下角状态指示器显示忙碌/等待状态
- 快速将选定内容或文件树上下文发送给 Codex
**代码库:**
[https://github.com/ishiooon/codex.nvim](https://github.com/ishiooon/codex.nvim)
**我为什么要开发这个:**
我希望在 Neovim 中舒适地使用 Codex,而不依赖于 API。
欢迎反馈和想法!
介绍 Nia Vault,这是一个命令行工具(CLI),可以让你使用自然语言查询本地的 Markdown/文本文件。
它的功能:
- 对本地文件夹和笔记进行语义搜索
- 支持多个同步目录
- 提供带有引用的 RAG 风格回答,引用自你自己的文件
它的工作原理:
- 调用 `POST /search/query` 并传入 `local_folders`
- 使用 `search_mode: sources` 返回答案及文件引用
示例:
- vault ask “我关于项目规划的笔记有哪些?”
开源项目链接: [https://github.com/chenxin-yan/nia-vault](https://github.com/chenxin-yan/nia-vault)
大家好;
在这个周末,我使用Claude Code创建了这个应用。它是一个耳朵训练应用,旨在教导像我这样不太有天赋的音乐人音准和音程。我花了很多年弹吉他,却对音准的真正含义没有清晰的理解。直到我进行了一些弦的调音练习后,我才明白过来。频率滑入正确的位置,感受到那种准确性。我希望这个应用能够帮助其他人第一次感受到这一点,或者提高对不太常见音程的识别能力。任何反馈都非常感谢。