返回首页
最新
构建了一个免费的Superwhisper替代品。Whisper在本地运行,支持通过OpenAI、Anthropic或Ollama进行可选的LLM清理。采用MIT许可证。
嗨,HN。我花了几个月时间开发了一款名为Codala的移动应用,但遗憾的是,它几乎没有下载量。我完全没有营销预算。
我开始怀疑这个应用是否真的不好,但我觉得核心想法是扎实的:你可以扫描任何二维码或条形码,然后打开一个空间来聊天、留下评论和讨论特定的产品或地点。
我知道这个应用需要用户留下评论才能显得活跃,但已经过去三周了,情况依然冷清。如果你想看看,我非常欢迎任何反馈或诚实的意见。
目前它只在Google Play上提供。
我构建了一个大小为6832字节的AI代理。整个运行时(包括二进制文件、桥接、工具和配置)大约为23KB。
PlanckClaw是用x86-64汇编语言编写的(显然是通过AI辅助代码生成的),仅使用了7个Linux系统调用。没有libc,没有分配器,没有运行时。这个二进制文件是一个纯路由器:它从命名管道读取消息,询问另一个管道有哪些工具,构建一个JSON提示,将其写入第三个管道,解析响应,调度工具调用,并转发答案。它从不接触网络或直接执行工具。
其他所有部分都通过shell脚本组合在一起(总共约460行):
- bridge_brain.sh:调用Anthropic API(约90行)
- bridge_discord.sh:通过WebSocket连接Discord网关(约180行)
- bridge_cli.sh:终端接口(约40行)
- bridge_claw.sh:工具发现和调度(约50行)
四个进程,六个命名FIFO,零共享状态。添加一个工具意味着只需将一个shell脚本放入claws/目录中。无需重启、重新编译或更改配置。
它可以执行真实的操作:使用工具(通过Claude的tool_use协议)、以追加模式存储的持久对话历史(JSONL格式)、当历史记录过长时自动进行内存压缩,以及可更换的个性文件(soul.md)。
这一切始于一个思想实验:现代代理框架拉取超过400个传递依赖,并在生成一个令牌之前就需要发送超过100MB的运行时。我发现了多个极简主义的项目,如picoclaw、nanoclaw或zeroclaw。我想找到最小可行的代理(AI代理的普朗克长度),看看仅用管道和系统调用能构建出什么。
这不是生产软件。缓冲区是固定大小的(大于4KB的消息会被截断),它仅在Linux x86-64上运行,错误处理也很基础。但它运行得非常完美,整个代码库(包括汇编语言约2800行)也很容易审核。
如果你想编写自己的桥接,所有三个扩展点(交互、脑、爪)的线级协议规范都记录在PROTOCOL.md中。
我们是一个小团队,正在研究公司如何处理内部人工智能代理的运营方面——这些代理是为财务、运营或市场营销工作流程构建的。我们关注的不是现成的SaaS工具,而是你们工程团队开发的定制代理。
我们具体想了解的内容包括:
1. 你们内部目前运行的代理数量是多少?
2. 日常管理这些代理的是工程团队还是使用它们的业务团队?
3. 你们如何跟踪这些代理的成本(如大型语言模型API费用、计算费用)?
4. 如果业务团队想要改变代理的行为,具体的流程是怎样的?
我们真心希望了解这个领域的情况,而不是在推销任何东西。