返回首页
最新
嗨,HN,我是Cordum的创始人。
我在DevOps和基础设施领域工作了多年(目前在金融科技/安全领域),在开始尝试AI代理时,我注意到了一个令人担忧的模式。大多数“安全”机制依赖于系统提示(“请不要做X”)或代理内部的脆弱Python逻辑。
如果我们将代理视为自主员工,给予它们根权限并希望它们遵循指令,这让我觉得非常不理智。我想要一种方式来强制执行硬性约束,无论LLM(大语言模型)如何“越狱”,都无法覆盖这些约束。
因此,我构建了Cordum。它是一个开源的“安全内核”,位于LLM的意图与实际执行之间。
该架构设计为语言无关:
1. *控制平面(Go/NATS/Redis):* 管理状态和策略。
2. *协议(CAP v2):* 定义作业、步骤和结果的传输格式。
3. *工作者:* 您可以使用Python(通过Pydantic)、Node或Go编写代理,它们都连接到同一个安全网络。
我关注的关键特性:
- *“杀开关”:* 能够通过消息总线即时撤销代理的权限,而无需关闭主机服务器。
- *审计日志:* 每个意图和行动都会被记录(在出现问题时至关重要)。
- *政策执行:* 在到达工作者之前,根据元数据(例如,“任何超过50美元的转账需要审核”)阻止某些操作。
现在还处于早期阶段(v0.x),但我很想听听您对架构的看法。单独的控制平面是否过于复杂,还是这正是代理基础设施的发展方向?
代码库:[https://github.com/cordum-io/cordum](https://github.com/cordum-io/cordum)
文档:[如果有文档,请提供链接]
谢谢!
嗨,HN,
我是Mo。我目前正在创建一家初创公司,想要在通勤或洗碗时找到一种方式来听取研究论文以获得灵感。
我尝试过使用谷歌的NotebookLM,但输出效果对我来说并不理想。它听起来有点机械,对话太短,而且在技术细节上没有深入。
因此,我构建了PaperBot FM来解决这个问题。
它会将一篇研究论文(以及最多两篇支持性论文以提供背景)合成一集播客。目前,播客的平均时长约为30分钟,尽管我还在调整时长。
技术方面:
主要的挑战在于音频。我找不到一个能够有效处理三种不同声音在单一对话流中的TTS服务。为了解决这个问题,我围绕Gemini TTS构建了一个自定义包装器,协调三种不同的“角色”,以保持对话的趣味性。
运行方式:
目前,网站只是一个每日社区信息流。用户提交论文,投票,系统根据获胜者每24小时生成一集播客。这个服务完全免费,所有集数都是公开的。
接下来有什么计划?
我正在评估两个方面的兴趣:
- 将其转变为一个可以按需生成播客集的服务(用于解释、内部文档等)。
- 将声音协调功能开放为API,因为找到一个支持超过两个并发声音的服务出乎意料地困难。
希望你喜欢这个项目!如果你对生成自定义播客集或声音生成API感兴趣,请告诉我。
经过两年的研究、规划和工程开发,我即将推出 earsay。这是一款旨在提供愉悦使用体验的 iOS 播客应用。它能够在设备上100%检测广告,限制广告网络的追踪,并且不需要任何外部服务或订阅费用。
我一直在尝试使用Claude Code来研究政治主题,利用伯明翰大学提供的联合国大会演讲档案(<a href="https://www.ungdc.bham.ac.uk/" rel="nofollow">https://www.ungdc.bham.ac.uk/</a>)。以下是一些初步结果。
在大多数周五晚上和周末,我和妻子会花30分钟以上的时间在Netflix上滚动浏览,互相否决对方的电影建议。我们的口味交集非常小。她喜欢浪漫喜剧和偶尔的惊悚片,对评分毫不在意。而我则倾向于那些获得好评的作品和超过三小时的史诗电影。最终,我们总是会选择一些我们都不太想看的电影,或者是一些舒适的电视剧。
因此,我创建了movieagent.io来帮助我们。它是一个能够找到你今晚想看的电影的代理。这个代理充当仲裁者,尽力弥合用户之间的差距。整个过程大约需要2-3分钟,具体取决于意见分歧的程度(以及Anthropic的API负载)。
代理会问几个快速问题,然后进行“对决”,向你展示两部电影,并询问哪部电影更能引起你的共鸣。你的选择会揭示代理应该更深入探讨的方向。
最后,用户会收到4-5部电影的推荐,并附有个性化的推荐说明,解释为什么这部电影是今晚的好选择。
虽然有时结果仍然不尽如人意,但确实帮助我们度过了几次精彩的电影之夜。
在过去的六个月里,我通过Vibed编写了这个餐厅和酒吧推荐应用程序。我没有写过一行代码。欢迎反馈。