我如何才能获取YC活动的通知,以便参加?
返回首页
最新
嗨,HN,我是Cordum的创始人。
我在DevOps和基础设施领域工作了多年(目前在金融科技/安全领域),在开始尝试AI代理时,我注意到了一个令人担忧的模式。大多数“安全”机制依赖于系统提示(“请不要做X”)或代理内部的脆弱Python逻辑。
如果我们将代理视为自主员工,给予它们根权限并希望它们遵循指令,这让我觉得非常不理智。我想要一种方式来强制执行硬性约束,无论LLM(大语言模型)如何“越狱”,都无法覆盖这些约束。
因此,我构建了Cordum。它是一个开源的“安全内核”,位于LLM的意图与实际执行之间。
该架构设计为语言无关:
1. *控制平面(Go/NATS/Redis):* 管理状态和策略。
2. *协议(CAP v2):* 定义作业、步骤和结果的传输格式。
3. *工作者:* 您可以使用Python(通过Pydantic)、Node或Go编写代理,它们都连接到同一个安全网络。
我关注的关键特性:
- *“杀开关”:* 能够通过消息总线即时撤销代理的权限,而无需关闭主机服务器。
- *审计日志:* 每个意图和行动都会被记录(在出现问题时至关重要)。
- *政策执行:* 在到达工作者之前,根据元数据(例如,“任何超过50美元的转账需要审核”)阻止某些操作。
现在还处于早期阶段(v0.x),但我很想听听您对架构的看法。单独的控制平面是否过于复杂,还是这正是代理基础设施的发展方向?
代码库:[https://github.com/cordum-io/cordum](https://github.com/cordum-io/cordum)
文档:[如果有文档,请提供链接]
谢谢!
嗨,HN,
我是Mo。我目前正在创建一家初创公司,想要在通勤或洗碗时找到一种方式来听取研究论文以获得灵感。
我尝试过使用谷歌的NotebookLM,但输出效果对我来说并不理想。它听起来有点机械,对话太短,而且在技术细节上没有深入。
因此,我构建了PaperBot FM来解决这个问题。
它会将一篇研究论文(以及最多两篇支持性论文以提供背景)合成一集播客。目前,播客的平均时长约为30分钟,尽管我还在调整时长。
技术方面:
主要的挑战在于音频。我找不到一个能够有效处理三种不同声音在单一对话流中的TTS服务。为了解决这个问题,我围绕Gemini TTS构建了一个自定义包装器,协调三种不同的“角色”,以保持对话的趣味性。
运行方式:
目前,网站只是一个每日社区信息流。用户提交论文,投票,系统根据获胜者每24小时生成一集播客。这个服务完全免费,所有集数都是公开的。
接下来有什么计划?
我正在评估两个方面的兴趣:
- 将其转变为一个可以按需生成播客集的服务(用于解释、内部文档等)。
- 将声音协调功能开放为API,因为找到一个支持超过两个并发声音的服务出乎意料地困难。
希望你喜欢这个项目!如果你对生成自定义播客集或声音生成API感兴趣,请告诉我。
经过两年的研究、规划和工程开发,我即将推出 earsay。这是一款旨在提供愉悦使用体验的 iOS 播客应用。它能够在设备上100%检测广告,限制广告网络的追踪,并且不需要任何外部服务或订阅费用。
我一直在尝试使用Claude Code来研究政治主题,利用伯明翰大学提供的联合国大会演讲档案(<a href="https://www.ungdc.bham.ac.uk/" rel="nofollow">https://www.ungdc.bham.ac.uk/</a>)。以下是一些初步结果。