1作者: yaront11118 天前原帖
嗨,HN,我是Cordum的创始人。 我在DevOps和基础设施领域工作了多年(目前在金融科技/安全领域),在开始尝试AI代理时,我注意到了一个令人担忧的模式。大多数“安全”机制依赖于系统提示(“请不要做X”)或代理内部的脆弱Python逻辑。 如果我们将代理视为自主员工,给予它们根权限并希望它们遵循指令,这让我觉得非常不理智。我想要一种方式来强制执行硬性约束,无论LLM(大语言模型)如何“越狱”,都无法覆盖这些约束。 因此,我构建了Cordum。它是一个开源的“安全内核”,位于LLM的意图与实际执行之间。 该架构设计为语言无关: 1. *控制平面(Go/NATS/Redis):* 管理状态和策略。 2. *协议(CAP v2):* 定义作业、步骤和结果的传输格式。 3. *工作者:* 您可以使用Python(通过Pydantic)、Node或Go编写代理,它们都连接到同一个安全网络。 我关注的关键特性: - *“杀开关”:* 能够通过消息总线即时撤销代理的权限,而无需关闭主机服务器。 - *审计日志:* 每个意图和行动都会被记录(在出现问题时至关重要)。 - *政策执行:* 在到达工作者之前,根据元数据(例如,“任何超过50美元的转账需要审核”)阻止某些操作。 现在还处于早期阶段(v0.x),但我很想听听您对架构的看法。单独的控制平面是否过于复杂,还是这正是代理基础设施的发展方向? 代码库:[https://github.com/cordum-io/cordum](https://github.com/cordum-io/cordum) 文档:[如果有文档,请提供链接] 谢谢!
1作者: mohasarc18 天前原帖
嗨,HN, 我是Mo。我目前正在创建一家初创公司,想要在通勤或洗碗时找到一种方式来听取研究论文以获得灵感。 我尝试过使用谷歌的NotebookLM,但输出效果对我来说并不理想。它听起来有点机械,对话太短,而且在技术细节上没有深入。 因此,我构建了PaperBot FM来解决这个问题。 它会将一篇研究论文(以及最多两篇支持性论文以提供背景)合成一集播客。目前,播客的平均时长约为30分钟,尽管我还在调整时长。 技术方面: 主要的挑战在于音频。我找不到一个能够有效处理三种不同声音在单一对话流中的TTS服务。为了解决这个问题,我围绕Gemini TTS构建了一个自定义包装器,协调三种不同的“角色”,以保持对话的趣味性。 运行方式: 目前,网站只是一个每日社区信息流。用户提交论文,投票,系统根据获胜者每24小时生成一集播客。这个服务完全免费,所有集数都是公开的。 接下来有什么计划? 我正在评估两个方面的兴趣: - 将其转变为一个可以按需生成播客集的服务(用于解释、内部文档等)。 - 将声音协调功能开放为API,因为找到一个支持超过两个并发声音的服务出乎意料地困难。 希望你喜欢这个项目!如果你对生成自定义播客集或声音生成API感兴趣,请告诉我。
2作者: earsayapp18 天前原帖
经过两年的研究、规划和工程开发,我即将推出 earsay。这是一款旨在提供愉悦使用体验的 iOS 播客应用。它能够在设备上100%检测广告,限制广告网络的追踪,并且不需要任何外部服务或订阅费用。
4作者: roknovosel18 天前原帖
在大多数周五晚上和周末,我和妻子会花30分钟以上的时间在Netflix上滚动浏览,互相否决对方的电影建议。我们的口味交集非常小。她喜欢浪漫喜剧和偶尔的惊悚片,对评分毫不在意。而我则倾向于那些获得好评的作品和超过三小时的史诗电影。最终,我们总是会选择一些我们都不太想看的电影,或者是一些舒适的电视剧。 因此,我创建了movieagent.io来帮助我们。它是一个能够找到你今晚想看的电影的代理。这个代理充当仲裁者,尽力弥合用户之间的差距。整个过程大约需要2-3分钟,具体取决于意见分歧的程度(以及Anthropic的API负载)。 代理会问几个快速问题,然后进行“对决”,向你展示两部电影,并询问哪部电影更能引起你的共鸣。你的选择会揭示代理应该更深入探讨的方向。 最后,用户会收到4-5部电影的推荐,并附有个性化的推荐说明,解释为什么这部电影是今晚的好选择。 虽然有时结果仍然不尽如人意,但确实帮助我们度过了几次精彩的电影之夜。
1作者: andrewtbham18 天前原帖
在过去的六个月里,我通过Vibed编写了这个餐厅和酒吧推荐应用程序。我没有写过一行代码。欢迎反馈。