2作者: obedvega18 天前原帖
我如何才能获取YC活动的通知,以便参加?
1作者: yaront11118 天前原帖
嗨,HN,我是Cordum的创始人。 我在DevOps和基础设施领域工作了多年(目前在金融科技/安全领域),在开始尝试AI代理时,我注意到了一个令人担忧的模式。大多数“安全”机制依赖于系统提示(“请不要做X”)或代理内部的脆弱Python逻辑。 如果我们将代理视为自主员工,给予它们根权限并希望它们遵循指令,这让我觉得非常不理智。我想要一种方式来强制执行硬性约束,无论LLM(大语言模型)如何“越狱”,都无法覆盖这些约束。 因此,我构建了Cordum。它是一个开源的“安全内核”,位于LLM的意图与实际执行之间。 该架构设计为语言无关: 1. *控制平面(Go/NATS/Redis):* 管理状态和策略。 2. *协议(CAP v2):* 定义作业、步骤和结果的传输格式。 3. *工作者:* 您可以使用Python(通过Pydantic)、Node或Go编写代理,它们都连接到同一个安全网络。 我关注的关键特性: - *“杀开关”:* 能够通过消息总线即时撤销代理的权限,而无需关闭主机服务器。 - *审计日志:* 每个意图和行动都会被记录(在出现问题时至关重要)。 - *政策执行:* 在到达工作者之前,根据元数据(例如,“任何超过50美元的转账需要审核”)阻止某些操作。 现在还处于早期阶段(v0.x),但我很想听听您对架构的看法。单独的控制平面是否过于复杂,还是这正是代理基础设施的发展方向? 代码库:[https://github.com/cordum-io/cordum](https://github.com/cordum-io/cordum) 文档:[如果有文档,请提供链接] 谢谢!
1作者: mohasarc18 天前原帖
嗨,HN, 我是Mo。我目前正在创建一家初创公司,想要在通勤或洗碗时找到一种方式来听取研究论文以获得灵感。 我尝试过使用谷歌的NotebookLM,但输出效果对我来说并不理想。它听起来有点机械,对话太短,而且在技术细节上没有深入。 因此,我构建了PaperBot FM来解决这个问题。 它会将一篇研究论文(以及最多两篇支持性论文以提供背景)合成一集播客。目前,播客的平均时长约为30分钟,尽管我还在调整时长。 技术方面: 主要的挑战在于音频。我找不到一个能够有效处理三种不同声音在单一对话流中的TTS服务。为了解决这个问题,我围绕Gemini TTS构建了一个自定义包装器,协调三种不同的“角色”,以保持对话的趣味性。 运行方式: 目前,网站只是一个每日社区信息流。用户提交论文,投票,系统根据获胜者每24小时生成一集播客。这个服务完全免费,所有集数都是公开的。 接下来有什么计划? 我正在评估两个方面的兴趣: - 将其转变为一个可以按需生成播客集的服务(用于解释、内部文档等)。 - 将声音协调功能开放为API,因为找到一个支持超过两个并发声音的服务出乎意料地困难。 希望你喜欢这个项目!如果你对生成自定义播客集或声音生成API感兴趣,请告诉我。
2作者: earsayapp18 天前原帖
经过两年的研究、规划和工程开发,我即将推出 earsay。这是一款旨在提供愉悦使用体验的 iOS 播客应用。它能够在设备上100%检测广告,限制广告网络的追踪,并且不需要任何外部服务或订阅费用。