1作者: thenextechtrade大约 1 个月前原帖
嗨,HN, 我一直是 openai/openai-fm 仓库的粉丝,但注意到对于许多人来说,入门门槛(命令行界面、环境设置、API 密钥)较高。因此,我构建了 OpenAI FM,旨在提供一个“即用型”的网页版本——无需部署。 当前状态与商业模式:该项目目前正在积极开发中。由于大规模运行高质量的 AI 推理会产生显著的服务器和 API 成本,我实施了一个小额付费墙,以保持项目作为独立开发者的可持续性。 然而,我希望每个人都能测试其质量,因此所有用户均可享受免费试用。 路线图与邀请: 即将推出:我目前正在构建一个文本转视频的管道,将这些声音转化为同步的视频内容。 我们需要您的反馈:由于我们处于早期阶段,我非常希望听到您需要哪些功能。更多的声音?API 访问?特定的导出格式?请在这里留下您的建议,我会积极努力整合这些意见。 我特别感兴趣的是关于移动用户体验和音频延迟的反馈。期待您的想法!
1作者: MohskiBroskiAI大约 1 个月前原帖
Remember Me AI推出了连贯状态网络协议(CSNP)——一种在数学上最优的分布式人工智能记忆方法,具有以下优势: 与传统向量数据库相比,成本降低40倍。 Wasserstein最优记忆一致性通过严格的状态一致性保证了零幻觉特性,并且证明了长期记忆保持的稳定性。 问题: 当前的人工智能记忆系统(如RAG、向量数据库)存在以下问题: - 记忆漂移:随着时间推移,背景信息退化 - 幻觉:检索到的记忆与原始背景不匹配 - 成本激增:嵌入存储/检索的扩展性较差 - 一致性丧失:缺乏数学上的一致性保证 解决方案: CSNP将人工智能记忆视为一种受量子启发的连贯状态,其数学保证源自最优传输理论。
2作者: wasiyc大约 1 个月前原帖
嘿,HN, 我们最初是为健身中心开发垂直语音代理。在与客户的交流中,有时会提到在通话中收款(通过短信链接、按键或语音)这个想法,认为这可能会很有用。 我们想了解人们在实践中是如何处理这个问题的。 如果你曾经参与过生产语音系统或支付系统,我有几个问题: 1) 你们是否实现过通话中的支付流程? 2) 你们遇到了哪些权衡或问题(合规性、可靠性等)? 3) 这是客户实际使用的功能,还是大多数人都忽略了? 我们还注意到一家YC F24的公司(Protegee)曾探索过这个领域,但后来进行了转型,这让我们好奇人们从那一代尝试中得到了哪些教训。 感谢任何真实的经验或建议。我们希望向那些已经成功实施这一功能的人学习。