1作者: Ingver8 个月前原帖
嘿,HN, 我正在构建一个名为 Memoria 的实验性 AI 代理记忆系统。它是一个轻量级的加密后端,通过“情感强度”对记忆进行排序。 核心功能: - 大约 180 MB 的占用空间,无需外部服务或依赖 - 使用 SQLCipher 进行端到端加密 - 向量搜索(余弦相似度,仅支持 NumPy) - 基于情感的强化和遗忘 - 带缓存层的异步 Python API - 持续集成:pytest、ruff、mypy、通过 Codecov 进行覆盖率检测 无需 Pinecone,无需 Redis,无需云基础设施。 GitHub 仓库:[https://github.com/Ingver1/memoria](https://github.com/Ingver1/memoria) 我非常欢迎反馈、想法或批评。欢迎贡献者!
1作者: seanobannon8 个月前原帖
构建了一个简单的棋类机器人,它结合了 o4-mini 和基于 Stockfish 引擎分析的推理。它清晰地解释棋步,建议战术,并帮助你理解为什么某些棋步是好的(或不好的)。<p>在这里试用:<a href="https://www.chesscoachgpt.com/" rel="nofollow">https://www.chesscoachgpt.com/</a><p>欢迎反馈。
1作者: venuur8 个月前原帖
嗨,HN,我是卡尔·莫里斯。在亚马逊、京东和Stitch Fix担任数据科学家十年后,我决定创建自己的产品。这段旅程最终促成了Callio的诞生,一款用于iOS的实时AI通话助手。我与另外两位合作伙伴一起建立我的初创公司。 经过大约9个月的反复试验,我们终于找到了正确的想法,随后又花了3个月时间构建Callio的第一个版本。我非常希望能听到你们的反馈! # Callio的功能是什么? Callio是一款VoIP软电话,配备AI助手,能够实时监听您的通话并建议接下来该说什么。我们相信它对销售电话特别有帮助,目前我们的市场定位也正是针对这一群体。 您可以通过以下方式自定义AI建议: - 上传文档(例如产品说明书、定价、异议处理指南) - 设置您的销售目标和常见问答 您还可以在真实通话之前,通过模拟通话进行练习。AI会利用您的材料生成相关建议,您可以逐字使用。 # 它是如何工作的? 将大型语言模型(LLM)实时连接到通话中是一个挑战。我们利用了许多现成的技术,但将它们整合在一起却相当困难,需要一些深思熟虑的努力。 - 通过Twilio的WebRTC,利用其React Native库实现VOIP通话体验。 - WebSockets使我们能够将音频流传输到后端,并将建议传送到移动客户端。 - LLM会获取实时转录,并在通话进行时返回建议。原则上,我们对LLM提供商持中立态度,尽管我们最初是围绕OpenAI的API构建的。 - 我们建立了增量推荐工作流,以确保AI建议的低延迟,尽管REST API存在延迟。 我们的架构设计上是精简的: - React Native移动应用 - 媒体服务器 + 数据/信号服务器 - FastAPI(最初),但我们将部分功能迁移到Sanic以提高性能 我们当然可以做得更好。我们的后端数据库和一些数据API在扩展性上不够理想。现在我们已经在APP Store上线,我们正在仔细重建,以便能够扩展。实现实时功能(尤其是异步和延迟)是一个巨大的学习曲线。如果您感兴趣,我很乐意深入探讨。 # 接下来是什么? 应用程序已经上线,我们正在进行市场推广以吸引更多用户。我们目前的重点是: - 超越最初的测试用户 - 提升推荐质量和应用内体验 - 为非技术用户构建更好的入门指导 我非常希望听到您的想法或问题,特别是在架构、用户体验或分发策略方面。该应用确实需要注册,我知道这使得您尝试起来有些困难。幸运的是,我们提供了免费试用,您可以使用。 感谢您提前提供的所有反馈!
1作者: peturgeorgievv8 个月前原帖
我讨厌使用那些糟糕的代码、UI/UX或后端软件,所以我决定自己动手构建一个。<p>这花了我一些时间,因为我从零开始搭建,使用了合适的后端解决方案——NestJS,结合Redis、Kafka进行消息传递,以及更多工具来确保系统的稳定性。<p>我的着陆页使用Next.js进行服务器端渲染(SSR)和搜索引擎优化(SEO)。<p>我觉得这个工具正在成为一个能够与Buffer、Hootsuite等巨头竞争的最佳工具。现在已经有一些付费客户,他们对此非常满意。<p>我正在构建报告功能、更多集成和特性,我认为这非常出色,因为它运行顺畅且速度很快。
1作者: fredthedeve8 个月前原帖
你的RAG模型是不是出现了幻觉?也许问题不在于大型语言模型(LLM),而是在检索阶段。 我创建了RAGsplain(ragsplain.com)来帮助调试这个问题。你可以上传文档(PDF、音频、YouTube链接),选择检索方法(语义、关键词或混合),并查看传递给模型的确切上下文片段——包括匹配分数。 结果发现:当检索效果不佳时,即使是最好的模型也无法正常思考。 这个工具是开放且免费的。希望能收到正在构建RAG管道的朋友们的反馈。