返回首页
最新
嘿,HN,
我正在构建一个名为 Memoria 的实验性 AI 代理记忆系统。它是一个轻量级的加密后端,通过“情感强度”对记忆进行排序。
核心功能:
- 大约 180 MB 的占用空间,无需外部服务或依赖
- 使用 SQLCipher 进行端到端加密
- 向量搜索(余弦相似度,仅支持 NumPy)
- 基于情感的强化和遗忘
- 带缓存层的异步 Python API
- 持续集成:pytest、ruff、mypy、通过 Codecov 进行覆盖率检测
无需 Pinecone,无需 Redis,无需云基础设施。
GitHub 仓库:[https://github.com/Ingver1/memoria](https://github.com/Ingver1/memoria)
我非常欢迎反馈、想法或批评。欢迎贡献者!
听到了很多轶事数据,但希望能得到一些统计数据。
构建了一个简单的棋类机器人,它结合了 o4-mini 和基于 Stockfish 引擎分析的推理。它清晰地解释棋步,建议战术,并帮助你理解为什么某些棋步是好的(或不好的)。<p>在这里试用:<a href="https://www.chesscoachgpt.com/" rel="nofollow">https://www.chesscoachgpt.com/</a><p>欢迎反馈。
嗨,HN,我是卡尔·莫里斯。在亚马逊、京东和Stitch Fix担任数据科学家十年后,我决定创建自己的产品。这段旅程最终促成了Callio的诞生,一款用于iOS的实时AI通话助手。我与另外两位合作伙伴一起建立我的初创公司。
经过大约9个月的反复试验,我们终于找到了正确的想法,随后又花了3个月时间构建Callio的第一个版本。我非常希望能听到你们的反馈!
# Callio的功能是什么?
Callio是一款VoIP软电话,配备AI助手,能够实时监听您的通话并建议接下来该说什么。我们相信它对销售电话特别有帮助,目前我们的市场定位也正是针对这一群体。
您可以通过以下方式自定义AI建议:
- 上传文档(例如产品说明书、定价、异议处理指南)
- 设置您的销售目标和常见问答
您还可以在真实通话之前,通过模拟通话进行练习。AI会利用您的材料生成相关建议,您可以逐字使用。
# 它是如何工作的?
将大型语言模型(LLM)实时连接到通话中是一个挑战。我们利用了许多现成的技术,但将它们整合在一起却相当困难,需要一些深思熟虑的努力。
- 通过Twilio的WebRTC,利用其React Native库实现VOIP通话体验。
- WebSockets使我们能够将音频流传输到后端,并将建议传送到移动客户端。
- LLM会获取实时转录,并在通话进行时返回建议。原则上,我们对LLM提供商持中立态度,尽管我们最初是围绕OpenAI的API构建的。
- 我们建立了增量推荐工作流,以确保AI建议的低延迟,尽管REST API存在延迟。
我们的架构设计上是精简的:
- React Native移动应用
- 媒体服务器 + 数据/信号服务器
- FastAPI(最初),但我们将部分功能迁移到Sanic以提高性能
我们当然可以做得更好。我们的后端数据库和一些数据API在扩展性上不够理想。现在我们已经在APP Store上线,我们正在仔细重建,以便能够扩展。实现实时功能(尤其是异步和延迟)是一个巨大的学习曲线。如果您感兴趣,我很乐意深入探讨。
# 接下来是什么?
应用程序已经上线,我们正在进行市场推广以吸引更多用户。我们目前的重点是:
- 超越最初的测试用户
- 提升推荐质量和应用内体验
- 为非技术用户构建更好的入门指导
我非常希望听到您的想法或问题,特别是在架构、用户体验或分发策略方面。该应用确实需要注册,我知道这使得您尝试起来有些困难。幸运的是,我们提供了免费试用,您可以使用。
感谢您提前提供的所有反馈!
我非常希望能像几年前那样享受HN,作为一个我可以发现那些我原本不会接触到的事物的地方。<p>然而,越来越多的人工智能/大型语言模型主导了这个网站,使我对它的吸引力大大减弱。
我讨厌使用那些糟糕的代码、UI/UX或后端软件,所以我决定自己动手构建一个。<p>这花了我一些时间,因为我从零开始搭建,使用了合适的后端解决方案——NestJS,结合Redis、Kafka进行消息传递,以及更多工具来确保系统的稳定性。<p>我的着陆页使用Next.js进行服务器端渲染(SSR)和搜索引擎优化(SEO)。<p>我觉得这个工具正在成为一个能够与Buffer、Hootsuite等巨头竞争的最佳工具。现在已经有一些付费客户,他们对此非常满意。<p>我正在构建报告功能、更多集成和特性,我认为这非常出色,因为它运行顺畅且速度很快。
你的RAG模型是不是出现了幻觉?也许问题不在于大型语言模型(LLM),而是在检索阶段。
我创建了RAGsplain(ragsplain.com)来帮助调试这个问题。你可以上传文档(PDF、音频、YouTube链接),选择检索方法(语义、关键词或混合),并查看传递给模型的确切上下文片段——包括匹配分数。
结果发现:当检索效果不佳时,即使是最好的模型也无法正常思考。
这个工具是开放且免费的。希望能收到正在构建RAG管道的朋友们的反馈。