返回首页
最新
我明白了——大型语言模型(LLMs)确实有一定的价值,但远没有大家(尤其是来自人工智能实验室的人)所宣传的那么高。我不禁觉得,我们几乎已经处于这个泡沫的顶端——但在这里,似乎大多数人并不这样认为……
然而,就在2026年,我们经历了以下事件:
- AI.com以7000万美元的价格出售——Crypto.com的创始人购买它以推出另一个“个人AI代理”平台,但在超级碗广告首秀时迅速崩溃。
- MoltBook热潮——一个Reddit的克隆网站,AI机器人在上面互相对话,充斥着加密骗局和“AI意识”的帖子。超过250,000条机器人的帖子消耗了大量计算资源,究竟有什么实际价值呢?[0]
- OpenClaw——一个“超级开源AI代理”,但安全隐患重重。
- GPT-5.3-Codex和Opus 2.6发布。评论者指出,他们很难找到前一版本无法处理的任务。改进充其量只是增量式的。
我理解大型语言模型确实有合理的应用场景,但炒作与实用性之间的比例似乎完全失衡。
难道我没有看到什么吗?
[0] https://www.technologyreview.com/2026/02/06/1132448/moltbook-was-peak-ai-theater/
我在Tavus从事实时语音/视频人工智能的工作,过去几年我主要关注机器在对话中的反应。<p>一直以来让我感到困扰的是,几乎所有的对话系统仍然将一切简化为文字记录,并丢弃了许多需要在后续处理中使用的信号。一些现有的情感理解模型试图将情感分析和分类为一小部分任意的类别,但它们在实时处理时要么不够快速,要么不够丰富,无法有信心地完成这一任务。<p>因此,我构建了一个多模态感知系统,它为我们提供了一种编码视觉和音频对话信号的方法,并通过将一个小型的语言模型与这些信号对齐,将其翻译成自然语言,使得代理能够“看见”和“听见”你,并且你可以通过与OpenAI兼容的工具架构在实时对话中与其进行交互。<p>它输出关于互动中发生的事情的简短自然语言描述——例如不确定性增加、讽刺、 disengagement(脱离参与)或甚至单次对话中注意力的转移。<p>一些快速规格:
- 每次对话实时运行
- 以约15帧每秒的视频处理及与对话重叠的音频
- 处理细腻的情感,包括耳语与大喊
- 基于合成数据和内部对话数据进行训练<p>欢迎提问或深入讨论架构/权衡问题。<p>更多细节请见:<a href="https://www.tavus.io/post/raven-1-bringing-emotional-intelligence-to-artificial-intelligence">https://www.tavus.io/post/raven-1-bringing-emotional-intelli...</a>
我对供应商拿着SOC 2证书来推销自己感到非常厌倦,仿佛这就能达成交易。很好,你通过了审计——但你不支持单点登录(SSO),我无法从你的平台获取日志,而且你的工程师可以访问我所有的数据。我并不在乎你的SOC 2。是的,你需要这个来证明你不是一个随便的应用程序(其中一些实际上也有SOC 2),但我更关心的是我能否根据我的技术栈和需求来保障你的工具的安全性。请用Traction向我展示你实施了哪些产品安全措施。谢谢。
我开发了一款应用,可以将任何在线食谱转换为可打印的3x5索引卡。
如果你经常在网上做饭,你一定知道这种痛苦:为了找到食材清单,不得不滚动过去一篇关于某人祖母的2000字故事。然后在双手湿滑的情况下试图从手机上读取。
因此,我创建了Tasty A.F. — 只需粘贴一个食谱网址,它就会利用人工智能提取出关键内容,并将其格式化为干净、可打印的卡片。
它的工作原理:
- 粘贴任何食谱网址
- 人工智能抓取食谱并生成简洁的3x5卡片
- 打印出来,贴在冰箱上或卡片上,然后开始烹饪
该应用使用Python/Flask和Anthropic Claude API构建,并托管在Railway上。
一个用于检测和去除文本及结构化数据中个人可识别信息(PII)的Go语言库。
嗨,HN,我是Arsalan,LiveDocs的创始人(<a href="https://livedocs.com">https://livedocs.com</a>)。我们正在构建一个以AI为核心的数据工作空间,让团队能够对真实数据提出问题,并让系统全程规划、执行和维护分析。
四年前,我们曾发布过关于LiveDocs的帖子(<a href="https://news.ycombinator.com/item?id=30735058">https://news.ycombinator.com/item?id=30735058</a>)。那时,LiveDocs是一个无代码的分析工具,用于整合来自Stripe和Google Analytics等工具的指标。它适用于基本报告,但随着时间的推移,我们遇到了用户们同样面临的瓶颈。仪表板在问题简单时很好用,但当问题变得复杂时,笔记本逐渐变成难以维护的杂乱堆。
在过去的几年里,我们几乎完全围绕一个不同的理念重建了LiveDocs。数据工作应该像一个活的系统,而不是静态文档或聊天记录。
如今,LiveDocs是一个反应式的笔记本环境,支持真实的执行引擎。笔记本不是线性的。每个单元格参与一个依赖图,因此当数据或逻辑发生变化时,只有受影响的部分会重新计算。您可以在同一个文档中自由混合SQL、Python、图表、表格和文本,所有内容保持同步。我们在本地使用DuckDB和Polars,当您连接像Snowflake、BigQuery或Postgres这样的数据仓库时,查询会被下推,而不是将数据复制出来。每个结果都是可检查和可重现的。
在这个环境之上,有一个AI代理,但它并不是“与您的数据聊天”。该代理在笔记本内部工作。它可以规划多步分析,编写和调试SQL或Python,为不同任务生成专门的子代理,在终端中运行代码,并在缺乏上下文时浏览文档或网络。因为它在与人类相同的执行图中操作,您可以准确看到它运行的内容,随时进行编辑或接管。
我们还支持画布模式,代理可以为您的分析构建自定义用户界面,而不仅仅是图表。这包括带有控件的表格、比较和与底层数据保持连接的派生视图。当笔记本不是合适的界面时,您可以将其部分内容发布为交互式应用。这些应用更像是轻量级的内部工具,精神上类似于Retool,但基于相同的分析逻辑。
LiveDocs中的一切都是完全实时协作的。多个人可以编辑同一个笔记本,实时查看结果更新,在线评论,并分享文档或应用,而不必暴露原始代码,除非他们愿意。
团队使用LiveDocs来调查不适合清晰仪表板的问题,构建随着时间演变的分析,而无需不断重写,并自动化重复性问题,而不将其变成脆弱的管道。
定价为按需付费,起价为每月15美元,并提供免费层级,方便人们在与我们沟通之前进行试用。您需要注册,因为这需要我们为您提供一个沙箱来运行您的笔记本。这里有一个视频演示:<a href="https://youtu.be/Hl12su9Jn_I" rel="nofollow">https://youtu.be/Hl12su9Jn_I</a>
我们仍在学习这个系统的局限性。在生产数据上运行长时间的代理工作流会暴露出许多尖锐的边缘。我们非常希望听到那些曾经构建或使用过分析系统、笔记本或“与数据聊天”工具并感受到其局限性的人们的反馈。欢迎深入讨论技术细节和经验分享。