最新

为人类和人工智能提供最快的前端工具。

2 分•作者: cpojer•3 个月前•原帖

人工智能让每个测试都通过了，但代码仍然是错误的。

15 分•作者: ramijames•3 个月前•原帖

为什么OpenAI购买“品味”而不是知识产权（以及知识引导的崛起）

1 分•作者: thebillkidy•3 个月前•原帖

Kubernetes 故障案例

2 分•作者: redbell•3 个月前•原帖

代理37

1 分•作者: bellamoon544•3 个月前•原帖

请问HN：当多步骤AI工作流程的输出错误时，您如何进行调试？

1 分•作者: terryjiang2020•3 个月前•原帖

我一直在构建多步骤的人工智能工作流，涉及多个智能体（规划、推理、工具使用等），有时会遇到最终输出不正确的情况，尽管技术上没有任何故障。没有运行时错误——只是结果错误。主要挑战在于找出问题出在哪里。问题可能出现在早期的推理步骤、步骤之间的上下文传递，或者是一个微妙的错误在系统中传播。等我看到最终输出时，哪个步骤导致了问题并不明显。我一直在使用Langfuse进行追踪，这有助于捕捉输入和输出，但在实际操作中，我仍然需要逐步手动检查每个步骤以诊断问题，这很快就让人感到疲惫。我很好奇其他人是如何处理这个问题的。有没有更好的方法来构建或工具化这些工作流，以便更容易定位故障？有没有什么模式、工具或技术对你们有效？

展示HN：我创建了iHateCSV.com，专为那些讨厌电子表格崩溃的人而设。

1 分•作者: vinserello•3 个月前•原帖

支持强硬移民政策的古巴裔美国选民

1 分•作者: poojagill•3 个月前•原帖

支持强硬移民政策的古巴裔美国选民现在正目睹家人被拘留。

阿布扎比金融峰会的数据泄露暴露了政治家和商业领袖的信息。

1 分•作者: JumpCrisscross•3 个月前•原帖

OpenClaw在Go语言中进行了重构，能够在10美元的硬件上运行。

1 分•作者: Nazzareno•3 个月前•原帖

鲁比奥对欧尔班的热情言辞加深了欧盟对美国寻求欧洲不团结的担忧。

1 分•作者: robtherobber•3 个月前•原帖

VVTerm – 基于Ghostty的iOS、iPad和macOS SSH客户端

1 分•作者: wiedymi•3 个月前•原帖

停止提示。让人工智能来面试你，以便制定规格。

1 分•作者: enha•3 个月前•原帖

展示HN：针对GPU加速SQL分析的Apple Silicon统一内存基准测试

1 分•作者: sadopc•3 个月前•原帖

展示HN：Jarvish – 一款受Marvel中J.A.R.V.I.S.启发的新型AI集成外壳

2 分•作者: tominaga-h•3 个月前•原帖

Jarvish 是一个下一代 AI 集成的命令行工具，使用 Rust 编写，灵感来源于漫威《钢铁侠》中的 J.A.R.V.I.S.。它将 AI 智能原生嵌入到您的日常命令行体验中——不再需要将内容复制粘贴到浏览器中。只需询问 Jarvish。

原生 FreeBSD Kerberos/LDAP 与 FreeIPA/IDM

13 分•作者: vermaden•3 个月前•原帖

朝日Linux进展报告：Linux 6.19

33 分•作者: mkurz•3 个月前•原帖

一款3000W水冷电源（采用GAN和SiC技术）[视频]

1 分•作者: geekuillaume•3 个月前•原帖

Linus T 向《注册》杂志讲述了他是如何将 Linux 的独奏表演变成全球性的即兴演奏会的。

1 分•作者: jjgreen•3 个月前•原帖

展示HN：LedgerSync – 一种用于AI编程的跨代理共享内存协议

1 分•作者: abu_syed•3 个月前•原帖

我使用多个人工智能编码助手（Claude、Cursor、Codex），每次切换时都失去了产品的上下文。更不用说，这些助手虽然写出的代码在技术上是正确的，但有时却违反了产品的设计理念。我构建了强迫学生进行推理的人工智能辅导工具，其中一个助手甚至添加了一个“跳过推理”的按钮，真是让人无奈。LedgerSync 是一种基于文件的协议，它将助手的决策与设计理念文档相结合，并在工具之间共享上下文。无需服务器，无需账户——只需文件供你的助手读取。

上一页 1...1245 1246 1247 1248 1249...6155 下一页