最新

通往WWDC 2026之路：什么是开发者？

1 分•作者: mistersquid•25 天前•原帖

3 分•作者: acoye•25 天前•原帖

34 分•作者: kkm•25 天前•原帖

展示HN：在Pico 2 W上使用Rust实现的位带式10BASE-T以太网和Wi-Fi路由器

5 分•作者: mdeeds•25 天前•原帖

在树莓派 Pico 2 W 上实现了软件 10BASE-T 以太网（使用 PIO 进行 TX 和 RX 的位操作）和无线路由器。该系统在 RP2350 的 RISC-V 核心上运行 cyw43 和一个异步执行器，使用廉价且简约的外部硬件（仅需一个磁性插座和 ISL3177E RS-485 收发器）。我想看看在这个便宜的基于 MCU 的 Wi-Fi 路由器构思上能走多远，并进一步了解在 RP2350 和 RISC-V 上使用 Rust 的相关知识。虽然这绝对不是一个适合家庭使用的路由器选择，但对于低速率的物联网流量来说可能会有一些用处。

展示HN：我在32分钟内嵌入了6.85亿条公共文本（使用8个A100、Rust和TensorRT）

4 分•作者: ddayanov•25 天前•原帖

关于我如何构建批量嵌入引擎 IgniteMS 的简要说明。整个系统作为一个进程运行，使用 Rust 语言，负责读取输入、分词、打包批次，并保持队列满载。推理由 TensorRT 处理，Python 仅作为包装层。我之所以这样构建，是因为当使用超过几张 GPU 时，GPU 不再是瓶颈。CPU 不能够足够快地为它们提供数据。一张 A100 的处理速度快于 Python 的分词和数据输入速度，因此 GPU 往往处于空闲状态，等待工作。我的大部分时间都花在了优化这一点上。在 8 张 GPU 的情况下，这基本上就是整个挑战。关于成本。我在一个临时的 p4d 实例（8 张 A100 40GB）上运行了一个 20 亿消息的大型任务。经过过滤和去重，我得到了 6.85 亿条原始文本。使用我的新引擎，整个生产过程大约在半小时内完成。之前我为这些任务使用的是按需实例，现在切换到了临时实例。如果 AWS 收回了实例，我只需重新运行。半小时的运行成本大约为 7 美元。而且至少目前来说，临时实例比按需实例更容易获取。公开警告：它仅支持批处理，并且仅适用于 NVIDIA。你可以将其作为 Docker 镜像或本地运行。我在生产运行中使用了一些优化。在默认设置下，如果你在你的 p4d 实例上运行基准测试脚本，可以预期看到约 25 万条消息/秒的处理速度。 [基准测试文档链接](https://github.com/Artain-AI/ignite-ms/blob/main/BENCHMARKING.md) v1.1.0 版本增加了 TensorRT 11 和 60 个模型，其中 23 个在 1x 和 4x A100 上进行了测试。很高兴分享更多细节。

KVarN：华为推出的原生 vLLM KV-cache 量化后端

11 分•作者: theanonymousone•25 天前•原帖

问HN：为什么大型语言模型（LLMs）仍然很难查询NoSQL数据库？

3 分•作者: cammasmith•25 天前•原帖

大型语言模型（LLMs）在SQL方面表现出色。SQL精确、表达能力强且没有歧义。如果将MCP服务器连接到Postgres，代理可以直接查询它。对于NoSQL数据库来说情况就不一样了，考虑到有这么多人使用NoSQL数据库，我对这一话题讨论不多感到惊讶。问题的一部分在于多样性。MongoDB、DynamoDB、Cassandra、Redis和Neo4j都有不同的查询模型。没有一个共享的接口供LLM进行推理。因此，代理不仅要编写查询，还需要编写代码：SDK调用、手动聚合、分页逻辑。这使得过程变得更加复杂，审查起来也更困难，并且在处理任何非平凡的任务时很快就会出错。我们在使用DynamoDB时遇到了这个问题，最终构建了自己的解决方案。如果有人感兴趣，我在这里写了相关内容：https://dynamosql.hashnode.dev/why-llm-agents-still-can-t-query-nosql-databases。但我更想知道其他人是如何处理这个问题的。为什么这仍然是一个未解决的问题呢？

展示HN：178K参数的神经网络，赢得了Poke（rogue）类游戏

1 分•作者: farcaster•25 天前•原帖

在经历了数百场游戏的失败后，我意识到状态空间足够小，也许可以通过使用PPO训练一个小型神经网络，使其能够相对稳定地获胜。经过一些奖励工程的调整，它成功了！经过PPO训练的神经网络能够击败9%的所有对局，甚至一路打到精英四人组！

保持排水准备状态

1 分•作者: emerongi•25 天前•原帖

欧洲议会议员呼吁欧盟委员会采取行动，解决欧洲刑警组织的影子IT问题。

1 分•作者: miohtama•25 天前•原帖

头部空间

1 分•作者: tashadir•25 天前•原帖

Headroom 是一款菜单栏应用程序，能够悄悄优化 Claude Code 的输入，通过减少提示冗余、去除模板内容以及压缩文档，而不改变您的工作方式。这使得您在已经支付的 Claude 计划上，能够使用约两倍的 Claude Code。与竞争对手不同，Headroom 应用程序完全开源，并且免费使用，非常适合希望最大化其 AI 编码助手投资的开发者和团队。链接： https://extraheadroom.com/ https://github.com/gglucass/headroom-desktop https://x.com/garmdotcom https://www.instagram.com/extraheadroom/ https://youtu.be/2NPBaqRGcOs

科技行业在本周的初选中遭遇了“重创”。这可能预示着未来还会有更多类似情况发生。

1 分•作者: JumpCrisscross•25 天前•原帖

展示 HN：我的 Rust SIMD 代码默默地以标量方式运行

1 分•作者: tolugenius•25 天前•原帖

我利用学习伊恩结所获得的额外时间做了些什么。

1 分•作者: danielskogly•25 天前•原帖

维基百科与人工智能的竞赛

1 分•作者: yarv•25 天前•原帖

妄想即服务

3 分•作者: hn_acker•25 天前•原帖

一种基于DNA的档案存储系统 [pdf]

1 分•作者: cats_and_dogs•25 天前•原帖

展示HN：Boxes.dev：告别本地主机；在云端运行Claude Code和Codex

19 分•作者: nab•25 天前•原帖

嗨，HN，我们是Nick和Drew，我们正在构建boxes.dev——首个纯云端的自主开发环境（ADE），为每个Codex和Claude Code代理提供独立的云计算机。我们是两名工程师，之前共同创建了Gem（联合创始人/首席技术官及首位员工），在过去的一年里，我们几乎完全依赖Codex和Claude Code进行编码。这对我们的编码方式带来了巨大的变化，看到模型不断进步让人兴奋，但我们最终意识到在本地开发的方式限制了我们： - Git工作树的设置和使用繁琐，难以并行化工作。 - 现在是2026年，但大家仍然在用打开的笔记本电脑或通过SSH连接车库里的Mac mini，以确保他们的代理不会停止工作。 - 尽管编程现在就像发短信一样简单，但移动端仍然被视为附带功能。当多个并行代理通过在本地运行完整应用程序来测试自己的工作时，我们开始遇到资源限制。我们尝试了不同的产品，但没有找到能够解决我们所有痛点的解决方案，因此我们决定转变思路，自己构建我们想要的ADE。 Boxes.dev是一个桌面和移动应用，允许你在远程计算上运行Claude Code、Codex（使用你的订阅！）以及你正在构建的完整开发环境。它类似于Conductor或Codex桌面应用，但一切都在云端。我们使用编码代理扫描你的本地开发设置并将其移植到云端。然后每个Claude Code/Codex线程都从完整设置的快照开始，拥有自己的文件系统和计算资源。再也不需要Git工作树，也不再需要打开的笔记本电脑，你的编码代理可以真正进行端到端的测试，因为它们可以在隔离环境中运行你的完整应用。我们已经将Claude Code和Codex的用户体验进行了镜像，以便让高级用户感到自然，同时还提供了功能齐全的移动应用（没有交接或远程控制），以及定时自动化和Slack集成。我们显然有偏见，但我们已经用boxes.dev构建了boxes.dev几个月，坦白说，这真的改变了游戏规则。一旦你意识到本地开发对你的限制，就很难再回去；根据早期测试者的反馈，我们越来越确信云端是自主编码的未来。我们希望你们能亲自体验一下！非常欢迎任何反馈，并乐意在这个讨论中回答任何问题。

展示 HN：AgentKitten：一个与供应商无关的 AI 代理的 Swift 包

8 分•作者: fbeeper•25 天前•原帖

在2026年4月，风能和太阳能的发电量首次超过了全球天然气发电量。

29 分•作者: speckx•25 天前•原帖

上一页 1...375 376 377 378 379...6879 下一页