返回首页
最新
我们构建了 Calljmp——一个用于以 TypeScript 编写的代理类工作流的托管后端/运行时环境。
它的重点包括:
– 持久状态和长时间运行的执行
– 重试、分支以及暂停/恢复
– 可观察性(日志、跟踪、成本)
– 人工审批流程
在 DevHunt 上发布: [https://devhunt.org/tool/calljmp](https://devhunt.org/tool/calljmp)
欢迎 HN 社区的反馈或提问。
嗨,HN,
我是Adithya,一名来自印度的22岁研究员。我在构建AI管道时,处理了许多文档处理模型,但我遇到了一个反复出现的问题:每个模型都有自己的推理代码、预处理步骤和输出格式。更换模型或测试新模型意味着每次都要重写大量的样板代码。
因此,我构建了Omnidocs——一个开源库,通过简单统一的API运行文档处理模型,采用以视觉为先的方式来理解文档。
主要特点:
> 选择一个任务和模型,通过一个接口进行推理
> 支持常见的文档任务:文本提取、OCR、表格提取、布局分析和结构化提取等
> 开箱即用支持16个以上的模型(未来会有更多集成)
> 可以在Mac或GPU上本地运行(支持MLX和vLLM后端)
> 与支持开放响应API规范的VLM API(如GPT、Claude、Gemini等)兼容
> 旨在快速构建和测试文档处理管道
这帮助我更快地原型化文档工作流程,并轻松比较模型。
我非常希望能收到关于API设计、开发者体验以及哪些集成会使其更有用的反馈。
代码库: [https://github.com/adithya-s-k/omnidocs](https://github.com/adithya-s-k/omnidocs)
我正在将Yara-x规则引擎集成到我的C#十六进制编辑器中,致力于最大化集成的性能和效率。我想请教一下您的意见。我个人做出这个决定是为了通过添加Yara-x支持来扩展我的十六进制编辑器的功能。这使我能够更详细地在二进制文件中搜索签名。我认为查看整个字节网格可以帮助进行恶意软件研究。
我使用内存映射文件实现了这一点。同时,我将扫描方法分为不同的模式:小文件会完全映射,而大文件则以16MB的块进行扫描,并加上64KB的小覆盖,以防止出现签名一半在一个块中、一半在另一个块中的情况。我还对大文件进行了更智能的内存管理,以提高性能。文档在自述文件中,但简而言之,这是一个不会给C#的垃圾回收器带来负担的实现,并且能够处理不安全的指针和原始内存地址。重要的是,我现在有了防止不良规则的保护,例如,搜索任何字节的规则,这会使扫描器过载。这类规则将无法工作,扫描器会停止扫描,以避免因错误而崩溃。
我现在不能说这个工具会比其他工具更好,因为它目前还在开发中,我仍然有改进的空间,但听听大家的意见或接受其他人的改进建议会很不错。
(带有Yarax的本地版本在当前版本中尚不可用,但源代码是开放的,您可以自行编译或阅读。)
嗨,HN,
我构建了 well-net: [https://github.com/remoon-net/well](https://github.com/remoon-net/well)
想象一下 tsnet,但没有 Tailscale 或任何中央服务器。它是为了安全的朋友网络——聊天、小型游戏、私有服务。
现有系统在细微之处存在问题:失去你的域名 → 失去你的身份和联系人。Delta Chat 和 Mastodon 显示了这个问题。我只想要一个不需要中央协调的解决方案。
每个节点通过其 MAC 地址使用 EUI-64 获取一个稳定的 IPv6 地址,范围是 2001:00ff::/32。真实的 MAC 地址 → 没有冲突,不需要中央服务器。NAT 仅用于避免覆盖地址冲突。
技术:WireGuard + WebRTC → 在浏览器中运行。一旦 WebRTC DataChannel 在 Service Workers 中工作,私有服务就可以直接从网络访问。
计划:使用 Delta Chat 进行最小的基于邮件的聊天,采用类似 remoon@[2001:ff::1] 的 IP 字面地址 → 无需 DNS 的身份。
该项目仍在实验阶段。
你会将其用于小型朋友网络吗?
嘿,HN,
我们创建了 Sgai 来尝试一种不同的 AI 辅助开发模型。
与逐步提示不同,您在 GOAL.md 中定义一个结果(应该构建什么,而不是如何构建),然后 Sgai 会运行一组协调的 AI 代理来执行它。
- 它将目标分解为一个角色有向无环图(DAG)(开发者 → 审核者 → 安全分析师等)。
- 在需要时会提出澄清问题。
- 它编写代码、运行测试并进行迭代。
- 完成门(例如,make test)决定何时真正完成。
所有操作都在您的代码库本地运行。还有一个网页仪表板,显示代理图的实时执行情况。没有任何内容会自动推送到 GitHub。
我们在内部用于原型设计小应用和内部工具。虽然仍处于早期阶段,某些地方还比较粗糙,但功能足够分享。
演示(4 分钟): [https://youtu.be/NYmjhwLUg8Q](https://youtu.be/NYmjhwLUg8Q)
GitHub: [https://github.com/sandgardenhq/sgai](https://github.com/sandgardenhq/sgai)
开源(Go)。可以通过 opencode 与 Anthropic、OpenAI 或本地模型一起使用。
我很好奇大家对基于 DAG 的多代理编码工作流的看法。这里有人尝试过类似的方法吗?