返回首页
最新
嗨,HN,
我是 Pushpinder,我创建了 Docsingest([https://docsingest.com](https://docsingest.com)),旨在解决在为 LLM 工作流(如 RAG 或微调)准备在线开发者文档时常见的痛点。
抓取开发者文档网页总是很麻烦——你常常会发现导航菜单、页脚、侧边栏,甚至广告混杂在核心内容中。更糟糕的是,提取代码块并保留文档的结构(标题、列表、表格)是非常具有挑战性的,手动清理也十分繁琐。
受到 [GitIngest](https://gitingest.com) 等工具的启发,这些工具有效地处理代码仓库,我希望构建一个类似的工具,专注于直接从网络获取开发文档。Docsingest 接受一个 URL 作为输入,并:
1. *隔离主要内容:* 它智能地去除不需要的样板内容(如页眉、页脚和侧边栏)。
2. *保留丰富的格式:* 它保留代码格式、正确的标题层级、列表和表格,以确保 Markdown 输出结构清晰且适合 LLM。
3. *处理 JS 渲染页面:* 为了准确捕捉现代网站的内容,我们使用无头浏览器(由 [Browserless](https://account.browserless.io) 提供支持)在提取之前渲染 JavaScript。
我在与那些无法生成干净、可用 Markdown 的通用抓取工具斗争了太久后才构建了这个工具。使用 Docsingest,你可以快速将杂乱的开发者文档网页转换为干净、结构化的格式,以优化 LLM 的摄取。
我期待来自社区的任何反馈。
感谢你的关注!
嗨,HN,
我们正在构建一个轻量级工具,帮助您了解在多云基础设施中运行的内容及其成本。
它提供了一个清晰的仪表板,展示资源(虚拟机、数据库、容器、网络等)和成本明细。
我们之所以开发这个工具,是因为在不同服务提供商之间管理非常混乱——工具分散、视图碎片化,而且没有简单的方法可以在不切换标签的情况下查看所有内容。
这只是我们的最小可行产品(MVP)——它是免费的,设置快速,并且注重清晰而非复杂。
如果您正在处理云资源分散的问题,或者希望在不同环境中获得更好的可见性,乐意分享链接。期待您的反馈!
谢谢!
这个项目最初是为了在紧急情况下或没有互联网的地区,提供一个易于运行的临时论坛/留言板。我在一台旧路由器上运行它,该路由器使用ddwrt,并且没有连接到互联网。
它仍然是这样,但我添加了一个可选功能,可以从其他实例中提取帖子,我认为这创造了一些有趣的分布式使用案例。将帖子分发到其他实例可以克服仅在内存中运行的一些限制。
嗨,HN,我是Sid。我开发了Browserable,这是一个开源且可自托管的JavaScript库(MIT许可证),用于构建能够执行网络任务、跟踪状态和获取结果的代理:<a href="https://github.com/browserable/browserable">https://github.com/browserable/browserable</a>。
它允许你构建能够浏览网站、填写表单和提取信息的代理。目前在Web Voyager基准测试中得分为90.4%。
使用这个库,你可以:
- 通过一个命令在本地机器上运行浏览器代理套件 - npx browserable。
- 通过REST API/SDK集成到现有代码中。
- 自托管浏览器代理,并在不依赖于任何单一浏览器、浏览器基础设施或大型语言模型提供者的情况下进行扩展。
它配备了一个用户界面来运行任务,以及一个管理界面来追踪、跟踪和调试大型语言模型调用(及其成本)。支持多个浏览器提供者(Steel、Hyperbrowser、Browserbase)和并发限制。
我们构建Browserable是因为我们喜欢为我们的B2B SaaS初创公司构建AI代理来自动化任务,但我们对设置和维护可靠的自动化过程感到沮丧,即使是简单的任务,因为基础工作并不存在。我们不得不与多个浏览器提供者集成,面临各种并发限制,以及与多个大型语言模型提供者集成,面临各种速率限制,并且没有简单的方法将所有日志关联到单个任务,以分析实现的准确性、延迟和成本。
我们希望能够简化构建、测试和改进代理的过程,而不必从头开始编写所有基础设施。
我们非常想知道你正在构建什么,以及这个库是否对你有用,或者我们如何能让它对你更有用!
嗨,HN。
几个月前,我意识到我还在为三款超过一年没有使用的工具付费。更糟糕的是,我根本不知道我的免费试用期何时结束,邮箱里满是随机的发票。
于是我创建了 Subly——一个简单的工具,用于手动跟踪所有订阅、试用期、费用和发票。
不需要银行同步
不需要扫描邮件
只需一个干净的仪表板,便于全面掌控
安德烈
我正在开发一款习惯追踪应用,具有社区驱动的功能,如挑战和排行榜。我想知道在社交习惯追踪器中,您认为哪些功能会对您有帮助,或者哪些功能会让您感到烦恼。什么样的设计会让您愿意坚持使用它?<p>它的早期版本在Play商店中名为Habithook。