返回首页
最新
相关链接:<a href="https://xcancel.com/vmfunc/status/2003292986650853825" rel="nofollow">https://xcancel.com/vmfunc/status/2003292986650853825</a><p><a href="https://old.reddit.com/r/law/comments/1ptlms6/some_epstein_files_can_be_unredacted/" rel="nofollow">https://old.reddit.com/r/law/comments/1ptlms6/some_epstein_files_can_be_unredacted/</a><p><a href="https://krassencast.com/p/breaking-we-just-unredacted-the-epstein" rel="nofollow">https://krassencast.com/p/breaking-we-just-unredacted-the-epstein</a>
嗨,HN,
和很多人一样,我对发布的爱泼斯坦/麦克斯韦法庭文件感到沮丧,因为它们大多数是没有文本层的扫描图像(PDF),这使得无法进行Ctrl+F搜索或程序化分析。
我使用Python、Tesseract和OpenSearch构建了一个处理流程来解决这个问题。
网站: [https://epsteinfilez.com](https://epsteinfilez.com)
技术栈:
- 数据处理:使用ocrmypdf(Tesseract)的Python工作进程对原始文件进行并行OCR处理。
- 搜索:使用OpenSearch对提取的文本进行索引。
- 前端:使用Next.js(SSR)构建用户界面。
- 基础设施:自托管的Docker集群。
功能:
- 在大约15,000页上实现亚秒级全文搜索。
- 在PDF页面上直接高亮搜索词。
- 深度链接到特定页面/文档。
这是一款透明度工具,而非政治工具。我希望让原始的主要来源对研究人员和记者可访问。
欢迎对搜索相关性或索引流程提供反馈!
我曾经为一个每月收入为零的副项目支付200美元的分析费用。然后我花了两个小时尝试在GA4中配置一个简单的漏斗,最终决定自己动手开发一个。
Prysm是我希望存在的工具:
- 实时3D访客位置全球地图(使用Three.js和WebGL着色器)
- 3.8kb的跟踪脚本,远低于GA的45kb——纯JavaScript,无依赖
- 无需使用Cookies/指纹识别——无需同意横幅
- AI聊天功能,回答问题(“为什么流量激增?”)
- 自动时间线:首位客户、收入目标、流量事件
有趣的部分:
- 在处理单页应用(SPA)、离线模式和自定义事件的同时,保持跟踪脚本在200行以内
- 使用GPT-4o-mini处理简单查询,将成本控制在每位客户每月9美元
- 为全球地图构建连接池(最多5个并发连接,以避免压垮Supabase实时服务)
技术栈:Next.js、Supabase、Mapbox、OpenAI
定价:每月9.99–29.99美元,面向独立开发者
目前处于私人测试阶段。是什么让你最终决定从当前的分析工具切换到这个呢?
大家好,我们是Avi、Kiet和Satya。我们正在开发Superset,这是一个开源终端,旨在并行管理多个编码代理(如Claude Code、Codex等)。
- Superset使得创建git工作树和自动设置环境变得简单。
- 代理和终端标签被隔离到工作树中,避免了冲突。
- 内置钩子[0]可以在编码代理完成或需要关注时通知用户。
- 提供差异查看器,快速审查更改并创建PR。
我们三位工程师曾经构建和维护过大型代码库,一直希望能够尽可能并行地处理多个功能。Git工作树[1]是解决这个问题的有效方法,但创建和管理它们却很麻烦。我们开始开发Superset,作为一个利用我们在运行并行代理时发现的最佳实践的工具。
这里有一个演示视频:
<a href="https://www.youtube.com/watch?v=pHJhKFX2S-4" rel="nofollow">https://www.youtube.com/watch?v=pHJhKFX2S-4</a>
我们都在使用Superset来构建Superset,它使我们的生产力提升了两倍多(你可以从自动更新中看出来)。我们有很多朋友在他们选择的IDE上使用它,或者用Superset替代他们的终端,它似乎很受欢迎,因为他们可以继续使用任何CLI代理或工具,而Superset只是增强了他们现有的工具集。
Superset主要使用Typescript编写,基于Electron、xterm.js和node-pty。我们选择xterm+node-pty是因为它是一个在桌面应用中运行真实PTY的可靠方式(被VSCode和Hyper使用),而Electron让我们能够快速发布。
接下来,我们正在探索一些功能,比如在云虚拟机中运行工作树以减轻本地资源负担、代理之间的上下文共享,以及一个顶层编排代理,用于同时管理多个工作树或项目。
在构建这个产品的过程中,我们学到了很多:制作一个好的终端比你想象的要复杂,终端和git的默认设置并不是通用的(如svn与git、奇怪的shell设置、复杂的单体仓库等)。
为自己构建产品的速度更快,也非常有趣。虽然现在还处于早期阶段,但我们希望你能在所有CLI工具和环境中尝试Superset,欢迎你的反馈! :)
[0] <a href="https://code.claude.com/docs/en/hooks" rel="nofollow">https://code.claude.com/docs/en/hooks</a>
[1] <a href="https://git-scm.com/docs/git-worktree" rel="nofollow">https://git-scm.com/docs/git-worktree</a>