1作者: saiprakashreddy3 个月前原帖
我构建了一个模拟器,模拟以下内容: • 完整的写入路径(WAL、内存表、不可变内存表、L0 刷新) • 分层压缩及级联合并 • 真实的布隆过滤器检查的读取路径(非模拟) • 实时写入、读取和空间放大指标
2作者: rhl3 个月前原帖
我为工作阅读了很多研究论文。我的工作流程围绕着不断增加的来自arXiv等网站的书签论文的收件箱发展而来。这对于探索非常有帮助,但很难跟踪我读过的内容。 Distillate将我已经使用的工具连接在一起:Zotero(文献管理)、reMarkable(阅读器 + 高亮工具)和Obsidian(笔记)。它自动化了整个流程: ``` $ distillate ``` 保存到Zotero ──> 自动同步到reMarkable ``` │ 在平板上阅读和高亮 完成后只需移动到Read/ │ V 自动保存笔记 + 高亮 ``` 它会定期检查Zotero中的新论文,通过rmapi将PDF上传到reMarkable,然后监视您在Read文件夹中完成阅读的论文。当它找到一篇时,它会: - 使用rmscene解析.rm文件以提取高亮文本(GlyphRange项目) - 使用PyMuPDF在原始PDF中搜索该文本并添加高亮注释 - 从Semantic Scholar丰富元数据(出版日期、会议、引用) - 创建一个结构化的Markdown笔记,包含元数据、高亮按页分组,以及注释后的PDF(我将其保存在Obsidian的库中) 核心工作流程只需要Zotero和reMarkable——不需要付费API,不需要云后端,您的笔记保留在您的机器上。如果您连接了其他选项,还可以获得: - 通过Claude的AI摘要(从您的高亮中提炼的一句话 + 关键学习) - 来自您的队列的每日阅读建议 - 通过Resend的每周邮件摘要 - 用于跟踪您阅读的Obsidian Bases数据库 技术栈:rmapi用于reMarkable Cloud,rmscene用于.rm解析,PyMuPDF用于PDF注释。支持Python 3.10+,可通过pip安装。 最棘手的部分是高亮提取:reMarkable将高亮文本存储为场景树中的GlyphRange项目,将该文本与原始PDF中的位置匹配需要模糊搜索和OCR清理,以及针对跨页高亮的特殊合并逻辑。很高兴地说,现在大约99%的时间都能正常工作。 安装:`pip install distillate && distillate --init` 代码: [https://github.com/rlacombe/distillate](https://github.com/rlacombe/distillate) 网站: [https://distillate.dev](https://distillate.dev) 我为自己构建了这个工具,但非常希望能收到反馈,特别是来自其他reMarkable和Zotero用户的反馈。您的工作流程中缺少什么?我还应该添加什么?
14作者: solomonb3 个月前原帖
我一直在为洛杉矶东圣费尔南多谷创建一个低功耗FM电台而努力。我们尚未进入广播频段,但我们的频道将是95.9FM,覆盖范围可以在我们网站的主页上查看。 KPBJ是一个自由形式的社区广播电台。我们鼓励该地区的任何人申请时段并成为主持人。我们不做任何策展决定。这在某种程度上类似于公共接入频道或大学电台。 本月,我们启动了互联网直播,并上线了约60个节目。大多数节目是音乐类,但也有一些脱口秀。目前我们将所有节目限制为每月的时段,但随着大家对相关系统的熟悉,这一规定在不久的将来会有所改变。 在我们筹集资金建立录音室之前,所有节目都是预录的。 我们已经为发射器找到了一个场地,但我们需要筹款来覆盖设备和建设成本。我们将在位于1500英尺高的Verdugos山脊上以100W的有效辐射功率进行广播。该场地需要独立供电,因此我们需要安装一个带电池备份的太阳能系统。我们计划通过802.11ah将电台与发射站同步。 我使用Haskell、NixOS、Terraform和HTMX构建了我们所有的网络基础设施:<a href="https://github.com/solomon-b/kpbj.fm" rel="nofollow">https://github.com/solomon-b/kpbj.fm</a> 这是一个相当庞大的项目,涉及许多社会和技术挑战,以及有限的预算。我对我们能够成功实现这一目标并将其打造成一个有影响力的地方电台感到相当自信。 该电台由我们创建的501c3非营利组织管理。我们正在积极寻求筹款,特别是为了让我们的发射站尽快投入运行。如果您住在该地区或希望以任何方式贡献,请与我们联系!