1作者: kavinsood大约 2 个月前原帖
嘿,HN, 我是一个重度使用 Obsidian 的用户。 最近,我对两种常见的同步方案感到厌倦: 1. 基于文件的同步(如 iCloud、Dropbox、Syncthing),需要等待更改传播,或者会出现“冲突副本”。 2. 自托管的设置(如 CouchDB),需要操作虚拟机和容器化数据库来同步 Markdown。 因此,我构建了 *YAOS*:一个以本地优先、实时同步为特点的 Obsidian 引擎。 自托管的开源软件应该提供更好的用户体验。 您可以一键将后端部署到自己的 Cloudflare 账户中。它适合 Cloudflare 的免费套餐(正常个人使用费用为 $0/月),并且完全不需要终端交互、SSH 或环境文件。 您现在可以试用: [https://github.com/kavinsood/yaos](https://github.com/kavinsood/yaos) *它的工作原理:* - 文本同步使用 Yjs CRDT。它实时同步按键和光标,而不是将保管库视为一堆待后续处理的文件。 - 每个保管库映射到一个 Cloudflare Durable Object,为您提供低延迟的单线程协调器。 - 后端在 Durable Object 的 SQLite 存储之上使用分块的 Checkpoint + Delta-Journal MVCC 存储引擎。 - 附件通过 R2 单独同步(这不是必需的——文本同步在没有它的情况下也能正常工作)。 这个项目最困难的部分是将 Obsidian 的同步 UI 和嘈杂的操作系统文件监视器与内存中的 CRDT 图进行桥接。我必须构建一个尾部快照排水系统,将快速的 IO 峰值(如执行全局查找和替换)合并为原子 CRDT 事务,以防止无限写入循环。 当前设计为每个保管库保持一个单一的 CRDT。这对于普通的个人笔记非常好,但有一个硬性的内存上限(约 50MB 的原始文本)。我选择了这个权衡,因为我更关心快速、可靠的实时使用体验,而不是无限的企业规模。 我还在 GitHub 上写了关于一些棘手部分的工程笔记(例如处理离线文件夹重命名冲突而不复活死文件)。 过去三周,我进行了严格的质量保证测试,以增强移动重连、IndexedDB 配额失败和离线分脑目录重命名的稳定性。 我非常希望能得到关于架构、代码或我所做权衡的反馈。我会在讨论中待着,回答问题!
1作者: pramodbiligiri大约 2 个月前原帖
我正在努力从概念上充分理解大型语言模型(LLMs),以便能够预测它们在生成代码方面的能力(和局限性)。这个目标合理吗?有没有好的资源推荐? 到目前为止,我查看了以下内容: 1. 《Vibe Coding》,作者:Steve Yegge 和 Gene Kim(https://www.amazon.in/Vibe-Coding-Building-Production-grade-Software/dp/1966280025)。这本书提供了一些实际示例和许多指导原则,但理论部分不多,似乎也没有从概念上解释大型语言模型。 2. 《Build an LLM from Scratch》,作者:Sebastian Raschka(https://www.manning.com/books/build-a-large-language-model-from-scratch)。这本书看起来很深入,但我并不想真正去“构建”一个大型语言模型。 3. 《AI Engineering》,作者:Chip Huyen(https://www.amazon.in/AI-Engineering-Building-Applications-Foundation/dp/1098166302)。这本书看起来很有前景,尽管它并不专注于编码。 也许类似于《How Claude Code Works》(https://code.claude.com/docs/en/how-claude-code-works),但内容可以更详细一些。 谢谢。
13作者: theseusares大约 2 个月前原帖
在过去几个月里,我一直在收集关于美国各州立法机构中一波“年龄验证”法案的公共记录。这些记录包括IRS 990表格、参议院游说披露、州伦理数据库、竞选融资记录、公司注册信息、WHOIS查询以及Wayback Machine档案。最初出于对推动这些法案的人的好奇,最终转变为记录一个协调的影响力行动,从隐私的角度来看,这一行动正在构建操作系统级别的监控基础设施,而背后的公司却没有面临任何新的平台要求。 ### 一个在法律上并不存在的倡导组织 数字儿童联盟(Digital Childhood Alliance)自称是一个由50多个保守派儿童安全组织组成的联盟(后来夸大到140多个,但仅有六个曾被公开提及)。该组织在各州为这些法案作证。公共记录显示其法律地位如下: DCA的域名于2024年12月18日通过GoDaddy注册,带有隐私保护,注册期为四年。网站在一天后上线并完全形成:专业设计、统计数据、来自遗产基金会和NCOSE工作人员的推荐信,以及ASAA的宣传要点已加载。这并不是一个草根启动,而是一个预先构建的网站的阶段性部署。77天后,犹他州的SB-142成为全国首个签署的ASAA法律。 DCA通过For Good(前身为Network for Good,EIN 68-0480736)处理捐款,For Good在其文档中明确表示其服务于“501(c)(3)非营利组织”。DCA声称拥有501(c)(4)身份。DCA在For Good系统中被分类为“项目”(ID 258136),而不是独立的非营利组织。我搜索了过去五年中59,736个For Good资助的受益者,约17.3亿美元的拨款中,没有一笔拨款给DCA、DCI、NCOSE或任何相关实体。捐款页面似乎只是表面功夫。 彭博社的记者在2025年7月揭露Meta是DCA的资助者。Deseret News在2025年12月详细说明了这一安排。在100多个Wayback Machine快照中,没有任何版本的网站披露资金来源。每一篇博客和证词都针对苹果和谷歌,从未提及或批评Meta。 凯西·斯特凡斯基(Casey Stefanski)是执行董事,曾在NCOSE担任全球合作关系高级总监长达10年。不同寻常的是,她从未在任何NCOSE的990表格中以官员、关键员工或五名最高薪酬员工之一的身份出现。在一家年收入540万美元的组织中担任高级总监十年却没有990表格的记录,这表明她的薪酬可能低于阈值、头衔被夸大,或与该安排有关的其他问题。 NCOSE自身的501(c)(4)结构实际上相当复杂。追踪四年的Schedule R文件显示,NCOSE在2021年创建了“NCOSE行动”(EIN 86-2458921)作为c4,2022年将其从c4重新分类为c3,然后在2023年以相同地址和主要官员(Marcel van der Watt)创建了一个全新的c4,名为“公共政策研究所”(EIN 88-1180705)。到2024年,原始实体已完全从Schedule R中消失。 ### 超过7000万美元的超级政治行动委员会,故意分散 Meta向州级超级政治行动委员会投入了超过7000万美元,并将每一个都结构化以避免FEC的集中、可搜索数据库: 如果您维护的软件可以根据这些定义被归类为“操作系统提供商”,请开始 完整数据集、OSINT任务清单和所有处理结果已发布,文件中嵌入了来源:github.com/upper-up/meta-lobbying-and-other-findings