3作者: thutch762 个月前原帖
我在过去一个月左右的时间里,作为一个个人副项目开发了Augur。最初的想法是进行一次实验,看看我是否能制作出一个“Boss战”,它能够从所有对手中学习,但依然感觉公平可玩。最初计划是构建一个简单的JRPG风格的回合制战斗引擎,但我很快转向了基于文本的界面,回想起我早期与《冒险》和《佐克》的体验。这自然引导我加入了一个大型语言模型(LLM),最终变成了我觉得相当有趣的东西,所以我决定分享出来。 核心理念很简单:你将与一个名为“建筑师”的角色进行基于文本的Boss战,背景设定在一个奇怪的图书馆中。你可以选择战斗、潜行、说服,或者尝试一些我还没想到的方式。回合的机械处理通过d100掷骰子来解决,状态跟踪伤害而不是生命值,世界中的物体具有LLM可以推理的物理属性。这个“引擎”是基于属性的,而不是规则表,我发现这样能产生一些新颖的游戏体验。 我最感兴趣的部分是学习机制。建筑师会根据在战斗中实际感知到的内容建立印象,将其存储为向量嵌入,并在未来的战斗开始时检索相关的印象。故意造成信息损失——更像是人类的记忆,而不是数据库查找。如果某种战术一直有效,建筑师会开始识别出这种模式。如果你成功潜行而未被发现,它会记住自己输掉了战斗,但不记得具体的方式。 这一切的技术基础是一个双LLM的回合循环。每个回合会进行两次模型调用:一次是引擎模型,它能看到完整的游戏状态并解决机械问题;另一次是建筑师模型,它只接收自己实际感知到的信息(视线、噪音、区域接近度)。这种“信息不对称”是结构性和故意的——建筑师模型根本无法访问引擎没有通过感知过滤器传递的状态。 我最初尝试了单一LLM的方法,但并没有成功。无论你多么小心地提示模型“忘记”上下文窗口中的信息,它总是会泄露。更不用说建筑师还习惯于采用上帝模式。因此,分离角色使整个过程感觉更加诚实,这是单靠提示工程无法实现的。 这是我第一次在HN上发帖,这是在一个简单基础设施上的真实发布(单个Fly.io实例,小型Supabase项目),所以如果有任何流量,我可能会遇到一些问题。社区资金支持的免费试用,或者如果你想继续使用,可以以5美元/10美元购买积分。最好在完整的桌面浏览器中体验,但在我测试过的两款移动设备上也可以勉强使用。 可在这里玩: [https://www.theaugur.ai](https://www.theaugur.ai) 如果你对任何内部机制——回合流程、感知门控、记忆提取、成本模型等感兴趣,我很乐意深入探讨。
3作者: DanielHu872 个月前原帖
嗨,HN——我是Ethan,一名独立开发者。我创建DubTab是因为我在会议和观看我不熟悉语言的视频时花费了很多时间,而仅靠字幕有时无法跟上(尤其是当讲者说得很快时)。 DubTab是一个Chrome/Edge扩展,它会监听您当前标签页的音频,并为您提供: 1. 实时翻译字幕(可选双语模式) 2. 可选的AI配音,声音自然——这样您可以通过听而不仅仅是阅读来跟上内容 目标很简单:让您在实时中更容易理解另一种语言的音频,而无需下载文件或进行上传等待的流程。 使用方法: 1. 打开视频通话/直播/讲座/任何带音频的标签页 2. 启动DubTab 3. 选择目标语言(如果您知道源语言,也可以选择) 4. 仅使用字幕,或开启自然AI配音并调整音频混合(保留原声或降低原声) 适用场景: 1. 在跨语言会议/课堂上,当您厌倦盯着字幕时 2. 观看无法暂停/不断快退的直播内容 3. 希望通过双语字幕核对意义的语言学习者 4. 在事件实时发生时,跟上YouTube上的直播新闻(例如,关于美国/伊朗/以色列相关发展的突发国际新闻更新) 链接: [https://dubtab.com](https://dubtab.com) 我会在评论区,乐意分享实现细节,如果有人感兴趣的话。
1作者: bberisford2 个月前原帖
我是一名私人飞行员和软件工程师。我着手构建一个3D VFR飞行规划工具——一个可以让你直观地规划跨国飞行的工具,包含真实的天气、空域和地形。 在我能构建这些之前,我首先需要建立一个完整的数据基础设施。 FAA的机场数据以固定宽度的文本文件形式来自NASR订阅,每28天更新一次。障碍物数据是一个单独的56天文件,并有每日补丁。NOTAM需要正式申请FAA的NMS系统——包括阶段性批准和生产批准,以及OAuth2令牌管理。来自aviationweather.gov的天气数据以批量XML缓存文件的形式提供,他们更希望你下载这些文件,而不是通过API进行轮询。空域边界则通过ArcGIS REST端点提供,你需要分页访问,并且有10分钟的超时限制。 我最终构建了飞行规划应用程序——它功能齐全。但这引起了我之前雇主的关注,他们认为这具有竞争性,因此我因此失去了工作。为了避免进一步的法律麻烦,我将该应用程序搁置,转而专注于其底层基础设施。 这就是PreflightAPI的诞生。所有数据都通过Azure Functions的定时任务同步到PostgreSQL和PostGIS中——在请求时不会进行外部API调用。API直接从数据库提供服务,因此延迟保持在较低水平,你不再依赖FAA的正常运行时间。 使用一个API密钥,你可以获得以下内容: - 19,600多个美国机场,包括跑道、频率和航站程序 - 实时METAR、TAF、PIREPs、SIGMET和G-AIRMET - 带空间查询的NOTAM(按机场、半径或航线走廊) - 以GeoJSON格式提供的空域边界(B/C/D/E类、限制区、MOA等) - 超过625,000个来自FAA数字障碍物文件的障碍物 - E6B工具(横风、密度高度、风修正、压力高度、真实空速) - VFR航行日志生成,自动生成TOC/TOD航路点,进行高空风插值和燃料追踪 - 一个综合简报端点——一次请求返回沿航线的所有天气、NOTAM和危险信息 我刚刚上线,目前有一个付费客户。免费层为每月5,000次调用。文档地址:https://preflightapi.io/docs 我非常希望能得到关于API设计的反馈,或者你认为缺少什么,或者这是否是你觉得有用或有趣的内容 :)
1作者: ManfredMacx2 个月前原帖
Formualizer 是一个用 Rust 编写的电子表格引擎:解析 Excel 公式,跟踪依赖关系,支持 320 多个函数的计算,修改工作簿,撤销/重做。通过 PyO3 提供 Python 绑定,支持浏览器的 WASM。采用 MIT/Apache-2.0 许可证。 最初的动机是实现 Python 的服务器端公式计算。openpyxl 能够很好地读取和写入 xlsx 文件,但不支持公式计算——公式单元格返回 None,除非 Excel 在最后保存时缓存了值。xlcalc 实际上可以进行计算,但只支持大约 50 个函数。如果你需要 XLOOKUP、带多个条件的 SUMIFS、IRR、XIRR,或者像 FILTER 和 UNIQUE 这样的动态数组,你要么在 Linux 系统上安装 Excel,要么接受功能的缺失。 对于常见的情况,可以用一行代码实现: ```python import formualizer as fz fz.recalculate_file("model.xlsx", output="recalculated.xlsx") ``` 或者通过编程方式驱动——加载一个工作簿,改变输入,进行计算: ```python wb = fz.load_workbook("model.xlsx") wb.set_value("Assumptions", 3, 2, 0.08) wb.evaluate_all() print(wb.evaluate_cell("Summary", 5, 3)) # =IRR(...) ``` 你还可以注册 Python 回调作为一等公式函数,参与依赖图的计算。 Rust 和 WASM 目标也得到了全面支持——引擎是核心,Python、WASM 和稳定的 CFFI 是目标。 正式的基准测试正在进行中! 文档: [https://www.formualizer.dev/docs](https://www.formualizer.dev/docs)
1作者: bspippi13372 个月前原帖
嗨,HN, 我正在构建一个名为 Restless 的命令行工具,旨在简化探索不熟悉的 API 的过程。 当你遇到一个新的 API 时,第一步通常会很慢:查找文档、定位 Swagger/OpenAPI,并理解端点结构。 Restless 尝试自动化这个发现过程。 示例: ``` $ restless scan https://api.github.com ``` Restless API 发现 扫描中: https://api.github.com 检测到 Swagger 已索引 142 个端点 认证 ├─ POST /login ├─ POST /refresh 用户 ├─ GET /users ├─ GET /users/{id} 仓库: [https://github.com/bspippi1337/restless](https://github.com/bspippi1337/restless) 欢迎反馈。
2作者: 9wzYQbTYsAIc2 个月前原帖
我的健康问题限制了我工作的能力。我开始将Claude Code视为一种辅助工具——不是在医疗文书的意义上,而是字面上的:它让我能够完成在正常工作环境中无法完成的事情。Observatory是在八天内建立的,因为这种合作方式对我来说变得可能。(我甚至使用Claude Code来写这篇文章——但只发布我觉得有共鸣的部分。)还有两篇相关的文章:关于递归方法论(<a href="https://blog.unratified.org/2026-03-03-recursive-methodology/" rel="nofollow">https://blog.unratified.org/2026-03-03-recursive-methodology...</a>)和806个评估故事揭示的内容(<a href="https://blog.unratified.org/2026-03-03-what-806-stories-reveal/" rel="nofollow">https://blog.unratified.org/2026-03-03-what-806-stories-reveal...</a>)。<p>我建立Observatory是为了自动评估Hacker News首页的故事是否符合联合国《世界人权宣言》的31项条款——之所以选择HN,是因为它的人为策划首页是少数几个能够通过故事的存在来反映质量,而不仅仅是传播性的源之一。它每分钟运行一次:<a href="https://observatory.unratified.org" rel="nofollow">https://observatory.unratified.org</a>。Claude Haiku 4.5负责全面评估;Llama 4 Scout和Llama 3.3 70B在Workers AI上进行轻量级的免费评估。<p>塑造设计的观察是:权利侵犯很少会自我宣布。一篇关于某公司“隐私优先方法”的文章可能出现在一个运行着十二个追踪器的网站上。有趣的信号不是一篇文章是否提到隐私,而是该网站的基础设施是否与其言辞相符。<p>每次评估运行两个平行通道。编辑通道评分内容对权利的表述:涉及哪些条款、方向、证据强度。结构通道评分网站基础设施的表现:追踪、付费墙、可及性、作者披露、资金透明度。二者的差异——SETL(结构-编辑张力水平)——往往是最具揭示性的数字。“说一套,做一套”,量化体现。<p>每次评估将可观察的事实与解释性结论分开(公平见证层,与fairwitness.bot的概念相同——<a href="https://news.ycombinator.com/item?id=44030394">https://news.ycombinator.com/item?id=44030394</a>)。你可以得到事实与推论的比例,并准确阅读模型引用的证据。如果某个评分看起来不对,跟踪链条并告诉我推论失败的地方。<p>根据我们对805个故事的评估:只有65%标明了作者——三分之一的HN故事没有命名作者。18%披露了利益冲突。44%假设具备专家知识(关于第26条的结构性说明)。科技报道的回顾性几乎是前瞻性的10倍:过去的伤害被广泛记录;预防讨论则很少。<p>有一个故事最能说明SETL:“一半的美国人现在认为新闻机构故意误导他们”(fortune.com,652 HN积分)。编辑:+0.30。结构:−0.63(付费墙、追踪、无资金披露)。SETL:0.84。一个关于人们为何不信任媒体的故事,来自一个自身基础设施展示了这一模式的媒体。<p>免费Llama模型的结构通道噪声较大——86%的评分集中在两个整数上。我正在探索的方向是:TQ(透明度指数)——二元、可计数的指标,不需要LLM解释(作者是否命名?引用的来源?资金是否披露?)。代码是开源的:<a href="https://github.com/safety-quotient-lab/observatory" rel="nofollow">https://github.com/safety-quotient-lab/observatory</a>——.claude/目录包含构建背后的认知架构。<p>找到一个评分看起来不对的故事,打开详细页面,跟踪证据链。最有用的反馈是:当链条从可辩护的证据得出可辩护的结论时,却仍然得出了错误的规范判断。这是我尚未解决的失败模式。我的背景是数学和心理学(本科),在软件领域工作了十年——足以构建这个,但不足以自信地认为方法论是可靠的。特别欢迎在心理测量学、自然语言处理或人权研究方面的专业人士。方法论、提示和15个故事的校准集在关于页面上。<p>谢谢!