返回首页

一周热榜

4作者: clacker-o-matic3 天前原帖
大家好!<p>我已经使用 Hacker News 一段时间了,但最近我开始希望能有一个功能,可以对我发布的任何故事设置提醒。<p>促使我下定决心的是 Hackclub 的 Shipwrecked <a href="https://shipwrecked.hackclub.com/" rel="nofollow">https://shipwrecked.hackclub.com/</a>(这是一个在波士顿湾举办的黑客马拉松,任何能够在夏天制作四个项目并让其中至少一个项目走红的人都可以参加)。其中一个“走红”的选项是登上 Hacker News 的首页,但我总是担心会错过这个机会,哈哈,所以我快速制作了一个 Slack 机器人,向一个频道发送提醒。这个过程非常简单,但确实有效。<p>有了这个机器人后,我意识到我可以利用我收集的数据做更多的事情,于是决定添加一些历史数据,最初我想生成图表并将其嵌入消息中,但后来决定快速尝试使用 Bun.serve 来托管一个简单的仪表板,主要是因为我想看看开发者体验如何。剧透一下,体验非常棒。我对网页组件和仅使用通用支持的 `html`、`css` 和 `js` 的想法感到非常受启发。Bun 提供了极好的开发者体验,你只需导入 `index.html` 并将其分配给根路由,就可以完成了。抱歉我在这里宣传 Bun,但它确实是我在构建这个项目时最喜欢的部分之一,除了 drizzle 之外。<p>仪表板上有一个图表,显示了随着时间推移所获得的积分和在排行榜上的位置(每 5 分钟更新一次),还有一些预期的统计数据,比如峰值积分、峰值位置、作者和评论数。<p>另外,所有代码当然都是开源的,您可以在我的 Tangled 仓库中找到(<a href="https://tangled.sh/@dunkirk.sh/hn-alerts" rel="nofollow">https://tangled.sh/@dunkirk.sh/hn-alerts</a>)以及 GitHub 仓库(<a href="https://github.com/taciturnaxolotl/hn-alerts">https://github.com/taciturnaxolotl/hn-alerts</a>),您还可以在 <a href="https://hn.dunkirk.sh" rel="nofollow">https://hn.dunkirk.sh</a> 尝试托管版本。我计划增加一个功能,可以将 Slack 机器人安装到任何工作区,并拥有特定于工作区的排行榜,但这需要一些重构,可能还要放弃 slack-edge 包。<p>此外,您可以通过简单地将 news.yc.com 替换为 hn.dunkirk.sh 来查看特定项目的数据,例如:<a href="https://hn.dunkirk.sh/item?id=44115853" rel="nofollow">https://hn.dunkirk.sh/item?id=44115853</a>
4作者: fazlerocks1 天前原帖
我们正在生产环境中运行大型语言模型(LLMs)用于内容生成、客户支持和代码审查辅助。我们尝试了几个月来建立一个合适的评估管道,但我们测试的每个工具都有显著的局限性。 我们评估过的工具: - OpenAI的Evals框架:在基准测试方面表现良好,但在定制用例上存在挑战。通过YAML文件进行配置可能会很复杂,扩展功能需要深入其代码库。主要设计用于批处理,而非实时监控。 - LangSmith:具有强大的追踪能力,但评估功能似乎次于其可观察性重点。免费层之后,定价从每千条追踪0.50美元起,对于高容量使用来说,费用迅速累积。处理较大数据集时,用户界面可能会变得缓慢。 - Weights & Biases:强大的平台,但主要用于传统机器学习实验跟踪。设置复杂,需要较高的机器学习专业知识。我们的产品团队在有效使用上遇到困难。 - Humanloop:界面简洁,专注于提示版本控制,具备基本的评估能力。可用的评估类型有限,功能集的定价较高。 - Braintrust:对评估的有趣方法,但感觉像是一个早期阶段的产品。文档稀少,集成选项有限。 我们实际需要的: - 实时评估监控(不仅仅是批处理) - 不需要博士级设置的自定义评估功能 - 针对主观任务的人机协作工作流程 - 每个模型/提示的成本跟踪 - 与我们现有可观察性栈的集成 - 产品团队能够实际使用的工具 当前解决方案: 自定义脚本 + 基本指标的监控仪表板。每周在电子表格中进行手动审查。虽然可行,但无法扩展,并且我们会错过一些边缘情况。 有没有人找到能够很好处理生产环境中LLM评估的工具?我们是否期望过高,还是这些工具确实不成熟?特别希望听到没有专职机器学习工程师的团队的反馈。
4作者: diagraphic1 天前原帖
大家好!希望你们今天过得愉快。今天我想分享一个我过去几个月一直在开发的实验性开源项目,名为Wildcat。Wildcat是一个嵌入式持久存储引擎,采用了类似于RocksDB和LevelDB的LSM树结构。开发这个系统的动机是为了尝试解决大多数嵌入式系统所面临的多写入者瓶颈。在这个过程中,尤其是在处理日志结构存储系统时,我实现了许多有趣的优化和算法,涉及到写入和读取路径。 希望你们能去看看 :) 亚历克斯
4作者: aubryio5 天前原帖
Minotor 是一个开源的客户端网页交通路线规划库。它支持扩展的 GTFS 数据源解析、复杂的路线查询以及地理和文本的站点搜索。与大多数现有的交通规划工具不同,Minotor 可以将特定日期的所有交通数据存储在客户端内存中,从而仅使用本地数据进行快速的运行时查询。
4作者: devarifhossain3 天前原帖
AI搜索结果正迅速变得比SEO更为重要,但作为企业,我们对此却没有任何可见性!这就是我正在构建“AI搜索结果的Ahrefs”的原因。<p>跟踪在ChatGPT、Claude、Perplexity等AI工具上的关键词表现。
4作者: localbuilder2 天前原帖
嗨,HN,想知道有没有人将项目管理工具用于个人项目。 我开始使用 Linear 来组织我项目中的任务,并取得了一些成功。不过,这是一种平衡,既要保持项目的有序,又不能增加过多的流程或负担,以免变得繁琐。 还有其他人使用类似的工作流程吗?
4作者: saubeidl大约 16 小时前原帖
大约十年前,当我进入科技行业时,那是一个充满乐观的时代。我们要改变世界,让人们能够在掌握知识的同时,方便地互相连接。工作环境很好,我们在解决有趣的问题,整体上充满了积极的氛围。 然而,现在我们行业的领导者却在全球范围内拥抱极右运动,积极推动让世界变得更糟的一切。事情越来越糟糕——谷歌和奈飞甚至在他们的付费产品中插入广告。 人工智能公司不断宣称他们的产品将改变世界,却从未考虑或讨论这种变化的后果。在他们的幻想中,他们将用计算机取代大部分劳动力,从而节省那些麻烦的工资成本。对于这些工资的领取者可能会发生什么,或者这将如何影响整个社会,他们根本没有考虑。 与此同时,我们的一部分同行热衷于朝着那个未来状态努力,同样从未思考过后果。在这个过程中,我们消耗了大量的能源,加速了已经在发生的气候灾难。 看起来我们正在公开构建一个反乌托邦,让少数人变得更加富有和强大,而将其他人置于绝境。 在这种情况下,如果一个人有良知,该怎么办?还有其他人也在为此挣扎吗?你们是如何应对的?