1作者: jason_s3 个月前原帖
假设我是一位富有的数学家(这听起来不错),我想赞助一些计算,这些计算需要进行某个巨大的数字 N 的浮点或整数运算,并且可以在云端轻松并行化。我的程序员们已经提出了一个相对高效的实现方案,并通过一些小规模的测试进行了基准测试。输入/输出和存储成本较低,主要的成本将是纯计算费用。 现在我准备拿出支票本。 在当今的云计算市场中,哪些因素会影响这种计算的成本? 价格如何随着 N 的变化和我希望完成问题的速度而变化?(例如,如果需要 1000 个 AWS 实例运行 10 个月,或者 10,000 个 AWS 实例运行 1 个月,我的费用会一样吗?我假设运行时间少于一年,因此不会长到在计算过程中成本显著降低。) 是否有灵活性方面的因素可以降低价格?(例如:云服务器可以在短期内随时暂停我的计算或限制 CPU,只要我计算的平均运行速率在任何给定的日子里超过 80% 的全速。) Lenstra 使用“美元天”(dollardays)这个术语来描述破解加密密钥的成本,认为这与计算设备的资本成本成比例(4000万美元天 = 价值100万美元的计算机运行40天,或价值4000万美元的计算机运行1天),但在云计算中,这似乎更像是按件计费的定价结构。
1作者: Jashwanth013 个月前原帖
嗨,HN, 我一直在开发 SmartKNN,这是一个专门为生产部署而设计的最近邻系统,而不是用于学术实验。 我们的目标不是对经典 KNN 进行小幅调整,而是将其重构为一个可部署的、关注延迟的系统,同时保持可解释性。 **它的不同之处** 传统的 KNN 简单且易于解释,但在实际应用中面临以下挑战: - 随着数据集的增长,推理延迟增加 - 对所有特征的平等处理 - 固定的距离度量 - 在负载下性能不可预测 SmartKNN 通过以下方式解决这些问题: 1. **学习特征加权** 特征重要性自动学习并纳入距离计算。这减少了噪声,提高了邻居质量,而无需手动调优。 2. **自适应距离行为** 距离计算根据学习到的特征相关性进行调整,而不是依赖于简单的欧几里得固定度量。 3. **后端选择** SmartKNN 支持暴力搜索和近似最近邻策略。 - 小数据集 → 暴力搜索 - 大数据集 → 近似候选检索 近似搜索仅用于检索候选项。最终预测始终使用学习到的距离函数。 4. **以 CPU 为中心的设计** 系统优化为可预测的 CPU 推理性能,而不是依赖 GPU 的重型工作流。重点是稳定的延迟特性,适合生产工作负载。 5. **统一 API** 通过与 scikit-learn 兼容的接口支持分类和回归。 **性能** 在具有强局部结构的结构化/表格数据集上,SmartKNN 的准确性与基于树的模型相当。 它并不旨在普遍替代树模型或神经网络。在邻域结构有意义且需要可解释性的地方表现最佳。 **局限性** - 需要数据集保持在内存中 - 高维稠密数据仍可能对最近邻方法构成挑战 - 尚无在线/增量更新 - 对于大数据集,后端准备增加了设置时间 **项目状态** - 公共发布:0.2.2 - 稳定 API - 开源 - CPU 优化核心 代码库: https://github.com/thatipamula-jashwanth/smart-knn 我非常欢迎反馈,特别是来自那些在生产中部署过最近邻系统的人的意见。 谢谢。 - Jashwanth
1作者: rittermax3 个月前原帖
开始一个任务,喝杯咖啡,回来时看到的是生产级的代码。 测试被强制执行,上下文被保留,质量自动化。 Claude Code 运行迅速,但缺乏结构,跳过测试,丢失上下文,产生不一致的结果——尤其是在复杂的、成熟的代码库中。我尝试过其他框架——它们在臃肿的提示上浪费了令牌,却没有带来真正的价值。有些增加了流程却没有强制执行,其他则是提示模板,当上下文变得紧凑时,Claude 会忽略它们。没有一个能让 Claude 稳定地产出生产级的代码。 因此,我构建了 Pilot。它不是在上面增加流程,而是在每次交互中将质量融入其中。每次编辑时,代码检查、格式化和类型检查作为强制钩子运行。测试驱动开发(TDD)是强制的,而不是建议的。上下文在会话间被监控和保留。每一项工作在标记完成之前都要经过验证。 Pilot 优化输出质量,而不是系统复杂性。规则简洁且专注。没有大的学习曲线,没有项目框架需要搭建,也没有状态文件需要管理。您可以在任何现有项目中安装它——无论多复杂——运行 `pilot`,然后 `/sync` 来学习您的代码库,质量保障措施就会自动存在——钩子、TDD、类型检查、格式化——在每次编辑和每次会话中自动强制执行。 结果是:您实际上可以离开。开始一个 `/spec` 任务,批准计划,然后去喝杯咖啡。当您回来时,工作已经完成——经过测试、验证、格式化,并准备好发布。钩子在压缩周期中保留状态,持久内存在会话之间传递上下文,质量钩子在整个过程中捕捉每一个错误,验证代理在标记完成之前审查代码。不需要看护。
2作者: loayabdalslam3 个月前原帖
展示 HN:HJX – 一种为 AI 原生代码生成设计的统一网页语言 大家好, 我一直在探索一种语言设计,其中结构、样式和逻辑融合在一个创作单元中,以减少 AI 模型生成前端代码时的令牌碎片化。 HJX 是一种编译型用户界面语言,将结构、样式和逻辑统一到一个 `.hjx` 文件中。它编译为干净、无依赖的 HTML + CSS + JavaScript —— 没有虚拟 DOM,没有运行时开销,没有框架锁定。 以下是来自 README 的一个真实示例: ```hjx component Counter state: count = 0 layout: view#root.card: text.title: "Count: {{count}}" button.primary (on click -> inc): "Increase" style: .card { padding: 16px; border: 1px solid #ddd; border-radius: 12px; } .primary { padding: 10px 14px; border-radius: 10px; cursor: pointer; } handlers: inc: set count = count + 1 ``` 欢迎大家提问关于 HJX 的问题,也欢迎提交 PR。 - Loaii Abdalslam
1作者: tuwenbo01203 个月前原帖
嗨,HN!我开发了 M-Courtyard,因为在本地微调大型语言模型(LLMs)实在令人沮丧——命令行工具、Python 脚本和分散的文档。<p>这个应用程序将整个流程(文档 → 数据集 → 微调 → 测试 → 导出到 Ollama)整合成一个完全在 Apple Silicon 上运行的桌面应用。<p>技术:Tauri 2.x + React + mlx-lm + Ollama 许可证:AGPL 3.0<p>希望能收到关于哪些模型或功能最有用的反馈。