返回首页

一周热榜

11作者: diwu19896 天前原帖
嗨,HN, 我们为数据分析师开发了一款人工智能助手,它将令人疲惫的电子表格和商业智能工具的工作转变为快速、可验证且愉悦的体验。早期用户反馈称,他们在常见的实际数据处理任务上,从几个小时缩短到了几分钟。 它比Excel的助手更智能:不可变的数据步骤、SQL视图的有向无环图,以及利用DuckDB对数百万行数据进行即时处理。我们的早期代理原型在Spider2-DBT基准测试中排名第一。 [https://spider2-sql.github.io](https://spider2-sql.github.io) 欢迎试用,我们期待您的反馈! 谢谢, Di Wu及Shadowfax团队 P.S. Shadowfax是《指环王》中甘道夫的马。我们有一个隐藏的彩蛋网站,里面有三个不同的触发点,看看你能否找到它们。
11作者: dchu177 天前原帖
大家好,我是来自Aluna(YC S24)的David。我们与诊断实验室合作,构建用于肿瘤学任务的数据集和评估工具。 我想分享一个我构建的简单强化学习环境,它为前沿的大型语言模型(LLM)提供了一套工具,使其能够在数字化的病理切片上进行缩放和平移,以找到相关区域进行诊断。 以下是一些LLM在几张切片上进行诊断的视频: ([https://www.youtube.com/watch?v=k7ixTWswT5c](https://www.youtube.com/watch?v=k7ixTWswT5c)):LLM在对一例小细胞肺癌进行诊断前选择不同区域查看的过程。 ([https://youtube.com/watch?v=0cMbqLnKkGU](https://youtube.com/watch?v=0cMbqLnKkGU)):LLM在对一例良性纤维腺瘤进行诊断前选择不同区域查看的过程。 我构建这个环境的原因: 病理切片是现代癌症诊断的基础。活检组织被切片、染色并装载在玻璃上,以供病理学家检查异常。 如今,许多病理切片被数字化为全切片图像(WSI),以TIF或SVS格式存储,大小可达数GB。 虽然已经存在一些专注于病理的人工智能模型,但我很好奇前沿的LLM在病理相关任务上的表现。主要挑战在于WSI的大小超出了LLM的上下文窗口。标准的解决方法是将其拆分为数千个小块,但对于大型前沿LLM来说,这种方法效率低下。 受到病理学家在显微镜下缩放和平移的启发,我构建了一套工具,使LLM能够控制放大倍数和坐标,一次查看小区域,并决定下一步查看的位置。 这最终导致了一些有趣的行为,实际上在提示工程方面似乎取得了相当不错的结果: - GPT 5:在决定之前探索了大约30个区域(在6个癌症亚型任务中与专家病理学家达成一致4次,在5个IHC评分任务中达成一致3次)。 - Claude 4.5:通常使用10-15个视图,但准确性与GPT-5相似(在6个癌症亚型任务中与病理学家达成一致3次,在5个IHC评分任务中达成一致4次)。 - 较小的模型(GPT 4o,Claude 3.5 Haiku):检查了大约8帧,整体准确性较低(在6个癌症亚型任务中达成一致1次,在5个IHC评分任务中达成一致1次)。 显然,这只是一个小样本集,因此我们正在努力创建一个更大的基准套件,包含更多案例和任务类型,但我觉得这个结果很酷,所以想与HN分享!
10作者: GlebShalimov5 天前原帖
发现 Pegma,这是经典的 Peg 单人跳棋游戏的免费开源版本!Pegma 提供了简洁的设计和流畅的游戏体验,支持多种平台。 <p>主要特点:</p> <p>完全开源的代码可在 GitHub 上获取,欢迎社区贡献和保持透明。</p> <p>开发者自定义设计的字体,增强了游戏的独特风格。</p> <p>跨平台支持:可在 iOS 和 Android 上游玩。</p> <p>轻量级、直观的界面,忠实于经典的益智游戏机制。</p> <p>现在就试试:</p> <p>网站: <a href="https://pegma.vercel.app" rel="nofollow">https://pegma.vercel.app</a></p> <p>GitHub: <a href="https://github.com/khlebobul/pegma" rel="nofollow">https://github.com/khlebobul/pegma</a></p> <p>App Store: <a href="https://apps.apple.com/ru/app/pegma-peg-solitaire/id6754343848">https://apps.apple.com/ru/app/pegma-peg-solitaire/id6754343848</a></p> <p>Google Play: <a href="https://play.google.com/store/apps/details?id=com.khlebobul.pegma">https://play.google.com/store/apps/details?id=com.khlebobul.pegma</a></p> <p>如果你欣赏开源项目和经典的脑筋急转弯,Pegma 绝对值得一试!</p>
9作者: jgchaos大约 16 小时前原帖
功能包括: <p><pre><code> - 多个预设的周期轨道:经典的8字形轨道,以及来自Li和Liao最近的10,000多个轨道数据库中发现的新3D解(https://arxiv.org/html/2508.08568v1) - 完整的3D相机控制(旋转/平移/缩放),带有跟随物体模式 - 力和速度矢量可视化 - 时间轴拖动以探索完整的轨道周期 </code></pre> 这些3D预设特别有趣。尝试从加载预设菜单中选择“O₂(1.2)”或“Piano O₆(0.6)”,可以看到物体在轨道平面中交错的配置。我见过的大多数浏览器模拟器都是2D的。 <p>使用Three.js构建。欢迎对额外的预设或功能提出建议!
9作者: ascii大约 18 小时前原帖
GoSign 是一款在意大利公共行政机构和企业中广泛使用的桌面客户端,用于合格电子签名,由 Tinexta InfoCert 开发,该公司是欧洲主要的 eIDAS 监管信任服务提供商之一。研究人员发现,版本 ≤ 2.4.0 在配置代理时会禁用 TLS 证书验证,并使用未签名的更新清单。这些缺陷的结合使得中间人攻击成为可能,并可能导致恶意更新的传递,从而引发远程代码执行。
8作者: randomgermanguy6 天前原帖
我们举行了一次由内部AI团队(主要是大型语言模型)主导的内部研讨会,令人沮丧的是,团队中的任何人似乎都不知道“人工智能”这个术语到底是什么意思,或者语言模型是如何工作的。 一位资深开发人员(也是团队负责人)试图向我解释,人工智能是机器学习的一个子领域,并且本质上总是具有随机性(因为ChatGPT对相同提示的响应是不同的)。 我们/他们正在向其他企业销售量身定制的“人工智能产品”,但显然我们并不知道采样是如何工作的……此外,没有人能告诉我我们的“自托管”模型到底运行在哪里(结果发现50%的时间其实就是OpenAI/Anthropic),或者我们的产品使用了什么OCR模型。 我是不是太初级/天真,以至于无法理解这些,还是说我真的陷入困境了?
7作者: brokerjames2 天前原帖
嗨,HN, 我们是一个小团队,正在开发13Radar.com,网站在经过四个月的开发后大约两周前上线。我是创始人,和团队一起,我们正在构建一个基于SEC 13F报告实时跟踪对冲基金投资组合的平台。 人工智能在我们的工作流程中起到了重要的帮助作用。对于单个网页,我们通常会同时咨询多个AI系统,生成不同的版本并进行对比,最终确定设计或实现方案。超过60%的研究、设计和编码工作都得到了AI的支持。在用户界面设计方面,我们使用了Readdy,提供了流畅的设计体验。我们还尝试了Google Gemini和ChatGPT进行研究和原型设计,而大部分编码工作则是使用Claude Code(Trae)完成的。在前端开发中,我们最初使用了Bootstrap,但后来转向了TailwindCSS,以获得更轻便、更响应式的框架。 目前的功能包括: - 实时跟踪基于SEC 13F报告的对冲基金持仓 - 每季度的投资组合变化(新头寸、增加、减少、退出) - 行业层面的洞察和趋势分析 - 历史跟踪和回测工具 接下来的步骤: - 实施定价和订阅功能 - 添加电子邮件通知和报告导出功能 - 扩展分析功能,加入内幕交易数据 - 继续优化可用性和性能 我们非常希望得到社区的反馈: - 这是否解决了投资者/研究人员的真实痛点? - 对于提升定位或可用性有什么想法? - 有哪些功能建议可以让这个平台更有用? 感谢您的阅读——如果您感兴趣,欢迎访问我们的网站,并告诉我们您的想法。
7作者: geoffitect2 天前原帖
Alphafold3曾经是高性能计算集群的专用工具;现在我已经在Apple Silicon上成功移植并运行。如果你拥有一台M系列的Mac(大约2023年及以后发布),你可以在几分钟内根据序列生成蛋白质结构。试试看吧!<p>GitHub仓库:<a href="https://github.com/latent-spacecraft/openfold-3-mlx" rel="nofollow">https://github.com/latent-spacecraft/openfold-3-mlx</a>