23作者: olokobayusuf11 天前原帖
我相信很多人都对此有所了解,但在找到(或构建)一个在PyTorch中有效的模型与将其部署到应用程序之间,存在着一个棘手的鸿沟,尤其是在面向消费者的应用程序中。 我一直对以良好的开发者体验解决这个问题非常感兴趣。随着时间的推移,我逐渐意识到,最有影响力的事情是找到一种方法,将现有的Python代码转化为一个自包含的本地二进制文件——换句话说,就是一个Python编译器。 我对一个成功的尝试已经相当熟悉:当苹果在iPhone 5s上引入armv8时,他们迅速要求所有应用程序支持64位。Unity——我从11岁开始编程的地方——因此遭遇了麻烦,因为他们使用Mono来运行开发者的C#代码,而Mono不支持64位ARM。最终,Unity构建了IL2CPP,它将C#中间语言转译为C++,然后进行交叉编译。到目前为止,这可能是我认为Unity所取得的最惊人的技术成就。 我开始着手构建类似的东西,但这次是从Python出发。考虑到该语言的动态特性,这个问题相当困难。关键的突破是PyTorch 2.0的发布,他们开创性地使用符号追踪来支持`torch.compile`。简而言之,他们向Python解释器注册了一个回调(使用CPython的帧评估API),用虚假的输入运行一个函数,并记录下函数中发生的所有事情的IR图。 一旦你有了IR图,就可以通过在程序中传播类型信息,将其逐步转化为C++/Rust代码(具体示例请见博客文章)。现在正是拥有这一基础设施的最佳时机,因为大型语言模型(LLMs)可以完成编写和验证所需操作的所有繁重工作。 无论如何,我想分享这个概念验证并收集反馈。使用Function非常简单,只需用`@compile`装饰一个模块级函数,然后使用CLI进行编译:`fxn compile module.py`。 总结:在不需要学习Rust的情况下获得Rust的性能;)
4作者: jssmith11 天前原帖
嗨,HN, Postgres Pro 是一个开源的模型上下文协议(MCP)服务器,旨在支持开发过程的每个阶段。 它的功能远不止于生成和运行 SQL——它帮助确保您的应用程序和数据库能够良好运行。 特点: - 工业级的调优算法,类似于 MS SQL Server 中的算法 - “假设如何?”工具,用于评估 LLM 生成的索引建议 - 与 Cursor 等工具协作,修改 ORM 代码 - 通过限制模式确保安全的 SQL 执行 - 包含健康检查,以提前应对生产问题
2作者: andrewrn11 天前原帖
我一直觉得,当有人能够通过合理的猜测做出可信的估算时,这非常酷。最近我了解到,这种方法有时被称为“费米估算”,以著名物理学家恩里科·费米的名字命名,这也是他著名的费米悖论所使用的技术。 你可以利用几个滑块和固定的量(例如每年的周数)构建一个粗略的逻辑链,目标是尽量接近真实答案的数量级。数学很简单;思考才是关键。 期待反馈。
1作者: wkoszek11 天前原帖
嗨,HN!<p>我们是Knowbase Decks的创始人,这是一款AI演示文稿制作工具。它使用红杉资本的商业计划要点,允许您输入两句话(您为什么要构建这个项目),然后为您生成一个简单、极简风格的演示文稿,并提供内容示例。<p>它可以帮助您快速入门,缩短启动所需的时间。我们目前提供29美元的优惠,您将获得使用我们正在开发的更优秀的AI算法制作的演示文稿,并且我们会提供手动支持。请告诉我们您的反馈——我们知道我们正在早期阶段推出。<p><a href="http://knowbase.one/decks/" rel="nofollow">http://knowbase.one/decks/</a><p>完成 + 支持者: <a href="https://x.com/wkoszek" rel="nofollow">https://x.com/wkoszek</a> <a href="https://x.com/wwojtyniak" rel="nofollow">https://x.com/wwojtyniak</a>
6作者: keepamovin11 天前原帖
有很多前期的研究成果(这里有个不错的概述:https://sr.ht/~bptato/chawan/#neighbors),但我正在做一些不同的事情,希望它能存在。 我对反响很感兴趣。可能距离发布还有几周,但这里有个简短的截图:https://youtu.be/_Bs7BoQBoBA(如果你更喜欢 asciinema 的话: https://asciinema.org/a/9w6CMnaI9VxiykI1PgVWm4lsi)。 有什么想法? 这个项目的背景是,它是为受限环境设计的(超薄客户端,程序可以远程运行或在同一台机器上运行;安全限制?带宽限制?资源限制?内容限制?)。 就我个人而言,这个项目对我来说意义重大,因为我与计算机的第一次互动,甚至是与互联网的第一次接触,都是在拨号上网和 BBS 系统的文本环境中度过的。但在现代社会,我常常感到想要远离那些喧嚣的色彩和图像,它们在争夺我的注意力。我只想要一个安静且有效的网络。但我不喜欢扩展程序知道一切,而内容脚本又很脆弱。对我来说,终端的媒介实际上传达了不同的信息和独特的体验,我觉得这很有价值。我认为互联网也希望以这种方式展现自己。 所以我会继续构建这个项目,无论这里的反响如何。我还认为,也许我可以做一些时尚的东西,因为 OCR 仍然是一个重大问题,如果 AI 能以文本为基础来驱动网络内容,也许它们会喜欢这样。不过这并不是我的主要目标,但我需要考虑资金问题。 我还有一些其他有趣的想法,这些想法真正向过去致敬;一个更文明的时代。
11作者: orlando25211 天前原帖
在对现有的DynamoDB图形用户界面客户端感到有些沮丧后,我决定自己构建一个。<p>功能:<p>1. 请求集合:将多个操作(如插入、查询、更新和删除)串联在一起,跨表、账户和会话进行操作。可以将一个操作的输出作为下一个操作的输入。<p>2. 环境变量:只需配置一次变量,即可在不同环境(开发/测试/生产)中运行相同的请求。不再需要手动更换参数。<p>3. 多标签、多账户支持:可以同时处理多个AWS账户中的不同表和单点登录会话。<p>4. 简便的单点登录:无需离开图形用户界面即可开始单点登录。<p>5. Git同步:所有请求配置都以TOML文件的形式保存在本地。您的数据保持私密,并且可以使用Git进行版本控制。<p>欢迎任何反馈。
2作者: ksec11 天前原帖
我有几百张甚至上千张名片。我一直在寻找一种带有自动进纸器的扫描仪,可以一次放入几十张名片并进行扫描。然后能够以某种方式提取和管理这些信息。我见过很多相机和名片应用,但那些都太过手动且劳动密集。想知道在HN上有没有人有解决方案。