我开发了一款针对Apple Silicon macOS的开源命令行工具。它以不同的方式测量内存速度和延迟。在M4基础上,它的读取速度效率可达到96-97%,而官方宣传的速度为120GB/s。所有内存操作均采用汇编语言实现。
我非常希望能获得不同CPU上的基准测试结果,看看它们的表现。我已经在M1和M4上进行了测试。
命令:`memory_benchmark -non-cacheable -count 5 -output results.JSON`
(运行前请关闭所有应用程序)
这将生成一个JSON文件,其中包含copy_gb_s、read_gb_s和write_gb_s的统计数据。
以下是M4在10次循环下的示例结果:
```json
"copy_gb_s": {
"statistics": {
"average": 106.65421233311835,
"max": 106.70240696071005,
"median": 106.65069297260811,
"min": 106.6336774994254,
"p90": 106.66606919223108,
"p95": 106.68423807647056,
"p99": 106.69877318386216,
"stddev": 0.01930653530818627
},
"values": [
106.70240696071005,
106.66203166240008,
106.64410802226159,
106.65831409449595,
106.64148106986977,
106.6482935780762,
106.63974821679058,
106.65896986001393,
106.6336774994254,
106.65309236714002
]
},
"read_gb_s": {
"statistics": {
"average": 115.83111228356601,
"max": 116.11098114619033,
"median": 115.84480882265643,
"min": 115.56959026587722,
"p90": 115.99667266786554,
"p95": 116.05382690702793,
"p99": 116.09955029835784,
"stddev": 0.1768243167963439
},
"values": [
115.79154681380165,
115.56959026587722,
115.60574235736468,
115.72112860271632,
115.72147129262802,
115.89807083151123,
115.95527337086908,
115.95334642887214,
115.98397172582945,
116.11098114619033
]
},
"write_gb_s": {
"statistics": {
"average": 65.55966046805113,
"max": 65.59040040480241,
"median": 65.55933583741347,
"min": 65.50911885624045,
"p90": 65.5840272860955,
"p95": 65.58721384544896,
"p99": 65.58976309293172,
"stddev": 0.02388146120866979
}
}
```
模式基准测试也显示了更多的内存速度。命令:`memory_benchmark -patterns -non-cacheable -count 5 -output patterns.JSON`
以下是M4在100次循环下的示例结果:
```json
"sequential_forward": {
"bandwidth": {
"read_gb_s": {
"statistics": {
"average": 116.38363691482549,
"max": 116.61212708384109,
"median": 116.41264548721367,
"min": 115.449510036971,
"p90": 116.54143114134801,
"p95": 116.57314206456576,
"p99": 116.60095068065866,
"stddev": 0.17026641589059727
}
}
}
},
"strided_4096": {
"bandwidth": {
"read_gb_s": {
"statistics": {
"average": 26.460392735220456,
"max": 27.7722419653915,
"median": 26.457051473208285,
"min": 25.519925729459107,
"p90": 27.105171215736604,
"p95": 27.190715938337473,
"p99": 27.360449534513144,
"stddev": 0.4730857335572576
}
}
}
},
"random": {
"bandwidth": {
"read_gb_s": {
"statistics": {
"average": 26.71367836895143,
"max": 26.966820487564327,
"median": 26.69907406197067,
"min": 26.49374804466308,
"p90": 26.845236287807374,
"p95": 26.882004355057887,
"p99": 26.95742242818151,
"stddev": 0.09600564296001704
}
}
}
}
```
感谢您的阅读 :)
返回首页
24小时热榜
在一个专注于共享办公和共享空间的家族企业中成长,我发现许多人希望找到一个可以使用一天的共享办公空间。他们并不准备签订长期协议。因此,我创建了LANS,以简化共享办公的过程。
我们的平台允许用户在几秒钟内购买共享办公空间的一日通行证。流程简单:预订通行证,抵达空间,在前台报上你的名字,就可以进入。
我们的位置
目前我们在旧金山与多个共享办公合作伙伴合作。
最近开始向湾区以外扩展。
在旧金山拥有1万名付费用户。
一日通行证的价格在18到25美元之间。
我们观察到的情况
用户经常使用此服务。他们在一周内根据需求和日程安排轮换不同的地点。
对于空间而言,这意味着在工作日的增量使用和新的客流量。
在密集的市中心之外,新空间的入驻通常更快。许多郊区拥有不错的精品共享办公空间,但往往缺乏强大的在线存在感。一日通行证迅速吸引了运营商和用户。
我们正在努力的方向
扩展到更多城市。
在保持质量一致的同时增加供应。
学习哪些产品决策实际上能提高重复使用率。
希望得到HN的反馈:
这与你今天的工作方式有共鸣吗?
你之前使用过共享办公的一日通行证吗?
你会为了这个放弃你的共享办公会员资格吗?
我是一名来自日本的21岁“浪人”(第三年间隔生)。<p>今天是大学入学共同测试——一项每年一次的强制性全国考试,是进入大学的唯一途径。错过这次考试意味着要再等整整一年。<p>在过去的六年里,我为这一场全或无的考试做了准备。但今天早上,我意识到我真正需要的唯一学位是决心。<p>所以,我没有去参加考试。<p>我用我的入学券和多年的努力,换来了创造人工生命的力量。我把过去一年完全投入到Rust和C++的学习中,意识到定义社会的乐趣要比在其中当一个简单的齿轮要激动得多。<p>为了证明——主要是为了我自己——我并不是因为无法应对数学而辍学,而是因为我想解决更困难的问题,我编写了一份“宇宙大学”的虚构入学考试。<p>这份考试结合了非微扰物理学、高级范畴理论和计算形而上学,探讨作为一个异类所带来的存在焦虑。<p>以下是摘要和一个样题。<p>2026年入学考试:计算形而上学系<p>摘要
本次考试考察考生在非微扰物理学、高级范畴理论和计算复杂性方面的流利程度。它将宇宙视为一个遗留代码库,而不是一个物理对象,运行在普朗克尺度的硬件上。<p>核心主题:局部与全局、微扰与非微扰、可计算与不可计算、自我与他者。<p>问题5:宇宙模拟器中的特权提升 [50分]<p>宇宙是一个在量子计算机上运行的遗留模拟,具有普朗克尺度的网格 $\ell_P$。内存根据贝肯斯坦界限在边界上以全息方式分配。攻击者(物理学家)试图通过堆溢出获得根访问权限。<p>(a) 通过黑洞形成进行缓冲区溢出 [10分]<p>贝肯斯坦界限:$S \leq S_{Bek} = \frac{A}{4\ell_P^2}$<p>宇宙的缓冲区被硬编码为 `uint64_t` ($2^{64}$ 位)。<p>(i) 使用 $S_{BH} = \frac{4\pi G M^2}{\hbar c}$,计算越界写入的最小质量 $M_{overflow}$(以 $M_P$ 为单位)。<p>(ii) 显示 $M_{overflow} \sim 10^{9} M_P \approx 20\,\mu\text{g}$(微型黑洞规模)。<p>(iii) 结论:宇宙在运行时没有ASLR。物理常数存储在可预测的地址中。黑洞是堆喷射。<p>您可以在这里阅读完整的考试内容(Gist):
https://gist.github.com/fumi2026/a6d1b9af31e1960448f5333c2a1a1425<p>(注意:我目前正在将这些基本原理实现到一个在iPhone X上本地运行的AI引擎中。演示视频即将发布。)
嘿,HN,
随着Anthropic推出Claude Cowork,关于自主智能体的兴趣再次升温。Cowork在单一智能体的文件管理方面表现出色,但我们正在研究一个不同的问题:当你将多个智能体连接成一个网络时会发生什么?
OpenAgents是一个开源基础设施,用于构建AI智能体网络。可以把它看作是多智能体协作的管道。
核心理念:
- 智能体动态加入网络并发现同伴
- 协议无关:支持WebSocket、gRPC、HTTP、libp2p
- 共享工件(文件、知识库)并具备访问控制
- 兼容任何大型语言模型提供者(Claude、GPT、开源模型)
- 基于模型驱动的架构,支持不同的协作模式
我们将发布一个“智能体协作”模板,包含示例:
- 2个Claude Code智能体协作的聊天室
- 研究团队(编码智能体 + 网络浏览智能体)
- 跨智能体的共享文档编辑
SDK基于Python。通过运行`openagents network start`启动网络,并通过YAML配置或自定义Python连接智能体。
GitHub: [https://github.com/openagents-org/openagents](https://github.com/openagents-org/openagents)
教程: [https://openagents.org/showcase/agent-coworking](https://openagents.org/showcase/agent-coworking)
希望能收到HN的反馈。特别感兴趣的是以下几点:
1. 有用的网络拓扑模式
2. 智能体间通信的安全考虑
3. 与现有智能体框架(如LangChain、CrewAI等)的集成
欢迎提问。
随着Claude Code和Codex等工具在各行业的广泛应用,公司是否能够对其代码库(或产品)声明版权,或者在代码中有大量部分是由大型语言模型(LLMs)生成时施加许可限制?
嗨,HN,我开发了Commander,这是一个用户界面,可以让你在不陷入终端混乱的情况下并行运行多个AI编码代理。
随着编码代理的不断进步,我开始信任它们处理实际工作:功能开发、端到端测试、重构、测试等。自然,我开始同时运行1到3个代理。这时,命令行界面就无法扩展了——终端太多,失去上下文,差异分散。
Commander解决了这个问题。
受到我写这篇文章时首页上那篇帖子启发,我很想了解谁在生产环境中使用DuckDB,以及他们是如何使用的。
我们有一个正在运行的工具使用了DuckDB,我对此非常满意。因此,我不仅希望听到其他人的有趣用例,老实说,我今天相当确定我发现DuckDB存在严重的内存泄漏问题,所以我很好奇其他人是否也注意到了这一点,或者这可能对其他人来说并不那么相关,因为有些人可能在短暂的环境中运行DuckDB管道,比如Lambda等,在这些环境中,内存泄漏可能影响不大。