最新

Wolfspeed 实现了 300mm 碳化硅 (SiC) 技术突破

1 分•作者: osnium123•28 天前•原帖

苹果：你（仍然）不理解Vision Pro

1 分•作者: m463•28 天前•原帖

更好的凸包

1 分•作者: handfuloflight•28 天前•原帖

用氯胺酮治疗爆炸头综合症

1 分•作者: wjb3•28 天前•原帖

选择无聊的技术（2015）

1 分•作者: tarasyarema•28 天前•原帖

《煤气镇解码》

24 分•作者: alilleybrinker•28 天前•原帖

问HN：Archive.today的奇怪行为？

2 分•作者: rabinovich•28 天前•原帖

archive.today 最近（我大约三天前注意到的）开始自动向某个人的博客的 CAPTCHA 页面发起请求。以下是我所说内容的截图：https://files.catbox.moe/20jsle.png 相关的 JavaScript 代码是： ```javascript setInterval(function() { fetch("https://gyrovague.com/?s=" + Math.round(new Date().getTime() % 10000000), { referrerPolicy: "no-referrer", mode: "no-cors" }); }, 300); ``` 查看这个博客，似乎只有一篇文章提到 archive.today——“archive.today：追踪互联网神秘游击档案员”（https://gyrovague.com/2023/08/05/archive-today-on-the-trail-of-the-mysterious-guerrilla-archivist-of-the-internet），在这篇文章中，博客的作者挖掘了一些关于 archive 拥有者的信息。所以这或许是一种报复/拒绝服务攻击尝试/故意浪费他们带宽以回应这篇文章？也许是试图让他们沉默并迫使他们删除文章？但如果真是这样，我有很多疑问。比如，为什么 archive 的拥有者会在文章发布 <i>2.5 年</i> 后才这样做？或者他们为什么会这样做，他们难道不知道斯特赖桑效应吗？我很困惑。

ChromaDB 探索器

9 分•作者: arsentjev•28 天前•原帖

请访问以下链接： [https://github.com/stepandel/chroma-explorer](https://github.com/stepandel/chroma-explorer)

训练我的智能手表以追踪智力

66 分•作者: dmvaldman•28 天前•原帖

扩展长期运行的自主编码

31 分•作者: samwillis•28 天前•原帖

pyca/cryptography 的 OpenSSL 状态

20 分•作者: SGran•28 天前•原帖

Ui.dev与Fireship强强联手

1 分•作者: JustSkyfall•28 天前•原帖

德国与欧洲伙伴一起向格林兰部署军队。

1 分•作者: consumer451•28 天前•原帖

我们的首个公共公园：被遗忘的墓地历史（2011）

1 分•作者: toomuchtodo•28 天前•原帖

从简约到华丽，再到简约

1 分•作者: nikodunk•28 天前•原帖

展示HN：quick-sync。使用WebRTC的类似TikTok的视频切换功能

1 分•作者: Sean-Der•28 天前•原帖

超宽表的分布式SQL引擎

1 分•作者: synsqlbythesea•28 天前•原帖

在进行机器学习特征工程和多组学数据处理时，我遇到了一个实际限制。在某个时刻，问题不再是“有多少行”，而是“有多少列”。列数从几千到几万，有时甚至更多。我在实践中观察到： - 标准SQL数据库通常限制在大约1000到1600列。 - 像Parquet这样的列式格式可以处理宽度，但通常需要Spark或Python管道。 - OLAP引擎速度很快，但通常假设相对较窄的模式。 - 特征存储通常通过将数据拆分为连接或多个表来解决这个问题。在极宽的情况下，元数据处理、查询规划甚至SQL解析都会成为瓶颈。我尝试了一种不同的方法： - 不使用连接 - 不使用事务 - 列分布而不是行 - 将SELECT作为主要操作通过这种设计，可以在具有数十万到数百万列的表上运行原生SQL选择，并且在访问部分列时具有可预测的（亚秒级）延迟。在一个小集群（2台服务器，AMD EPYC，每台128 GB内存）上，粗略的数据如下： - 创建一个100万列的表：约6分钟 - 插入一个包含100万值的单列：约2秒 - 在约5000行中选择约60列：约1秒我很好奇这里的其他人是如何处理超宽数据集的。你们是否见过在这种宽度下能够顺利工作的架构，而不需要依赖繁重的ETL或复杂的连接？

数据中心真是令人惊叹，但大家都讨厌它们。

1 分•作者: rbanffy•28 天前•原帖

《时代》记者深入战区网络诈骗中心

2 分•作者: smurda•28 天前•原帖

Dokploy使用一个共享的Swarm网络，并且数据库密码是硬编码的。

1 分•作者: computergert•28 天前•原帖

上一页 1...418 419 420 421 422...4800 下一页