1作者: adinhitlore4 天前原帖
我刚刚注意到,在慢速CPU上训练数百万个参数实际上只需大约5分钟……但在你称呼Yudkowsky为“结束了”之前,有一点重要的说明:主要瓶颈是语料库的大小,参数只是“聪明才智”,但在信息有限的情况下,它是无能为力的。 无论如何,这是项目链接: [https://github.com/bggb7781-collab/lrnnsmdds/tree/main](https://github.com/bggb7781-collab/lrnnsmdds/tree/main) 几点说明: 1. 这是一个单一的C文件,没有依赖项。以下是所有的“依赖项”,甚至没有自定义头文件(直接从单个C文件的顶部复制粘贴): ```c #define _POSIX_C_SOURCE 200809L #include <stdio.h> #include <stdlib.h> #include <string.h> #include <math.h> #include <time.h> #include <stdint.h> #include <stdbool.h> #include <float.h> #include <getopt.h> #include <errno.h> ``` 目前代码在一个文件中有4136行,仅此而已。 2. 在Windows上编译的最简单方法:下载Cygwin([https://www.cygwin.com/](https://www.cygwin.com/)),然后导航到你的lrnnsmdds.c文件所在的目录,运行gcc并加上一些优化,例如: ```bash gcc -std=c17 -O3 -march=native --fast-math -o lrnn lrnnsmdds.c -lm ``` 在Linux上只需运行gcc,如果由于某种原因你在Linux上没有gcc,可以运行`sudo apt-get install gcc -y`,或者其他类似的命令…… 在Apple上:我不知道,或者可以使用vmware安装ubuntu,然后运行它。 当然,你可以“git clone”并进入目录,但再说一次:这只是一个文件!直接复制它…… 这个仓库包含一个小的玩具语料库,我借用了(希望不是抄袭!)我最喜欢的书之一《星际王者》(Star Kings)中的名字“John Gordon”。仅复制了名字,内容是独特的(嗯,几句我自己写得很差的句子……)。显然,在如此小的语料库上,它会过拟合并导致抄袭,唯一的目标是检查一切是否正常运行,而不是它是否是AGI。如果你想生成独特且有意义的文本,你需要自己的100KB以上的语料库。 3. 为什么/什么/何时/如何? 我相信GitHub仓库在功能、用途和目标上是自解释的,但为了总结一下: 我主要的动机是创建一个仅在CPU上运行的快速替代品,因此你会看到在C而不是Python中完成这一任务的奇特/不易之处,以及缺乏依赖项。此外,我希望它也是一个聪明的替代品,因此你会看到所有这些功能堆叠得比90年代的宝马850还要多。不过,“水库”是最具新颖性的特征,它提供快速的精确回忆,可能与RWKV 8或最新的Mamba不同,实际上,架构SMDDS的名称来自于实现的特征的首字母: * S. SwiGLU通道混合(更连贯) * M. 多尺度令牌移动(更大的上下文) * D. 依赖数据的衰减与低秩(在大上下文中的速度) * D. 动态状态检查点(更快/线性生成) * S. 插槽记忆水库(完美回忆,类似于变压器)。 如果你遇到任何问题,直接给我发邮件(最简单)。 好、坏、丑: 这是一种或多或少有效的文本到文本的替代架构,它并不试图模仿变压器或LSTM、Mamba、RWKV,尽管它与它们共享许多特征——坏的一点是它并不是特别快,如果你有Ryzen/i7 16核或其他配置,并且有耐心,可以尝试通过单词标记器和低困惑度(低于1.2……)在几本小书上训练它,看看它是否看起来更聪明/更快。由于这是开源的,显然希望能够改进:使其支持CUDA,改进功能,移植到Python等。 根据许多因素,我可能会在7月、8月、9月推动版本2。目前我的重点将是测试和扩展,因为功能很多,在我测试的两台笔记本电脑(Windows/Cygwin和Ubuntu)上编译时没有任何警告,速度与变压器相当,快10倍!
1作者: dweekly4 天前原帖
Netgear Orbi WiFi 7 节点在每个信标中广播一个包含父节点 MAC 地址的 Qualcomm 供应商信息扩展(IE)(8C:FD:F0)。我捕捉到了一个实时的星形到菊花链的重定向,并通过三个 API 进行了确认。这个信息没有文档记录,在 Wireshark 中也没有,字段映射和文章中的开放问题。<p>相当不错:你甚至可以在没有连接到任何接入点的情况下看到整个布局!
2作者: dtran4 天前原帖
在看到昨天关于使用 Git 启发式方法作为探索代码库第一步的深刻帖子后,我给几个朋友发了消息,询问他们今天是如何探索代码库的。我们都只是把 Claude 或 Codex 指向代码库,然后开始提问。我意识到,没有 Claude Code 的帮助,我几乎不再阅读文档、浏览 GitHub 文件或在本地探索代码库了。但使用大型语言模型(LLMs)来帮助我们学习和理解代码,而不仅仅是编写代码,似乎仍然没有得到充分探索。 几个月前,我尝试构建一个 Claude 代码命令,利用 LLM 来引导我“飞过”一个代码库,带我找到有趣的代码部分,并在导航文件时为它们叙述解释。这并没有真正奏效,部分原因是我对阅读文档和代码的注意力已经降到历史低点。我看到 Devin 发布了 Deepwiki,试图使用它,但通常没有取得太大进展。最近,我尝试让这个过程变得有趣:生成一个游戏,诱使我真正开始探索代码库。我设计了一个受《俄勒冈小径》启发的游戏,在游戏中我阅读代码片段并回答 Claude 生成的问题。你可以在这里试试:<a href="https://www.davidtran.me/coderegon-trail/" rel="nofollow">https://www.davidtran.me/coderegon-trail/</a> 我一直乐于将其指向各种代码库,尤其是那些获得很多关注和星标但并不一定有实际使用或贡献的项目。我将其指向了一些我和朋友们标记过但从未探索的项目,以及一些到目前为止 2026 年的顶级 Show HN 项目,这些项目链接到开源代码库。我想看看这是否对那些在阅读代码方面感到困难的人有趣。它在处理 PR 时有点效果,但这似乎是一个相当不同的问题,所以我欢迎任何想法。 在我打这个 Show HN 的时候,我意识到如果这个项目不是开源的,那将是讽刺的,所以我急忙尝试稍微整理一下代码库,并将命令指向它自己的源代码。你可以在这里玩递归小径游戏:<a href="https://www.davidtran.me/coderegon-trail/" rel="nofollow">https://www.davidtran.me/coderegon-trail/</a>,或者在这里查看 GitHub 代码库: 如果有任何不准确之处、错误,或者你希望我在不自己设置的情况下添加一个代码库,请告诉我! [1] <a href="https://news.ycombinator.com/item?id=47687273">https://news.ycombinator.com/item?id=47687273</a>
8作者: astr0n0m3r4 天前原帖
我去IMDb查找一些信息,然后立刻收到了一封邮件,通知我注册了一个新账户。我可能在另一个浏览器标签页中打开了amazon.com,但我并没有采取任何行动去创建这个账户。根据我所了解,亚马逊关联账户是一个新事物。 删除账户的正常步骤在亚马逊关联账户上并不适用,他们会引导你到amazon.com的账户设置,而那当然是难以理解的。亚马逊的客服人员甚至不知道IMDb是什么。 只是一个警告。这与黑暗模式或恶化体验是不同的。
1作者: hjconstas4 天前原帖
我一直在研究其他的推广渠道,并且在网站的联系表单推广方面取得了一些成功。因此,我昨天制作了这个自动表单填写工具。如果有人有兴趣试用,请告诉我。有没有人尝试过制作类似的工具? 我发现开放式爪子(open claw)根本无法绕过验证码,而且在长期运行时容易分心。 https://www.outreacheasy.com/
1作者: ashitlerferad4 天前原帖
我为东加勒比海岛屿建立了一个天气和飓风追踪网站(<a href="https://dewedda.com" rel="nofollow">https://dewedda.com</a>)。使用了PHP、MySQL、Cloudflare、Visual Crossing API和Leaflet.js进行地图展示。 有趣的部分并不是技术栈,而是意识到在为特定地区构建时,解读层的重要性。风速描述、“体感温度”计算、天气状况总结等,默认都是针对温带气候进行调整的。我正在为东加勒比海的受众重新调整这些内容。 我写下了我所学到的内容:<a href="https://hydn.dev/82-degrees-feels-like/" rel="nofollow">https://hydn.dev/82-degrees-feels-like/</a>