2作者: quesomaster90002 个月前原帖
一个语言模型可以小到什么程度仍然能够发挥作用?我想知道这个问题,并在假期中有一些闲暇时间来探索。<p>Z80-μLM 是一个字符级语言模型,具有 2 位量化权重({-2,-1,0,+1}),可以在配备 64KB RAM 的 Z80 上运行。整个模型:推理、权重、聊天用户界面,所有内容都可以装入一个 40KB 的 .COM 文件中,你可以在 CP/M 模拟器中运行,甚至希望在真实硬件上也能运行!<p>它不能为你撰写电子邮件,但可以训练成一个简化版的“20个问题”游戏,有时能够保持与用户进行简单而简洁的对话,并展现出独特的个性。<p>--<p>极端的限制让我陷入了思考,并迫使我做出有趣的权衡:三元组哈希(容错拼写错误,但失去词序)、16 位整数运算,以及对训练数据的精心处理,使我能够保持示例的“趣味性”。<p>关键在于量化感知训练,它准确地模拟了推理代码的限制。训练循环同时运行浮点和整数量化的前向传递,并根据模型在量化后知识的保留程度进行评分。权重逐步向 2 位网格推进,使用直通估计器,溢出惩罚与 Z80 的 16 位累加器限制相匹配。在训练结束时,模型已经适应了其限制,因此没有后期量化崩溃的问题。<p>最终,我花了几美元在 Claude API 上生成“20个问题”的数据(见 examples/guess/GUESS.COM),我希望 Anthropic 不会因为我违反服务条款而给我发律师函 ;P<p>不过,祝大家代码高尔夫季节愉快 :)
1作者: shubh-io2 个月前原帖
构建 Dockmate - 一个基于 Go 的 Docker/Podman 容器管理 TUI 应用,使用 bubble-tea TUI 框架。 功能: - 容器管理(启动/停止/重启/删除,查看日志) - 实时容器监控(CPU、内存、磁盘 I/O 等) - 列的查看/隐藏(内存、CPU、网络 I/O 等) - Compose 项目分组 - 支持 Podman 运行时(轻松切换) - 持久化设置(YAML 配置) - 带快捷键的信息/帮助面板 - 可配置的交互式 Shell(/bin/sh、/bin/bash 等) - 支持 Homebrew - 一条命令安装 支持 Linux 和 macOS!! 演示 GIF: [https://github.com/shubh-io/DockMate/blob/main/assets/demo.gif](https://github.com/shubh-io/DockMate/blob/main/assets/demo.gif) GitHub: [https://github.com/shubh-io/DockMate](https://github.com/shubh-io/DockMate)
1作者: lilsquid2 个月前原帖
Hacker News 多年来一直是我的主页和灵感来源。虽然我仍在学习如何构建一个公共网站,但我创建了 DreyX.com,出于一个简单的需求:我想要一种更好的方式来跟踪人工智能新闻,而不需要那些冗余的信息。这个工具真的是一个好奇的读者为其他好奇的读者所打造的。你有什么想法或建议吗?
1作者: william_uk2 个月前原帖
我创建了 Snippets(<a href="https:&#x2F;&#x2F;snippets.dev" rel="nofollow">https:&#x2F;&#x2F;snippets.dev</a>),这是一个以键盘为主的便签工具,用于存储代码片段、草稿和快速笔记。所有内容都保存在浏览器的本地存储中(localstorage)。您还可以将其安装为渐进式网页应用(PWA),以便快速访问。<p>欢迎反馈,特别是在用户体验、快捷键以及您希望下一步添加的功能方面。
3作者: UnmappedStack2 个月前原帖
我一直在开发一个小型的开源搜索引擎,名为nilch。我注意到几乎所有知名的搜索引擎,包括一些替代选项,都是由不同规模的公司运营,目标是盈利,因此它们要么在搜索结果中充斥广告,要么向用户收费。我对此非常不满,因为搜索是互联网的基础,不应该商业化,所以我选择以非营利的方式运营,并希望通过捐款来维持生存。此外,我个人对搜索结果中的人工智能感到厌倦,因此我去掉了这部分内容,并希望支持DuckDuckGo的bangs功能,因此它支持所有相关功能。像许多替代搜索引擎一样,它是完全私密的。 遗憾的是,目前它没有自己的索引,而是使用Brave搜索API。一旦我有足够的财力,我非常希望能够从零开始构建一个完全新的开源索引,以及一个开源的排名和搜索算法来支持它。 我在Reddit上发布了这个项目,得到了大量的反馈,并实现了许多功能请求,因此我也非常希望听到你们的想法、批评和bug报告。谢谢你们,抱歉发了这么长的帖子! [1] [https://github.com/UnmappedStack/nilch](https://github.com/UnmappedStack/nilch)
2作者: viru72 个月前原帖
我一直在尝试一种利用人工智能辅助的方法来检测网络流量中的模式。 为了提供一些背景信息,我维护一个名为“Phone Home Detector”的项目,该项目分析IP地址对之间的流量。它将流量聚合成一分钟的时间段,并根据字节计数和传输间隔应用一套固定规则。 最近,我原型设计了一个扩展,通过MCP工具公开传输大小和时间数据,使其可以被大型语言模型(LLM)查询。我的目标是探索LLM是否能够识别出仅通过静态规则难以捕捉的模式。 这项工作仍处于实验阶段,我尚未确信它比固定规则的方法有明显的改进。尽管如此,我觉得这很有趣,并且可能为进一步探索奠定基础。以下是它生成的一个摘要示例: 发送到IP地址91.189.91.49的数据大小在初始大小为168之后,大多保持在200的一致性,而发送的间隔则没有明显的模式变化。
1作者: huydotnet2 个月前原帖
这是我为了好玩而创建的一个项目:https://redditwithagents.vercel.app/ 截图: https://i.imgur.com/JFMFBNF.png 这个项目基本上是一个模仿Reddit界面部分功能的网页应用,允许你在浏览器中与大型语言模型(LLM)代理进行讨论。 所有的LLM API调用都在浏览器中进行,因为这个应用没有后端。你也可以配置应用使用你本地的LLM API。 例如,要使用LM Studio,请确保你在本地提供模型,并勾选两个选项:“启用CORS”和“在本地网络上提供服务”。 以下是它的样子:https://i.imgur.com/TfzIjl4.png 然后前往应用的设置页面,设置以下配置: ``` API URL: http://192.168.<whatever>.<your>:1234/v1 API Key: 你设置的任意密钥 Model: 类似于 openai/gpt-oss-20b ``` 你也可以在这里查看源代码:https://github.com/huytd/reddit-with-agents