1作者: notepad0x902 个月前原帖
嗨,HN, 我一直在了解Meshtastic,这个想法听起来很棒。但我并没有具体的使用案例,不知道它是否仍然有用? 你们在公共频道上有没有什么成功的经验?它和业余无线电类似吗?
3作者: gbram2 个月前原帖
嗨,HN, 我创建了StreamHouse,这是一个开源流媒体平台,它用直接写入S3的方式替代了Kafka的代理管理存储。目标是:保持相同的语义,成本却大幅降低。 它是如何工作的:生产者批量并压缩记录,一个无状态的服务器管理分区路由和元数据(开发环境使用SQLite,生产环境使用PostgreSQL),而数据段直接存储在S3中。消费者从S3读取数据,并使用本地段缓存。无需管理代理磁盘,也无需调整复制因子——S3提供了11个9的持久性,开箱即用。 目前的功能包括: - 具有批处理、LZ4压缩和偏移量跟踪的生产者API(每秒62K条记录) - 具有消费者组、自动提交和多分区分发的消费者API(每秒30K+条记录) - 兼容Kafka的协议(与现有Kafka客户端兼容) - REST API、gRPC API、CLI和网页用户界面 - Docker Compose设置,可以在5分钟内本地试用 这个成本模型是我开发这个项目的动力。Kafka的存储成本与复制因子 × 保留时间 × 数据量成正比。而使用S3,每GB每月仅需$0.023,存储1TB事件的成本约为每月$23,而不是在代理EBS卷上花费数百美元。 该项目使用Rust编写,约50K行代码,分布在15个库中。采用Apache 2.0许可证。 GitHub链接:[https://github.com/gbram1/streamhouse](https://github.com/gbram1/streamhouse) 我很乐意回答关于架构、权衡或我在构建这个项目中学到的知识的问题。
3作者: roman102 个月前原帖
在谷歌从事数据科学工作后,我创建了GeoVector,旨在系统地测量品牌在AI生成答案中的表现。我们的方法基于研究,采用基于已发布的地理文献的调整位置评分。Y Combinator报告就是我们进行分析的一个例子。 我们在ChatGPT和Gemini上运行了150个提示,跟踪了21个品牌。让我们感到惊讶的三件事: 1. 尽管Y Combinator在谷歌上的影响力更强,但在ChatGPT上,Techstars的排名却高于YC。 2. Y Combinator自己的网站仅占940个AI来源引用中的8个。 3. 驱动竞争对手可见性的引用来源中,最多的竟然是一篇来自pitchwise.se的博客文章,而不是任何加速器自己的网站。 完整报告请查看链接,无需注册。GeoVector可以为任何品牌或行业进行此类分析。
1作者: tuwenbo01202 个月前原帖
我正在开发Courtyard,这是一款针对macOS的桌面应用,旨在简化在Apple Silicon上进行本地LLM工作流程的繁琐过程。 动机:我厌倦了为了在我的Mac上运行一个简单的LoRA微调而需要处理多个Python命令行脚本、JSONL格式和环境问题。 Courtyard本质上是一个围绕mlx-lm构建的用户界面包装器,结合了数据准备工具。它可以处理: - 数据集格式化和清理(隐私过滤、去重)。 - 通过MLX在Apple Silicon上进行本地LoRA微调。 - 集成的聊天用户界面,用于对比基础模型与微调适配器的A/B测试。 - 导出为GGUF格式或直接导出到Ollama运行时。 技术栈为Tauri 2.x + React + Rust + Python(mlx-lm)。它是完全开源的(AGPL)。 代码库: [https://github.com/Mcourtyard/m-courtyard](https://github.com/Mcourtyard/m-courtyard) 我很想听听你对架构、MLX实现或遇到的任何边缘案例的看法。欢迎提出技术问题。