问HN:到2025年,您自托管的LLM技术栈是什么样的?
在网络开发蓬勃发展的早期,总有一些常用的技术栈,比如 Postgres + Django + jQuery,或者 .NET + Bootstrap + SQLite。多年来,我们积累了成熟的技术和模式,比如 MVC、SPA 等等。
现在,随着本地大型语言模型(LLMs)的兴起,我在想今天的相应技术栈是什么样子的。
包括模型、运行时、硬件和其他工具。
这些是否能够与 Claude、ChatGPT 或 Gemini 等竞争呢?
谢谢!
查看原文
Back when web development was taking off, there was always a go-to stack — something like Postgres + Django + jQuery, or .NET + Bootstrap, SQLITE. Over the years we had proven tech and proven patterns like : MVC, SPA etc...<p>Now that local LLMs are gaining traction, I’m wondering what the equivalent stack looks like today.<p>Models, Runtime, hardware and other tools.<p>That could rival the Claudes, ChatGPTs or Geminis, etc<p>Thanks