展示HN:如何使用谷歌的极限AI压缩与Ollama和Llama.cpp1 分•作者: anju-kushwaha•大约 20 小时前•原帖谷歌研究推出的TurboQuant、PolarQuant和QJL(量化约翰逊-林登斯特劳斯)不仅仅是技术上的优化。在Vucense,我们认为这是推断主权的一个里程碑时刻。