最新

巨齿鲨的重新构想：科学家重新审视史前鲨鱼

1 分•作者: gmays•26 天前•原帖

《氛围编码宣言》

1 分•作者: sdf4j•26 天前•原帖

DeepSeek发布了新的V3检查点（V3-0324）

1 分•作者: nsoonhui•26 天前•原帖

排名：按月网站访问量最受欢迎的人工智能工具

1 分•作者: e2e4•26 天前•原帖

杰弗里·戈德堡谈特朗普政府将他加入群聊的经历

21 分•作者: lighttower•26 天前•原帖

三星电子宣布，联合首席执行官韩宗熙已于63岁去世。

1 分•作者: toomuchtodo•26 天前•原帖

3 分•作者: keyle•26 天前•原帖

展示HN：将您的文字转化为美丽的纹身设计

2 分•作者: jsamqiu•26 天前•原帖

该网站提供多种字体，包括纹身字体和多种花哨字体。

从基础原理出发，让深度学习快速发展

1 分•作者: Anon84•26 天前•原帖

向专制主义屈服

2 分•作者: chmaynard•26 天前•原帖

AZsPCs 魔法六边形挑战

1 分•作者: keyle•26 天前•原帖

NextAI 评测 – 自动化的终极人工智能工具包

1 分•作者: richmaven•26 天前•原帖

《快速提升人工智能产品的实用指南》

1 分•作者: jpdus•26 天前•原帖

Zizmor：GitHub Actions 的静态分析工具

1 分•作者: latexr•26 天前•原帖

思维链 Mcp 服务器

1 分•作者: beverm2391•26 天前•原帖

IngressNightmare：Ingress Nginx 中存在 9.8 级严重未认证远程代码执行漏洞

4 分•作者: dgrove•26 天前•原帖

DeepSeek对中国人工智能的启示 [视频]

1 分•作者: lawrenceyan•26 天前•原帖

欧洲航天局发布欧洲发射器挑战赛提案征集通知

1 分•作者: Gravityloss•26 天前•原帖

德国议会投票如同Git贡献图

25 分•作者: mxschll•26 天前•原帖

展示HN：100行Gemma3 LLM实现

1 分•作者: xiphias2•26 天前•原帖

大家好，我想在本地进行LLM推理，但大多数框架都非常复杂。虽然有很多简单的GPT-2实现，但GPT-2毕竟是一个较旧的模型。我查看了transformers的代码库，并尽可能简化了Gemma3的Python实现，同时确保性能不受影响。我相信这能很好地帮助理解如何实现Gemma3模型推理（我计划在未来在同一个仓库中添加其他模型），并且可以根据需要进行改进。我希望未来能够添加量化和GGUF mmap支持，可能还会加快分词器的加载速度，并添加其他表现良好的新模型，同时保持代码简洁、性能优越，并尽可能减少重依赖。

上一页 1...380 381 382 383 384...453 下一页