1作者: redhanuman大约 1 个月前原帖
我之所以构建这个工具,是因为我厌倦了每个AI工具都将我的数据发送到其他服务器。n0x通过WebGPU运行完整的LLM推理,具备自主的ReAct代理、基于您自己文档的RAG,以及通过Pyodide进行沙箱化的Python执行,所有这些都在一个浏览器标签页内完成。 无需账户,无需密钥,无需后端。模型只需下载一次,永久缓存到IndexedDB中。 最大的挑战是为代理循环进行上下文窗口预算,并使WASM向量搜索非阻塞。很高兴能讨论架构。 <p>GitHub: <a href="https://github.com/ixchio/n0x" rel="nofollow">https://github.com/ixchio/n0x</a> | 现场演示: <a href="https://n0x-three.vercel.app" rel="nofollow">https://n0x-three.vercel.app</a>
4作者: dfordp11大约 1 个月前原帖
我花了几周时间整理长期工作场所研究关于人工智能采纳的实际发现,而不是大多数报道中对生产力的乐观预期。 <p>https://medium.com/@dilpreetgrover2/the-ai-productivity-paradox-why-efficiency-is-skyrocketing-while-employees-are-burning-out-3747c44910d3?postPublishedType=initial
1作者: zetbaur大约 1 个月前原帖
我开发了一个工具,可以将PDF银行对账单转换为结构化的Excel文件,以便导入QuickBooks。 银行通常提供约90天的CSV/QBO导出,但PDF对账单可以追溯到5-7年前。需要补账的簿记员没有好的选择——要么手动重新输入所有内容,要么使用在财务布局上会出错的通用PDF转换器。 Bank Parser为摩根大通、美国银行、富国银行和第一资本银行(支票、储蓄和信用卡)提供专用解析器。每个解析器都理解该银行特定的PDF布局,并能提取每笔交易的17个字段,并进行自动余额验证。 技术:Node.js + pdfjs-dist,无需OCR(基于文本的PDF)。总共有8个解析器(4家银行 × 2种账户类型)。 免费试用(200次操作,无需信用卡)。
1作者: rpotluri大约 1 个月前原帖
我从事推理调度工作——KV缓存感知路由、GPU工作节点之间的负载均衡等。我想要一个类似于k9s的工具,但专门用于我的推理栈。市面上没有这样的工具,所以我自己开发了一个。 llmtop是一个用于大型语言模型(LLM)推理工作节点的实时终端仪表板。它抓取vLLM、SGLang和LMCache已经暴露的Prometheus /metrics端点,并将所有信息集中在一个视图中:KV缓存使用情况、队列深度、TTFT/ITL延迟(来自直方图桶的P50/P99)、令牌吞吐量、前缀缓存命中率。采用颜色编码——红色表示需要修复。 ``` brew install InfraWhisperer/tap/llmtop 或者安装github.com/InfraWhisperer/llmtop/cmd/llmtop@latest。 ``` 这是一个单一的二进制文件,不需要Prometheus服务器、Grafana或配置。只需运行llmtop,它会自动发现本地工作节点。 该工具使用Go语言和Bubbletea编写。接下来,我将致力于Kubernetes Pod的自动发现和GPU指标视图的开发。