2作者: cepstrum9大约 2 个月前原帖
有一类文本,它的大小超出了上下文窗口的限制,但又不足以使用向量数据库。这包括代码库、笔记文件夹、Slack 导出等。我开发了一个小库——raglet,来解决这个问题。 你可以在 Python 中使用它,例如: ```python from raglet import RAGlet rag = RAGlet.from_files(["docs/", "notes.md"]) results = rag.search("我们对 API 设计的决定是什么?", top_k=5) rag.save("my-notes") ``` 可以在任何地方加载: ```python rag = RAGlet.load("my-notes") ``` 它使用本地嵌入(sentence-transformers,无需 API 密钥),并保存到一个可以进行 git 提交的普通目录。 基准测试的结果比我预期的更有趣: - 1 MB (~262K tokens) | 构建时间 3.5 秒 | 搜索时间 3.7 毫秒 - 10 MB (~2.6M tokens) | 构建时间 35 秒 | 搜索时间 6.3 毫秒 - 100 MB (~26M tokens) | 构建时间 6 分钟 | 搜索时间 10.4 毫秒 限制:目前仅支持 .txt 和 .md 文件(PDF/DOCX 是下一个目标),没有文件更改检测,构建时间在 ~100 MB 时会变得不便。 这对你的工作流程有什么帮助呢?
1作者: mindquantai大约 2 个月前原帖
我一直在思考新市场叙事是如何形成的。<p>不是那些大家已经在讨论的显而易见的叙事,而是早期阶段——当一个主题或股票代码悄然开始在讨论中越来越多地出现,直到它变得主流。<p>大多数交易工具关注的是价格、指标或信号。但市场往往是因为关注度和叙事先建立起来才会发生变化。<p>因此,我一直在尝试一个小系统,试图跟踪以下内容: • 股票提及的突然增加 • 讨论一个主题的独立参与者数量 • 讨论是否在多个时间窗口中持续存在 • 一个叙事周围的关注度增长速度<p>这个系统的目标不是生成买入/卖出信号,而是理解市场关注度如何随时间演变。<p>最近,我还在探索一些想法,比如: • 叙事阶段(出现 → 扩展 → 顶峰 → 衰退) • 不同社区之间的关注度持续性 • 关注度的变化是否往往会先于价格变动<p>这个项目目前是一个不断发展的研究工具,我们称之为MindQuant AI。<p>我们的想法是,理解市场的工具不应该是静态的——因为市场中的叙事和行为是不断变化的。<p>所以我很好奇其他人对此的看法。<p>如果你在构建一个市场情报系统,你希望它跟踪哪些信号?
1作者: ComeBertrand大约 2 个月前原帖
与AI编码助手合作意味着我现在需要处理比以前更多的git工作树。我开发了yawn来使这一切变得可管理:它可以发现你所有的git项目和工作树,让你可以模糊选择一个(fzf、rofi等),并打开它。工作树的创建会处理分支解析,复制未跟踪的配置文件,如.env,并自动运行设置命令。 这个工具本身并没有集成AI,这是有意为之。项目切换和工作树管理只是基础功能,我希望有一个能够很好地完成这些工作的工具,而不对你在其中的操作有任何偏见。
1作者: Siri_D大约 2 个月前原帖
我们发布了一个免费的命令行工具,旨在应对PinchTab——一种利用Chrome开发者工具协议的浏览器劫持技术,使攻击者(或被攻陷的AI代理)能够悄无声息地访问实时浏览器会话。没有恶意软件签名,没有进程注入。大多数终端检测和响应(EDR)系统根本无法识别它。 Unpinched是一个时点扫描工具——可以把它想象成针对PinchTab存在的nmap。它是一个单一的Go二进制文件,无需安装,运行时间约为3秒。 它检查四个方面: - 本地端口是否存在PinchTab HTTP API服务器(带签名验证) - 正在运行的进程是否与已知的PinchTab二进制文件名匹配 - 本地地址localhost:9222上是否存在未认证的CDP暴露 - 在macOS、Linux和Windows上的已知文件系统工件路径 该工具还作为GitHub Action发布,因此您可以在扫描结果干净的情况下进行部署。 GitHub链接: [https://github.com/Helixar-AI/Unpinched](https://github.com/Helixar-AI/Unpinched) 如果您对CDP基础攻击为何能够躲避传统安全防护系统的研究感兴趣,可以查看这里:[https://helixar.ai/press/pinchtab-stealth-browser-attacks-your-security-stack-cannot-detect/](https://helixar.ai/press/pinchtab-stealth-browser-attacks-your-security-stack-cannot-detect/) 欢迎就检测逻辑或威胁模型提出问题。
3作者: gbro3n大约 2 个月前原帖
Agent Kanban 具有四个主要功能:<p>在 VS Code 中集成 GitOps 和团队友好的看板<br>通过 @kanban 命令进行结构化的计划/待办事项/实施<br>利用您现有的代理工具,而不是尝试捆绑一个内置的工具<br>.md 任务格式提供了一个永久(可编辑)的真实来源,包括考虑因素、决策和行动,能够抵御上下文的衰退。