1作者: DeborahEmeni_6 天前原帖
我一直在使用 ArgoCD 和 GitHub Actions 进行 GitOps,最开始效果很好。但一旦我开始管理多个集群,情况变得更加复杂: - 同步速度变慢 - 需要启动独立的 ArgoCD 实例 - CI/CD 感觉与 GitOps 流程脱节 我想听听其他人在大规模实施 GitOps 时的做法。你们是继续使用 Argo 并增加工具层,还是转向 Flux 或自定义设置?任何经验教训都欢迎分享。
8作者: hp_hovercraft846 天前原帖
我开发了一个用于带有 TTL(生存时间)和 LRU(最近最少使用)缓存的 Ruby gem。它是线程安全的,并且在我自己的应用中非常有用。希望能得到一些反馈:<a href="https:&#x2F;&#x2F;github.com&#x2F;mishalzaman&#x2F;memo_ttl">https:&#x2F;&#x2F;github.com&#x2F;mishalzaman&#x2F;memo_ttl</a>
6作者: segmenta6 天前原帖
嗨,HN!我们是 Arjun、Ramnique 和 Akhilesh,我们正在构建 Rowboat(<a href="https://www.rowboatlabs.com/">https://www.rowboatlabs.com/</a>),这是一个用于构建和管理多智能体系统的 AI 辅助集成开发环境(IDE)。您可以从一个单一的智能体开始,然后扩展到多个智能体团队协作,使用 MCP 工具,并随着时间的推移不断改进——这一切都通过基于聊天的副驾驶实现。 我们的代码库在 <a href="https://github.com/rowboatlabs/rowboat">https://github.com/rowboatlabs/rowboat</a>,文档在 <a href="https://docs.rowboatlabs.com/">https://docs.rowboatlabs.com/</a>,这里有一个演示视频:<a href="https://youtu.be/YRTCw9UHRbU" rel="nofollow">https://youtu.be/YRTCw9UHRbU</a> 越来越明显的是,现实世界中的智能体系统在多个智能体协作时效果最佳,而不是让一个智能体尝试做所有事情。这并不令人惊讶——这有点像优秀的代码由多个各自完成一项任务的函数组成,而不是把所有内容塞进一个函数里。 例如,当不同的智能体处理专业任务时,旅行助手的效果最佳:一个智能体寻找最佳航班,另一个优化酒店选择,第三个组织行程。这种模块化的方法使得系统更易于管理、调试,并随着时间的推移不断改进。 OpenAI 的 Agents SDK 提供了一个简洁的 Python 库来支持这一点,但构建可靠的智能体系统需要不断的迭代和调整——例如,更新智能体指令(这可能会迅速变得复杂,像实际代码一样),连接工具,测试系统并整合反馈。Rowboat 就是一个用于实现这一切的 AI IDE。Rowboat 对 AI 智能体的意义就像 Cursor 对代码的意义。 我们采用了类似代码的方式来处理智能体指令(提示)。有特殊的关键字可以直接引用其他智能体、工具或提示——这些在用户界面中会被高亮显示。副驾驶是创建和编辑这些指令的最佳方式——每次更改都会显示类似代码的差异。 您可以通过集成任何 MCP 服务器或通过 webhook 连接您自己的函数来为智能体提供工具访问权限。您可以通过在智能体指令中使用 '@提及' 来指示智能体何时使用特定工具。为了实现快速测试,我们添加了一种使用 LLM 调用模拟工具响应的方法。 Rowboat 游乐场让您在构建智能体时进行测试和调试。您可以实时查看智能体转移、工具调用和工具响应。副驾驶拥有聊天的上下文,并可以根据反馈改进智能体指令。例如,您可以说“智能体不应该在这里做 x。修复这个”,副驾驶可以去进行修复。 您可以通过 HTTP API 或 Python SDK(‘pip install rowboat’)将 Rowboat 中构建的智能体系统集成到您的应用程序中。例如,您可以使用 Rowboat 构建面向用户的聊天机器人、企业工作流程和员工助手。 自 2018 年 GPT-1 发布以来,我们一直在与 LLM 合作。最近,我们在我们的最后一家 AI 初创公司被 Coinbase 收购后,构建了 Coinbase 的支持聊天机器人。 Rowboat 采用 Apache 2.0 许可证,您可以完全自由地自行托管、修改或扩展它。 我们很高兴与大家分享 Rowboat。我们期待听到您的想法!
15作者: Adityav3696 天前原帖
大家好,我们是Adi和Arnav。几个月前,我们在尝试让大型语言模型(LLMs)回答研究论文和说明手册中的问题时遇到了瓶颈。一切运作良好,直到答案藏在PDF中嵌入的图像或图表里。即使是GPT-4o也无法处理(我们最近用O3进行了相同的测试,结果也令人惊讶地失败了)。简单的RAG(检索增强生成)管道只提取了一些文本片段,忽略了其他内容。 我们使用了一份包含IRR与频率图的发明披露PDF(<a href="https://drive.google.com/file/d/1ySzQgbNZkC5dPLtE3pnnVL2rW_9aTeuG/view?usp=sharing" rel="nofollow">链接</a>),并问GPT:“从图中可以看出,IRR在什么频率下达到最大?”我们最初在gpt-4o上尝试这个问题,但在撰写这段文字时使用了新推出的原生多模态模型o4-mini-high。在经过30秒的思考后,它请求了一些澄清,然后生成了有缺陷的代码,从错误的页面提取数据,仍然无法回答这个问题。我们在这里写下了完整的故事和截图:<a href="https://docs.morphik.ai/blogs/gpt-vs-morphik-multimodal">链接</a>。 我们感到相当沮丧,因此决定自己来解决这个问题。 我们构建了Morphik,以便在像PDF这样的文档上进行多模态检索,其中图像和图表与文本同样重要。 为此,我们使用了Colpali风格的嵌入,将每个文档页面视为图像,并生成多向量表示。这些嵌入捕捉了布局、排版和视觉上下文,使得检索能够获取整个表格或示意图,而不仅仅是附近的标记。结合向量搜索,这样可以精确检索到包含相关图表的页面,并将其作为图像传递给LLM,以获得相关答案。它能够使用本地运行的8B llama 3.1 vision回答问题! 早期的制药测试者向我们的系统提出了诸如“哪些50毫克的EGFR抑制剂显示出≥30%的肿瘤缩小?”这样的查询。我们正确返回了相关的表格和图表,但仍然遇到瓶颈,无法跨多个报告连接信息。因此,我们构建了一个知识图谱:我们在文本和图像中标记实体,规范同义词(如Erlotinib → EGFR抑制剂),推断关系(例如,administered_at,yields_reduction),并将所有内容拼接成一个图谱。现在,单个查询可以跨文档遍历该图谱,并提供连贯的跨文档答案以及正确页面的图像。 为了说明这一点,也为了好玩,我们在这里构建了100篇Paul Graham的文章图谱:<a href="https://pggraph.streamlit.app/" rel="nofollow">链接</a>。您可以搜索各种节点(例如,创业、Sam Altman、Paul Graham等),并查看相应的连接。在我们的系统中,我们创建图谱并存储相关的文本片段以及实体,因此在查询时,我们可以提取相关实体,在图谱上进行搜索,并提取所有连接节点的文本片段,从而改善跨文档查询。 对于较长或多轮查询,我们添加了持久的KV缓存,存储来自变换器注意力层的中间键值状态。这样,我们不必每次都从头计算注意力,而是重用先前的层,加快重复查询的速度,并让我们处理更长的上下文窗口。 我们在MIT Expat许可证下开源:<a href="https://github.com/morphik-org/morphik-core">链接</a>。 我们很想听听你们的RAG恐怖故事,哪些有效,哪些无效,以及对Morphik的任何反馈。我们随时欢迎讨论。
2作者: ivanramos6 天前原帖
我创建了SEOfolio来解决我作为SEO所面临的问题:缺乏一个专门的作品集平台。<p>设计师有Behance,开发者有GitHub,而我们(SEO专业人士)却浪费了大量时间用多个工具的截图来制作案例研究,这些内容很快就会过时。<p>SEOfolio通过以下方式解决了这个问题:<p>- 创建一个集中化的SEO项目作品集 - 通过自动更新的可视化图表展示客户流量增长 - 在一个界面中记录策略和结果 - 提供一个共享链接,便于在客户提案时使用<p>该平台消除了保持作品集更新的维护负担。<p>非常希望能得到其他SEO专业人士和其他行业人士的反馈。
1作者: Amartya_jha6 天前原帖
在过去的一年里,我们一直在构建 CodeAnt AI,并与那些在代码审查质量和速度上遇到困难的工程团队紧密合作。 手动代码审查既慢又重复。开发者常常会忽视更深层次的问题,因为如今的审查主要关注变更内容,而不是变更实际影响的内容。 随着越来越多的代码由人工智能生成,这种情况变得更加糟糕:更大的合并请求(PR)、更快的开发周期,以及更少的团队上下文。 我们希望重新思考代码审查的方式: 我们不仅仅关注差异,而是构建代码库的结构化知识,理解基础设施的变化,并分析影响范围——这一切都是在合并请求时自动完成的。 ### CodeAnt AI 的功能(技术概述) **代码库索引和图谱构建:** 当一个代码库被添加时,我们会对整个代码库进行索引,并构建抽象语法树(AST)。 我们会映射文件、函数、类型和模块之间的上下游依赖关系。 我们为多种语言运行自定义的轻量级语言服务器,以支持: - `go_to_definition` 查找符号声明 - `find_all_references` 定位使用点 - `fetch_signatures` 和 `fetch_types` 提供更丰富的语义上下文 **合并请求分析:** 当创建合并请求时: - 我们检测差异。 - 我们提取任何变更符号的相关上下游上下文。 - 我们收集连接的函数定义、使用位置、接口和涉及的基础设施文件。 大型语言模型(LLM)调用语言服务器(几乎像开发者手动导航一样)来推理这些结构化上下文,而不仅仅是原始差异。 **代码质量分析:** 除了 AI 推理外,我们在合并请求中叠加传统的静态检查: - 检测重复代码模式 - 查找死代码和未使用的代码块 - 标记过于复杂的函数 目标:使代码检查和 AI 建议无缝衔接,而无需额外的工具。 **安全性和基础设施上下文:** 我们维护一个内部策划的应用安全问题数据库,并与 OWASP 和 CWE 进行映射。 我们在以下方面运行基础设施即代码(IaC)安全检查: - Terraform、Kubernetes、Docker、CloudFormation、Ansible 您可以选择连接云账户(AWS、GCP、Azure): - 我们扫描您的实时云基础设施以查找配置错误 - 我们将云资源上下文引入合并请求(例如,当 Terraform 合并请求更改实时 VPC 规则时,我们会显示潜在的影响范围)。 - 我们通过每 20 分钟扫描国家漏洞数据库(NVD)来监控过时(EOL)库和第三方包的漏洞,并在合并请求时进行标记。 简而言之: 我们尝试自动化一个经验丰富的开发者实际审查变更的方式: → 理解代码结构 → 理解代码的使用位置 → 理解基础设施/云的影响 → 在合并前捕捉质量、安全性和复杂性问题——无需额外的仪表板或工具。 使用 CodeAnt AI 的团队报告称,代码审查速度提高了 50% 以上,同时更早发现更深层次和更具可操作性的问题。 我们非常欢迎 HN 社区的反馈——无论是技术性还是批评性意见。 感谢您的关注!
1作者: itstomo6 天前原帖
目前还没有真正的多模态语义搜索数据库。因此,我想创建一个。<p>https://www.capydb.com
1作者: Alex_xuzj6 天前原帖
嗨,HN!<p>我是Alex,Brandflows的创始人。<p>Brandflows是一个连接独立品牌与创意商店的平台,旨在促进现实世界中的合作,如快闪店、联合品牌和店内活动。<p>品牌可以展示自己,并寻找零售空间进行合作。<p>商店可以发现独特的品牌,举办快闪店和新鲜的活动。<p>我刚刚推出了MVP(使用Bubble构建),希望能获得早期反馈!<p>无需注册即可浏览公开展示,欢迎查看并告诉我你的想法!<p><a href="https://brandflows.co/" rel="nofollow">https://brandflows.co/</a><p>非常感谢你的关注!