10作者: ashish0045 天前原帖
我想用简单的英语测试移动应用,而不是依赖像XPath或可访问性ID这样的脆弱选择器。<p>使用基于视觉的代理,这部分实际上运作良好。它可以查看屏幕,理解意图,并在Android和iOS上执行操作。<p>更大的问题出现在测试的定义和维护上。<p>当测试流程被保存在代码库之外(手动编写或从PRD生成)时,它们很快就会与应用程序不同步。保持它们的更新需要大量的精力,并且随着时间的推移,它们的可靠性会下降。<p>于是我尝试直接从代码库生成测试(通过MCP)。这改善了同步,但引入了高令牌使用率和较慢的生成速度。<p>我意识到测试生成不应该是一次性的步骤。测试需要与代码库并存,以保持同步并拥有更多上下文。<p>我保持了基于视觉的执行(没有脆弱的选择器),但将测试生成更靠近代码库。<p>我已将核心部分开源:<p>1. 从代码库上下文生成测试 2. 基于YAML的测试流程 3. 在Android和iOS上进行基于视觉的执行<p>代码库: <a href="https:&#x2F;&#x2F;github.com&#x2F;final-run&#x2F;finalrun-agent" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;final-run&#x2F;finalrun-agent</a> 演示: <a href="https:&#x2F;&#x2F;youtu.be&#x2F;rJCw3p0PHr4" rel="nofollow">https:&#x2F;&#x2F;youtu.be&#x2F;rJCw3p0PHr4</a><p>在演示视频中,您将看到“开发后的交接”。一个AI在IDE中构建一个功能,而Finalrun立即生成并执行一个基于视觉的测试,以验证AI开发的功能。
2作者: A5omic5 天前原帖
我正在构建一个代理,以从大型语言模型(LLM)API调用中去除个人身份信息(PII),并意识到零宽度Unicode字符几乎会破坏所有的PII过滤器。如果你在名字中插入一个零宽度空格,比如“T om”,Presidio的命名实体识别(NER)模型就不再将其视为一个名字。社会安全号码(SSN)和电话号码在正则表达式下也是如此。因此,我构建了一个规范化层,在进行检测之前去除这些内容。 这个代理本身相当简单。你只需将你的OpenAI基础URL更改为指向Veil,它会在请求发送之前对PII进行屏蔽,然后在响应中将真实值放回。它也支持流式处理,这实际上是比较困难的部分。 <a href="https://veil-api.com" rel="nofollow">https://veil-api.com</a>,免费套餐为每月100次请求。
1作者: OdinSpecc5 天前原帖
好奇团队在成长过程中如何处理系统集成,并开始依赖多个系统。<p>在什么时刻,这成为了你们真正的问题?<p>你们是通过内部工具、外部平台,还是其他方式来解决这个问题的?