1作者: andrepd19 天前原帖
我在过去两年间时不时关注正数算术的发展。几个月前,我决定尝试编写一个软件实现。 对于那些不太了解的人来说,正数算术是一种较新的浮点格式,相较于IEEE浮点数,它在多个方面具有优势,尤其是在较低精度时。它通常具有更好的精度和更简单的设计,并且提供了<i>quire</i>,这是一种可以非常快速且没有舍入误差地计算点积的方法(关于它的许多意想不到的用途可以说很多);这使得它适合用于高性能计算、神经网络等。如果你有兴趣了解更多,我在README中提供了一些参考链接。我觉得这非常有趣! 这个库旨在成为一个完全完整且符合标准的实现。尽管它仍在开发中,但已经具备了相当不错的功能:你可以定义任意大小和指数大小的类型,进行整数和浮点数之间的转换,执行加减乘除运算,使用quire等。当前缺少的主要是一些基本函数(如指数、对数、正弦等)。 根据我的基准测试,它的速度非常快,可能是目前最快的免费实现!如果有人知道更快的实现,请与我联系,我很乐意将其添加到基准测试套件中。 正确性也经过了广泛的测试,尽可能进行了详尽的测试,对于无法详尽测试的部分则使用了proptest。 最后,代码有良好的文档说明,包括内部算法,这可能使它(我希望如此!)成为一个有用的学习工具。 感谢阅读!
19作者: mpapazian19 天前原帖
嗨,HN,我们是Marc和Matt,我们正在构建Propolis(app.propolis.tech/#/launch)。我们使用浏览器代理来模拟用户,以便报告错误和编写端到端测试。今天,您可以启动数十到数百个代理,这些代理可以协作探索网站,反馈痛点,并提出可以作为CI一部分运行的端到端测试。 您可以在这里免费尝试一次初步运行(两分钟设置),以感受产品:app.propolis.tech/#/launch。或者观看我们的演示视频:<a href="https://www.tella.tv/video/autonomous-qa-system-walkthrough-3s4e">https://www.tella.tv/video/autonomous-qa-system-walkthrough-...</a> 问题 Matt和我在过去十年里一直在思考软件质量。在Airtable工作期间,Matt负责基础设施团队,负责部署,并深入思考如何在用户发现之前捕捉到错误。确定性测试在确保预定义行为持续正常运行方面非常有效,但很难获得有意义的覆盖率,并且容易“存根/模拟”到不再代表真实使用的程度。 我喜欢将我们现在构建的产品描述为一组“用户”,您可以将其视为一种金丝雀组,而无需担心对真实用户产生影响。 我们所做的: Propolis运行“群体”浏览器代理,这些代理协作制定用户旅程,标记摩擦点,并提出可以在您希望的任何触发下更便宜地运行的端到端测试。我们的客户从上市公司到初创企业,定期运行“群体”,大幅增加他们自动化测试的广度,并将生成的测试作为CI管道的一部分运行,以确保更具体的流程保持正常工作,而无需担心更新playwright/selenium测试。 我对这种方法感到特别兴奋的一点是“检查”的灵活性,因为它们部分通过大型语言模型(LLM)进行评估。例如,我们发现了一些与非确定性输出质量相关的错误(想象一下,一个购物助手推荐了一款产品,而用户随后搜索却找不到)。 定价和可用性 今天它已经可以投入生产,价格为每月1000美元,支持无限使用 + 为愿意提供反馈和请求功能的早期用户提供积极支持。如果您希望将其用于较小或个人项目,我们也很乐意为您提供有限使用/爱好计划的更低价格。 我们非常希望听到HN社区的声音——特别是想知道大家对自主代理除了验证错误和功能正确性之外还有什么其他想法。试试看,告诉我们您的想法!