返回首页

24小时热榜

14作者: alexblackwell_大约 16 小时前原帖
你好!我是亚历克斯,我和我的联合创始人塔伦一起创建了Kampala(<a href="https://www.zatanna.ai/kampala">https://www.zatanna.ai/kampala</a>)。这是一个中间人(MITM)风格的代理,允许你主动逆向工程现有工作流程,而无需脆弱的浏览器自动化或计算机使用代理。它适用于网站、移动应用和桌面应用。 <p>演示:<a href="https://www.youtube.com/watch?v=z_PeostC-b4" rel="nofollow">https://www.youtube.com/watch?v=z_PeostC-b4</a>。 许多人每天花费数小时在传统仪表板和本地解决方案中,跨平台对数据进行对账。目前的自动化尝试使用浏览器自动化或计算机使用代理,这些方法脆弱、缓慢且不确定。我来自网络逆向工程背景,在过去的7到8年里,我手动构建了运动鞋/票务发布、体育博彩登录等的集成。在此期间,我为几家公司提供咨询服务,将它们从基于浏览器的基础设施迁移到请求层。 <p>当我们开始创建Zatanna(这是我们的公司名称)时,我们在牙科技术领域工作,这意味着我们必须处理大量保险支付者仪表板和传统牙科实践解决方案。我们的超能力(作为一家相对没有差异化的语音代理/前台助理公司)是能够与几乎任何请求的系统进行集成。在这段时间里,我们构建了大量工具(包括我们现在称之为Kampala的工具),以便快速启动这些集成。 现有的MITM代理和工具由于几个原因无法工作:(1)它们在传输过程中操控TLS和HTTP2指纹,这被严格的反机器人检测所识别。(2)它们的MCP(多通道处理器)表现不佳,未能充分暴露必要的功能,如脚本/重放。(3)它们不允许根据样本或请求序列构建工作流程或操作。 <p>随着我们构建的工具变得越来越强大,我们开始在内部使用它们来抓取会议参与者、连接外部PMS系统以及与Slack应用互动。我甚至把它发给了我的物业经理妈妈,在我的帮助下(笑),她在Yardi中自动化了2-3小时的账单信息录入。到那时,我们意识到这其实与牙科并没有太大关系 :) <p>由于Kampala是一个MITM,它能够利用现有的会话令牌/反机器人Cookies,并在几秒钟内以确定性方式自动化操作。你可以使用我们的代理工具,直接通过提示你进行操作来创建脚本/API,或者通过手动执行一次工作流程,要求你首选的编码代理使用Kampala生成一个脚本/API来复制它。一旦你有了API/脚本,你可以导出、运行,甚至让我们为你托管。 <p>我们认为,自动化的未来并不是将网页的截图发送给大型语言模型,而是使用计算机实际理解的底层层次。期待听到你的想法/问题/反馈!
13作者: hammer32大约 18 小时前原帖
我在HyperCard中训练了一个变换器,包含1,216个参数,使用的是1989年的Macintosh。没错,这个过程花了不少时间。 MacMind是一个完整的变换器神经网络,包含嵌入、位置编码、自注意力、反向传播和梯度下降,完全用HyperTalk实现,这是苹果在1987年随HyperCard发布的脚本语言。每一行代码都可以在HyperCard的脚本编辑器中阅读。选项点击任何按钮即可查看实际的数学计算。 任务是学习比特反转置换,这是快速傅里叶变换的第一步。模型没有公式可循,它纯粹通过注意力机制和反复的试错来发现位置模式。在第193步训练时,它在50%、75%和100%的准确率之间波动,最终像球滚入碗中一样趋于收敛。 整个“智能”仅仅是存储在HyperCard堆栈中的1,216个数字。保存文件,退出,再重新打开:训练好的模型依然存在,依然正确。它可以在从System 7到Mac OS 9的任何系统上运行。 作为一名前物理学学生,快速傅里叶变换是我的老朋友,它在信号处理、量子力学和波动分析中占据核心地位。我构建这个模型是因为我们正处于一个人工智能影响着我们所有人的时刻,但大多数人并不理解它到底在做什么。反向传播和注意力是数学,而不是魔法。数学并不关心它是在TPU集群上运行还是在1989年的68030上运行。 这个代码库包含一个预训练的堆栈(第1,000步),一个可以自己训练的空堆栈,以及一个验证数学计算的Python/NumPy参考实现。