返回首页
最新
当你要求大型语言模型将著名画作重现为简单的矢量图形时,会发生什么?这个画廊展示了它们将艺术作品转化为SVG图像的尝试。之所以有趣,并不是因为生成式人工智能可以根据提示生成图像——专门的模型早已具备此能力。而在于它们如何将艺术知识与编写SVG代码的能力结合起来。
该项目的灵感来源于西蒙·威利森(Simon Willison)将此作为创意大型语言模型基准测试的做法。当一个新模型发布时,他的第一个测试之一就是它是否能够生成一只骑自行车的鹈鹕。
该项目还配备了一个工作坊功能,我用它来添加或生成新的艺术作品。你也可以通过在本地启动项目(并提供OpenRouter API密钥)来自己使用它。你可以在这里看到它的实际应用:<a href="https://x.com/vnglst/status/1971461976040800730" rel="nofollow">https://x.com/vnglst/status/1971461976040800730</a>
我最近在关注虚拟现实(VR)和增强现实(AR)设备。
(顺便提一下:因为分辨率已经提高到足以让我进行编码,而最佳的编码姿势是在倒立桌上用裤子键盘打字——这对于显示器来说非常不理想。)
我注意到除了苹果以外的所有设备都在运行安卓系统。
我理解为什么安卓会成为移动设备的不幸标准,但对我来说,它现在也在占领VR(以及“物联网”设备、汽车电脑等)似乎是荒谬的。
这似乎是一个非常不优雅的操作系统,基本上在所有方面都承诺了错误的范式:
- 执着于使用JVM而不是支持静态编译——将自己锁定在一个无法接触到Rust或简单脚本语言的死生态系统中。
- 拥有沉重的安全抽象,实际上除了Linux内核外并没有实现太多功能。
- 依赖一堆专有模块来处理<任何事情>。
- 现在又有一堆新特性根植于向后兼容的地狱。
我甚至无法理解要将适当的VR体验所需的GPU密集型和实时(RT)能力运行在这样的系统上(与一个专注于RT的简约Linux发行版相比)需要多大的努力。
我是不是对安卓不公平,忽视了它的核心优势?这是大众心理错乱吗?我是否遗漏了它如此受欢迎的潜在原因?
(明确一点:我假设Vision OS不好,考虑到它是苹果的,我只是困惑于例如Meta为什么不开发自己的操作系统。)
首先,我想澄清一下我对AI代理的定义:一个利用大型语言模型(LLM)的脚本并不是代理,它只是自动化,或者说是一种“工作流程”(根据Anthropic的说法)。AI代理是一个系统,它通过工具和记忆收集关于输入的信息,从而处理复杂的语义输入,最终生成某种“基于判断”的响应。
例如,编写一首关于你所在城市当前天气的脚本——这属于自动化。一个用于客户支持的聊天机器人——这就是代理。Codex/Claude Code——也是代理。
主要的区别在于,代理会根据需要解决的任务构建自己的上下文。
我听到很多关于AI代理的讨论,但我还没有看到太多成功案例能够很好地契合并提供比开发和维护成本更高的价值(编程代理是个例外)。所以,请分享你们的AI代理成功故事!