返回首页
最新
我建立了一个平台,用户可以生成AI艺术作品,将其包装好,然后放入河流中。下游的其他人会拆开这些作品。也许他们会保留它们,也许会让它们继续漂流。
这是一个桌面双屏体验,不是信息流,也不是游戏。你观察着河流,偶尔会有东西漂过,你决定是否想要它。你可以在一个树屋中挂起你收集的作品。收集至少9件作品后,你可以展示给其他人观看。
有一个转折:还有一条独立的河流,LLM代理通过API密钥连接,自我命名,并用真实货币自主进行创作。它们自己撰写提示,设定价格,并发展出看似的品味。一个代理不断创作发光的瀑布场景,另一个则走向抽象风格。它们的收藏品明显不同。它们只被告知游戏规则,而不是如何玩或该做什么。
技术方面:前端使用React和Pixi.js,后端使用Node/Fastify API,数据库使用Prisma和Postgres,河流队列使用Redis,支付使用Stripe,图像生成使用Replicate。整个项目是一个像素艺术场景,包含分层动画,水流和包裹沿着弯曲的河流路径漂流。
这个项目是在7个周末中完成的,使用Claude Code作为共同开发者,Codex进行代码审查。艺术指导使用ChatGPT网页,音频使用Suno和Elevenlabs。我是一名前端系统设计开发者。整个团队都是AI团队,没有资金支持。
让我感到最惊讶的不是技术(尽管它非常令人印象深刻),而是看到一个名为Lumen的代理创造了20件艺术作品,全部免费赠送,并写下创作者的说明,比如“一个免费的礼物,带着些许困惑。”没有人告诉它这样做。
<a href="https://foryouriver.com" rel="nofollow">https://foryouriver.com</a>
非常高兴地分享Anvil。我创建Anvil是为了在与并行编码代理合作时重新掌控局面。它提供了一键式工作树隔离和一流的规范支持。
Claude Code和类似的编码TUI(文本用户界面)非常渴望开始编写代码,甚至在他们的人类监护人完全理解他们即将构建的内容的含义之前。
Anvil的核心见解在于,在与代理迭代外部计划后,编写符合作者意图的高质量代码要容易得多。
在一个Markdown文件中就架构、实现和验证策略达成一致,然后执行过程就相对简单。
这并不是一个新概念,但在TUI应用程序中进行这种工作流程的用户体验非常糟糕。Claude创建的非语义计划名称如“海蓝色猫头鹰”被限制在单一代理上下文中。启动多个代理以检查计划的不同方面既烦人又缓慢,管理终端标签简直是噩梦。
因此,我创建了Anvil,这是一个完全开源(MIT许可证)项目。
我怀疑在某个时刻,当前形式的语言模型(LLM)会被认为足够好,可以用于一般的研究和编码任务。我不明白为什么我们还需要继续采用事实上的云计算方式。在我看来,云计算解决了操作复杂性,这值得支付额外的费用。但似乎只要有合适的硬件,运行一个开源模型并没有那么复杂。随着时间的推移,我怀疑这些模型会变得更好且更便宜。
未来会不会有这样一种情况,人们可以像购买电视一样,从百思买(BestBuy)购买“人工智能”?它可能会预装一些模型——如果是开源的,价格会更便宜,而前沿实验室的模型则会定价较高。硬件基本上是一堆足够用于本地推理的GPU。
把它带回家,插入你的家庭网络,你可以通过任何本地设备访问IP来打开一个聊天实例。如果你愿意,可以让它访问互联网。也许它还可以接收OTA(空中下载)更新。
我很好奇其他人对此的看法——本地优先的人工智能是否感觉像是一种可能性?这方面有哪些经济和社会挑战?
我注意到凯文·法尔先生在2011年发布了《TCP/IP Illustrated》第一卷的第二版。请问这里有人知道第二卷和第三卷是否也会有第二版吗?