嗨,HN,
我开发了Banana Pro AI,因为我希望有一个地方可以集中处理视觉内容,而不必在不同的工具之间来回切换。
它支持:
- 文本转图像和图像转图像
- 文本转视频和图像转视频(短片段)
- 可选的“工作室”模式:一个简单的画布,您可以在其中串联步骤(例如:提示 → 图像 → 视频),并将所有内容保留在一个项目中。
这是一个独立的应用程序,整合了多个模型提供者的功能,背后有一个统一的界面(并且与它们没有关联)。
有一个小的免费层级,您可以快速尝试。我希望能收到关于以下方面的反馈:
1) 哪些控制项最重要(种子、比例、时长等)
2) 工作流程/画布用户体验(是否过多?是否不足?)
3) 输出质量问题/失败案例
欢迎提问。
返回首页
最新
Beta版本已上线!我们非常希望听到您对我们在定价方面的LTR(长期回报)方法的看法,以及在扩展时如何更好地处理非平稳数据分布的建议。
嘿,HN!我创建了 InStudio——一个免费的基于浏览器的 Instagram 创作者工具包。
所有功能都在本地运行(无需服务器,无需账户,照片不会离开您的设备)。它是一个单一的 HTML 文件,使用原生 JavaScript。
包含 10 个工具:
- 网格预览规划器(上传 9 张照片,在发布前查看您的个人资料网格)
- 拼贴制作器(6 种布局,可调间距,立即下载 JPG)
- 标题生成器(超过 60 个手写标题,涵盖 10 种情绪)
- 标签策略生成器(3 层分类:超级标签/中等标签/小众标签)
- 互动率计算器(基准 + 个性化建议)
- 简介生成器(5 种风格,瞬间生成)
- 字体样式器(12 种在 Instagram 上可用的 Unicode 字体)
- 色彩调色板库(12 种精心挑选的调色板,点击复制十六进制代码)
- 最佳发布时间指南
- 纵横比参考(所有官方 Instagram 格式)
我之所以创建这个工具,是因为 Instagram 工具的费用在每月 15-30 美元之间,而大多数创作者只使用其中 20% 的功能。我认为应该有一个免费的选项,可以在一个地方完成所有功能。
技术栈故意保持简单——100% 客户端,零依赖,首次加载后可离线使用。整个工具包大约 120KB。
希望能收到 HN 的反馈——特别是关于我应该添加哪个工具,或者您是否愿意为任何功能付费(我正在考虑盈利模式)。
在线地址: [https://instudio.artboards.in/](https://instudio.artboards.in/)
我之所以构建这个,是因为现有的代理框架要么给代理提供了无安全控制的“上帝模式”文件系统访问,要么又过于封闭而无法发挥作用。
我关注的一些关键点是大多数框架所忽略的:
- 运行时人机协作(HITL)检查点——在风险较高时暂停执行,从确切状态恢复
- 混合记忆:向量 + BM25 关键词 + 图形实体/关系共同评分,无外部依赖
- 安全作为基本功能:路径监狱沙箱、一次性密码(OTP)配对、异或加密的本地秘密
- 22个以上的语言模型(LLM)提供商,具有每个代理的模型策略和后备链
- 多代理委员会,包含辩论轮次、灵魂进化和技能记忆
使用技术:Node.js、Prisma、Postgres/Redis、Docker。55/55的测试通过。采用Apache 2.0许可证。
欢迎就任何架构决策提出问题。
差不多十年前,我在办公室里举办过一个电影俱乐部。我的一个朋友在市区也举办了一个电影俱乐部,他们需要一个空间。<p>我有一个开放式办公室,这意味着我们可以清理出空间,启动投影仪,举办电影俱乐部。他们每月在一个星期五晚上9点到早上7点之间聚会,每次会议有100到150人参加。<p>这种情况持续了几个月,每次会议都有一位策展人负责,他们会选择一个主题,从该类型的第一部电影展示到现代版本,以及演变的过程。这是对电影创作的解构。<p>讨论中还涉及一些电影制作人展示他们自己的作品,以及他们是如何剪辑的,为什么这样剪辑。<p>我观察到,这些创意人士并没有任何数据来支持他们的决策。这完全是凭直觉和感觉,我能看到一些编辑和制片人在翻白眼,因为他们知道这意味着什么。直觉和感觉意味着不确定性,这会让你产生困惑,因此你会不断进行变更,直到某个时刻你形成了隧道视野。<p>一位导演曾告诉我,他的话让我印象深刻——他说在某个时刻,我们只想完成这个项目——在制片厂的要求和制片人的催促之间,我们就这样放手,继续下一个项目。<p>一位制片人曾说,如果每位导演都可以随心所欲,每部电影都会有4个小时长,而且不会有任何镜头被删减。<p>但也有像《超人:钢铁之躯》这样的电影案例,扎克·施奈德的剪辑版本更好,但制片厂和制片人的决定获胜,观众在观看电影时并没有那么兴奋。而且除了真正的影迷,没人会特意去寻找导演剪辑版的电影。<p>需求显而易见——行业需要分析数据来了解什么有效,什么无效,这与初创企业采用精益创业框架的方式类似,所有一切都转向构建最小可爱产品,然后再从中发展。需要注意的是,与产品不同,产品可以发布,分析数据可以获取,我们可以调整并重新发布——电影没有重新发布的概念。电影只有一次机会,如果错过了,就完了。这也解释了电影行业只有7%的成功率。<p>自从我举办电影俱乐部以来已经过去十多年,但这个问题依然存在——考虑到行业每年在制作内容(电视剧、电影)上花费超过1500亿美元,这确实是个大问题。<p>我们开始使用一种硬件,捕捉观众的眼动数据和心率,这可以在观众测试放映期间互补使用——这让我们在微秒级别上获得了很多深刻的洞察,了解内容在哪些地方吸引观众,在哪些地方失败。<p>但问题是,拍摄完成后,重新拍摄的成本变得非常昂贵。行业所称的“补拍”很少进行——因为艺术家们已经转移到其他项目,重现那一幕和时刻是极其困难的。因此,我们建立了一个涵盖120多部不同类型电影的数据库,并利用这些观众数据训练一个定制模型,可以查看过去的电影以建立基准数据,然后将其作为与某个正在计划的剧本进行比较的参考。<p>我们上周将其推出为Quanten Arc(arc.quanten.co)。这对电影制作人,尤其是独立电影制作人非常有帮助,因为他们可能没有预算进行观众测试,但他们可以利用所有的数据。更重要的是,这对AI电影制作人和制片厂也有帮助,他们现在可以识别出哪些场景不起作用,并可以根据叙事的需要进行必要的更改。<p>我很想听听你的看法。我是在解决一个真实的问题,还是在想象一个并不存在的问题,并沉迷于数据的美丽中?
在我所在的大型科技公司,我们都被鼓励使用人工智能。我和我大多数同事在使用聊天机器人、Cursor风格的工具以及最近的Claude Code来加速编写代码的过程中取得了成功。
然而,在我网络中的一些人似乎像是生活在十年之后。他们在工作中自动化了一切,同时同时启动十个专门的代理,运行多代理管道,利用这些技术做各种我无法想象的疯狂事情。看起来这让他们的工作效率大大提升。
我已经找到了一种将代码编写和问答聊天机器人融入我的工作流程的方法。但在这些疯狂的代理设置方面,我还没有做到。显然,有一种方法可以利用这些工具来极大地提升你的生产力,至少是2倍,甚至可能达到10倍。但这到底是什么呢?
有没有哪位代理的高级用户可以启发我一下?利用这些新工具的最佳方法是什么?