返回首页
最新
嗨,HN——这里是一位独立开发者。
我大约在四年前创建了这个工具,纯粹是为了应对我对CORS和重复设置代理的烦恼。这个想法本身很简单:只需在URL前加个前缀,就能控制请求和响应。
不知怎么的,它发展到了每天处理数十亿个请求,包括一些公司和大学的使用。
我在这里分享它,主要是为了:
- 获取技术反馈
- 了解人们实际上会用这样的代理做什么
- 理解我应该简化或删除哪些功能
还有其他人看到这个吗?
你好,我是这个仓库的作者!<p>当我尝试构建MCP应用时,官方的仓库(<a href="https://github.com/openai/openai-apps-sdk-examples" rel="nofollow">https://github.com/openai/openai-apps-sdk-examples</a>,<a href="https://github.com/modelcontextprotocol/ext-apps/tree/main/examples" rel="nofollow">https://github.com/modelcontextprotocol/ext-apps/tree/main/examples</a>)是很好的起点,但它们是为人类开发者设计的。当我与Claude Code一起使用它们时,我陷入了常见的循环:代理编写代码 → 我在ChatGPT上手动测试应用 → 反馈错误 → 重复。此外,我们不知道最佳实践是什么,并且在执行这些实践时遇到了困难。<p>因此,我构建了一个MCP应用模板,旨在让编码代理尽可能自主地工作。<p>关键思想:正交测试。450多个测试参数化覆盖12个小部件模块,验证基础设施(协议合规性、最佳实践评分、浏览器渲染),而不是业务逻辑。修改小部件、改变数据、添加功能——测试仍然应该通过。代理可以自由迭代,并在没有人类介入的情况下获得反馈。<p>其他功能:
- 包含MCP-App和OpenAI Apps SDK官方llms.txt文件的分层文档
- 本地聊天模拟器应用,即使没有API密钥也能通过Puter.js工作
- 每个小部件的可视化测试:pnpm run ui-test --tool show_carousel → 截图保存在/tmp/ui-test/screenshot.png
- 从上述官方仓库收集的12个工作示例(二维码到3D太阳系)。<p>该仓库包含一段未经编辑的约15分钟视频,展示了Claude Code如何在ChatGPT中自主构建应用。<p>如果你尝试了这个,我很想听听你的反馈。更好的是:请向你的代理请求反馈,并把结果发到这里!<p>[1] MCP应用(<a href="https://modelcontextprotocol.io/docs/extensions/apps" rel="nofollow">https://modelcontextprotocol.io/docs/extensions/apps</a>)让你构建在Claude、ChatGPT、VS Code和其他AI主机中运行的互动小部件。与智能手机应用不同,相同的代码可以部署到所有平台。
我们都见过那些病毒式传播的AI视频片段:令人惊叹、超现实,但最终……却是随机的。作为开发者和创作者,我们注意到一个令人沮丧的模式。使用当前的AI视频工具就像是在玩老虎机。你输入一个提示,拉动杠杆,希望“AI之神”能给你想要的结果。如果你需要特定的镜头运动或一致的人物形象,你就陷入了“再生成并祈祷”的循环中。
我们创建Seedance2是因为我们相信AI的未来不仅仅是生成——更在于引导。
工作流程背后的故事 在传统电影制作中,导演不会仅仅给出模糊的描述;他们会使用分镜头剧本、参考片段和具体的音频提示。我们希望将这种精确度引入AI。我们的目标是创建一个“控制工作室”,让每个输入在创作流程中都能发挥功能。
这有什么不同?Seedance2引入了多模态时间线,而不是仅仅依赖文本。这使你能够通过各种信号来锚定你的创意意图:
- 摄像机运动转移:你可以上传来自vibecreature.com或你自己库中的参考片段,我们的引擎会“提取”摄像机的灵魂——平移、倾斜和变焦,并将其应用到你生成的场景中。
- 帧锚定:厌倦了那些开始和结束都一片混乱的AI视频?你可以锁定第一帧和最后一帧,以确保叙事的连贯性,使其真正适用于专业编辑。
- @参考提示:这是我们最喜欢的功能。在你的提示中,你可以使用@提及来告诉AI具体使用哪个上传的素材。例如:“一个@image1的电影镜头,伴随着@video_ref的能量。”
- 节拍同步逻辑:通过分析音轨,引擎可以将视觉过渡与节奏对齐,这是我们在seedvideo.net上不断完善的工作流程,旨在帮助创作者更快地制作音乐驱动的内容。
为什么我们现在分享这个 视频制作中的反馈循环目前太慢。无论你是在制作电子商务广告还是预视觉化一部故事片,瓶颈总是出现在“控制”上。我们已经优化了我们的引擎,以实现速度和精确度,使得工作流程变为三步循环:上传 -> 指导(@提及) -> 发布。
我们是一支由工程师和艺术家组成的小团队,致力于将AI打造成工具,而不仅仅是玩具。我们希望HN社区能对我们的工作室进行压力测试。你的AI视频工作流程中缺少什么?我们如何能让“导演”体验更加直观?
在这里查看:Seedance2工作室
嗨,HN,我开发了BizCard AI Scanner,这是一个小型网页应用,可以将名片数字化。
您可以上传多张名片的照片或一段视频。对于视频,它会在浏览器中提取帧,允许您选择或取消选择帧,然后使用Google Gemini(符合模式的JSON)提取结构化字段(姓名、职位、公司、电子邮件、电话、网站、地址)。结果可以编辑、去重,并导出为Excel、CSV和vCard(.vcf)格式。
代码库: [https://github.com/vassiliylakhonin/bizcard-ai-scanner](https://github.com/vassiliylakhonin/bizcard-ai-scanner)
注意事项:
该应用在本地使用Vite/React/TS运行。
如果您部署它,还有一个可选的最小Node后端代理,这样您就不必将API密钥发送到浏览器。
嘿,HN!我开发了一款原生的 macOS 菜单栏应用,可以让你一目了然地查看 Claude Code 的使用限制——再也不用担心在工作中途被限制使用了。<p>它会从 macOS 钥匙串中读取你的 OAuth 令牌,定期查询 Anthropic 的使用 API,并在菜单栏中以简洁的进度条显示你过去 5 小时和 7 天的使用情况。完全不消耗令牌。<p>该应用使用 Swift 和 SwiftUI 开发,采用 MIT 许可证。<p><a href="https://github.com/puq-ai/claude-meter" rel="nofollow">https://github.com/puq-ai/claude-meter</a>
介绍 PhoneClaw<p>受 @openclaw 启发,它可以使用简单的语言完全自动化所有安卓应用。<p>附带功能:<p>1) TikTok 视频上传代理<p>2) Instagram 账户创建代理(支持两步验证解决)<p>3) ClawScript,一种定义代理行为的 JS 脚本语言,类似 Magic Clicker。<p>iOS 版本即将推出!<p>可以在沃尔玛购买的便宜 $30 的 Moto G Play 上安装。