1作者: sat135 个月前原帖
嗨,HN, <p>简而言之,Mirror AI 是一个跨平台的桌面<i>行动导向的语言模型(LLM)</i>。 它不仅仅是回复文本,还可以执行终端命令、移动文件、调用 API、发送电子邮件/消息、安排日历事件、查询数据库等,并且可以在一个请求中将这些步骤串联起来。</p> <p>我为什么要开发它 聊天机器人在回答问题方面表现出色,但在“好吧,现在去做吧”的时刻却停滞不前。 我在 ChatGPT 和我的终端/IDE/Gmail 之间复制粘贴的次数太多了,因此在红眼航班上,我开发了一个桥接工具,让 LLM 在权限层下执行任务。朋友们对此表示需求,功能逐渐增加,于是就有了现在的这个项目。</p> <p>它今天能做什么 - 文件与终端 – 读取/写入/重命名/压缩/执行文件,运行终端命令 - 生产力 – 草拟并发送 Gmail,创建 Google 日历事件,读取/写入 Notion,发布到 Slack/Discord/WhatsApp(通过 Beeper) - 开发与运维 – 查询 Postgres/Mongo,与 GitHub 互动,调用 AWS,curl 任何 REST 端点 - 搜索与生成 AI – 网络搜索(Perplexity),总结 PDF,生成图像/视频,保持长期记忆 - 通过 MCP(模块化命令协议)扩展以添加自己的技能 - 还有更多功能</p> <p>在添加了一些集成后,示例提示(复制粘贴):</p> <pre><code> 在 Reddit 上搜索关于 LangChain 流媒体的讨论,总结一下,给我发邮件总结,并在明天的日历中预留 30 分钟。 或者 调查我的 AWS 账户,告诉我如何轻松省钱。还检查我的 MongoDB,并提出一些优化建议。 </code></pre> <p>它是如何工作的 - 桌面应用程序(macOS、Windows、Linux),使用 TS 编写 - 无 SaaS 后端:一切都在本地运行;外部调用仅连接到您配置的模型提供者(OpenAI、Claude、本地 Ollama 等) - 安全性:每个风险操作都需要用户的批准</p> <p>状态与路线图 - 免费的 alpha 版本下载:<a href="https://themirrorai.com" rel="nofollow">https://themirrorai.com</a>(请自备 API 密钥) - 计划在未来几个月内开源核心功能,如果有足够的兴趣 - 接下来:改进工作记忆、基于事件的触发器以实现自主响应,以及扩展集成。</p> <p>请求 请多多尝试,测试一些奇怪的边缘案例,寻找安全漏洞,并告诉我哪些地方不满意或希望它能做什么。我会在评论区查看大家的反馈。</p> <p>谢谢! Sat</p>
2作者: chenxin25 个月前原帖
我开发了一个纯客户端的 HEIC 转 PDF 转换工具,以解决 iPhone/iOS 用户的兼容性问题。 技术栈: - Next.js 15.2.5 - React 19 + TypeScript - heic2any 用于格式转换 - jspdf 用于 PDF 生成 - 国际化支持 (next-intl) 所有处理都在浏览器中进行,无需服务器上传,从而保护用户隐私。功能包括批量转换、实时预览、自定义 PDF 设置,以及转换为 PNG/JPG 格式的选项。 这是一个开放项目,欢迎反馈和贡献。如果您遇到 HEIC 兼容性问题,可以试试看。
1作者: demirbey055 个月前原帖
我创建了Podco,这是一款基于人工智能的工具,旨在帮助您更有效地从教育视频(讲座、播客等)中学习。 工作原理: 1. 粘贴一个YouTube(或其他)视频的链接 2. AI将视频转换为结构化文章 3. 生成测验以测试您的理解 4. 您还可以与朋友分享您的学习内容。 期待听到您的反馈!
1作者: tsweijen5 个月前原帖
我们创建了Swaphouse作为一个副项目,旨在帮助远程工作者免费交换住房,而不是支付酒店或Airbnb的费用。<p>每个列出的房屋都适合远程工作(提供可靠的Wi-Fi和专用工作空间),匹配是基于双方的兴趣,通过滑动系统进行(就像约会应用,但用于房屋交换)。<p>这完全免费。我们是两个人,自筹资金,在晚上和周末进行这个项目。非常欢迎任何反馈或建议。<p><a href="https:&#x2F;&#x2F;swaphouse.io" rel="nofollow">https:&#x2F;&#x2F;swaphouse.io</a>
2作者: sunnyba5 个月前原帖
我一直在关注一些游戏精灵的图像生成进展,最近对Gemini Flash印象深刻。这个演示允许你上传一张图片,并将其转化为一个动画像素角色(一个可以下载的小数字动图)。我将这些像素艺术帧串联在一起,并将玩家放入一个具有挑战性的跳跃平台关卡中。 视频演示: [https://www.youtube.com/watch?v=EK7z-HltssE](https://www.youtube.com/watch?v=EK7z-HltssE) API使用: 不幸的是,Gemini Flash 2.0的图像生成API限制非常严格,付费层级也无法扩展——如果团队中的任何人看到这个并想帮我一下,我的邮箱在我的个人资料中,或者你可以通过hello@lildigi.me联系我。 关卡统计: 对于那些速度跑者,我看到的最快无漏洞通关时间大约在17-18秒之间。 技术栈: Cloudflare Pages + AWS Lambda + Gemini 欢迎随时提问!