2作者: JitseLambrichts大约 2 个月前原帖
我构建了一个以本地为优先的用户界面,基于小型模型如 Qwen、Llama 和 Mistral 添加了两种推理架构:一个是顺序思维流程(计划 → 执行 → 评估),另一个是并行代理委员会,其中多个专家模型并行辩论,由一个评审综合出最佳答案。无需 API 密钥,零 .env 设置——只需使用 pip 安装 multimind。GSM8K 的基准测试显示,与单模型推理相比,准确性有显著提升。
2作者: akshaydeshraj大约 2 个月前原帖
我一直在从 ChatGPT、Claude 和 README 文件中复制多行命令,但在终端粘贴时总是出现 `command not found` 的错误。括号粘贴模式并没有帮助——它阻止逐行执行,但内容本身仍然会出现问题(多余的 `$` 提示、断开的续行、跨行的操作符)。 SmartClip 直接与您的 shell 粘贴功能(zsh、bash、fish)连接,并在 shell 看到命令之前默默修复多行命令。您可以像往常一样使用 Cmd+V 粘贴——没有新的快捷键,没有守护进程,也没有后台进程。 它使用基于分数的启发式方法来检测 shell 命令(因此不会破坏您的 JSON 或散文),智能地连接行(反斜杠续行、管道、`&&`),去除提示字符,并在插入之前使用 `bash -n` 验证所有内容。如果它不确定或修复后的语法无效,则保持不变。 大约 150 行的 bash 代码。零依赖。 使用 `brew install akshaydeshraj/smartclip` 或 `npm install -g smartclip-cli` 安装。
2作者: BeyondTheMap大约 2 个月前原帖
嗨,HN。我是一名工业技术工程专业的学生,最近我对霍尔木兹海峡的物理和物流瓶颈进行了分析。 与通常的军事视角不同,我从系统失效和热力学的角度严格分析了这个关键节点。具体来说: - 伦敦劳合社的海上战争风险保险公司如果取消一项政策,将会立即导致全球船队停靠在港口。 - 两条宽3公里的航运通道的物理限制。 - 像迪拜和利雅得这样的城市完全依赖海水淡化厂,只有严格的72小时水源缓冲时间,否则将面临全面崩溃。 我在这里整理了一个10分钟的视觉资料:https://youtu.be/eLuuja8UWb0 期待听到你们对这个节点结构脆弱性的看法。
1作者: fariniasty大约 2 个月前原帖
我在Instagram上无目的地滑动时,问自己:我为什么要这样做?<p>我是一名平面设计师,并不是专业的开发者,但我决定构建一个与“无论如何都要增加互动”的机器完全相反的东西。没有算法。没有永久的个人资料。没有无限滚动。只有GPS、互惠和48小时的短暂帖子。<p>概念<p>如果帖子停留在你拍摄它们的物理位置会怎样?我构建了Bliip:一个基于雷达的Vanilla JS PWA平台,内容与GPS坐标绑定,并在48小时后过期。<p>我不再称其为“社交媒体”,而是开始将其视为“本地现实节点”——这听起来有些自命不凡,但请耐心听我解释。这不是关于关注别人,而是关于发现你当前所处的空间。<p>核心机制:<p>给予与获取:你必须发布内容才能解锁附近的内容,持续24小时。不允许潜水者。 GPS锁定:内容与空间绑定,而不是用户。 叙述者:一个讽刺的“系统”AI(守门人),在入门时会调侃你。<p>这实际上是为谁准备的?<p>Bliip显然并不适合每个人。它是为那些在音乐节、校园或邻里聚会上,想要了解三英尺外的人在看什么的人准备的——而不是六小时前算法决定他们应该看到的内容。<p>技术难题<p>薛定谔的照片:现代手机不会立即释放文件;它们在后台处理HDR/AI。如果你抓取文件的速度太快,它“还不存在”。我不得不直接将Blob转储到RAM中以绕过操作系统的延迟。<p>没有服务器农场的视频(FFmpeg.wasm):我无法承担转码后端的费用。我使用FFmpeg.wasm将处理转移到客户端的CPU上。在移动浏览器上让它正常工作需要一场关于SharedArrayBuffer和COOP/COEP头配置的噩梦(真正的PWA体验),但它确实有效。<p>AI脑外科手术:我在AI的帮助下编写了这个,这是一场充满幻觉的过山车。在过程中,GPT-5在复杂的WASM内存逻辑上开始失败。我尝试切换到Claude,但它坚持认为是2025年,并在某一时刻字面上输出了“KURWA MATEUSZ”(我的名字加上一个波兰脏话),在上下文崩溃的瞬间。我最终将项目的“大脑”“移植”到Gemini上,完成了最后的1万行代码。<p>Google Play的地狱:新的“12个测试者14天”规则对独立开发者来说是创伤。如果第13天只有11个测试者而不是12个,Google就会重置计时器。仅仅为了在商店“存在”就花了两个月的时间。<p>现实检查<p>有机用户出现了。他们看到霓虹/赛博朋克的设计,认为:“约会应用。”<p>我学到了行业术语TTD(Time To Dick)。Bliip的得分令人震惊地短。评分降到了1.0,因为用户期待的是Tinder,却得到了一个带有讽刺叙述者的基于位置的雷达,告诉他们去外面走走。<p>我花了几个月解决内存泄漏和构建Redis空间索引,结果却得到了裆部照片和一星评价。这是独立开发者最黑暗的时刻。完全孤立。<p>当前状态<p>经过1年的独立开发: 38,106行代码(Vanilla JS,PHP,Redis) €0的营销预算 15个活跃用户 遗憾:0<p>技术栈: 前端:Vanilla JS PWA(没有大型框架,只有汗水) 后端:PHP + MySQL + Redis(空间索引/地理搜索) 视频:客户端FFmpeg.wasm 基础设施:€30/月的VPS<p>我学到的东西<p>用户会误解你的教堂,并在角落里拉屎。那些留下来帮忙清理的人才是真正的观众。 不要为每个人构建(首先为自己构建)。 技术栈并不重要(PHP在地理应用中是一个黑马)。 作为一个会编码的设计师是一种超能力(也是一种诅咒)。<p>试试吧:https://play.google.com/store/apps/details?id=me.bliip.twa 网站:https://bliip.me
1作者: makepostai大约 2 个月前原帖
GlobCall最初是作为Skype的替代品而推出的——基于浏览器的国际通话,只需打开一个标签页即可拨打任何地方的电话。我自己也在欧洲用它来经营我的业务。 随着越来越多的企业将其用于支持、销售、催款和入职,越来越明显的一点是:电话通话本身并不是问题,问题在于人力的可用性。 —— “人-电话”界面非常美妙: 人声能够达成聊天无法实现的交易。真实的人声在不同文化和语言中具有无可比拟的分量,而任何消息、通知或电子邮件都无法替代。它仍然是地球上最值得信赖的沟通渠道。 但世界在快速变化。总得有人保持清醒。总得有人会说这种语言。总得有人在凌晨2点时待命,以便在其他时区的客户拨打电话时能够接听。 这种媒介是非凡的,而人力的可用性却是有限的。 —— “代理-电话”界面是未来的发展方向: AI语音代理可以进行真实的国际电话拨打和接听。在巴西跟进发票的本地号码。一个会说罗马尼亚语的AI在夜间处理入境电话。一个在阿联酋进行潜在客户资格审核的外呼代理,而你的团队则在睡觉。或者简单地告诉你的AI代理“帮我预约理发”,它就会拨打理发师的电话并处理一切。 这就是商业沟通的下一个时代。基础设施已经存在。我们在GlobCall所构建的,就是为此而打造的可访问、经济实惠的通话层。 —— 代理层目前正在进行私测。国际通话、任何国家的本地电话号码、浏览器和API访问功能今天都已上线。采用统一的使用定价,充值后即可使用。 欢迎讨论技术栈、代理架构或任何相关内容。 可以访问 → globcall.com
1作者: tugaypala大约 2 个月前原帖
ImagineIf 是一个平台,用户可以协作创作故事,每次以280个字符的段落进行,AI会自动为每个贡献生成视觉图像。每个故事以“如果...会怎样?”的提示开始。任何人都可以继续这个链条——AI会为每个新段落生成图像,使用FLUX-dev(以Replicate为主,fal.ai为备选)。故事可以根据贡献者的选择进行分支。 技术栈:React Native/Expo(网页PWA + iOS + Android)、FastAPI后端、MariaDB、Celery+Redis用于异步图像生成、Groq/Llama用于内容审核和翻译、FLUX-dev用于视觉效果。 当前上线内容: 网页: [https://imagineif.app](https://imagineif.app) iOS: [https://apps.apple.com/app/imagineif-story-chains/id6759722274](https://apps.apple.com/app/imagineif-story-chains/id6759722274) Android正在进行封闭测试 支持22种语言,并具备自动翻译功能。 在技术上,最具挑战性的部分是构建一个可靠的双提供商图像管道,该管道在出现故障时能够优雅降级,而不会阻碍用户的创作流程——图像生成失败不应打断写作体验。 欢迎就架构或独立创始人的经验提问。