2作者: alexgriss2 个月前原帖
嗨,HN, 我一直在开发一个基于浏览器的工具,用于探索和调试Web音频API图形。 Web Audio Studio让你可以编写真实的Web音频API代码,运行它,并以交互式可视化的方式查看它生成的运行时图形。你不再需要在脑海中跟踪connect()调用,而是可以检查图形的实际结构,跟踪信号流,并在音频播放时调整参数。 它包含了常见节点类型的内置可视化——波形、滤波器响应、分析器的时间和频率视图、压缩器传输曲线、波形变形失真、空间定位、延迟时间等——这样你可以更好地理解图形中每个部分的作用。你还可以在任意两个节点之间插入一个AnalyserNode,以检查信号在链中的确切位置。 目前有大约20个模板(基本振荡器设置、FM/AM合成、卷积混响、IIR滤波器、空间音频等),这样你可以从现成的示例开始进行修改,而不是从头开始构建一切。 所有操作都在浏览器中完全本地运行——无需注册,无需后端支持。 我的动机源于处理复杂的Web音频图形时,发现一旦超出简单示例,理解结构和信号流变得越来越困难。大多数教程只展示小片段,但真实项目很快就变得难以检查。我希望有一个工具能够紧密贴合原生Web音频API,同时使运行时图形可见并可检查。 这目前是一个早期的Alpha版本,仅限桌面使用。 我非常欢迎反馈——特别是来自那些在生产中使用过Web音频API或构建过音频工具的用户。你可以在这里留言,或者使用应用内的反馈按钮。 <a href="https://webaudio.studio" rel="nofollow">https://webaudio.studio</a>
2作者: slack8122 个月前原帖
Ragtoolina 是一个MCP服务器,它会预先对您的代码库进行索引,并为AI编码代理提供针对性的上下文,而不是让它们逐个扫描文件。 我在Cal.com(约30万行代码,4万GitHub星标)上进行了基准测试: - 63%的令牌减少,涵盖5种不同的查询类型 - 工具调用减少43% - 成本:每5次查询会话3.01美元,之前为7.81美元 该基准测试涵盖了不同的复杂性水平——从简单的调用链追踪到架构理解查询。对于简单的查找,RAG的开销并不划算(有一个查询在使用Ragtoolina时实际上表现更差),但在复杂的多文件任务中,节省是显著的(最多可减少79%的令牌)。 质量评估通过盲评AI评分进行(评审者不知道哪个答案来自哪个系统),评估标准包括正确性、完整性、特异性和简洁性。在5个任务中,Ragtoolina在4个任务上达到了或超过了基准质量。 支持任何与MCP兼容的客户端:Claude Code、Cursor、Windsurf、Claude Desktop。 提供免费层,欢迎任何反馈。
2作者: ajax332 个月前原帖
HN的朋友们——如果这是个无知的观点,请指教: 在过去两年里,我们见证了令人瞩目的机器人融资情况——例如,Figure的估值约为390亿美元,融资超过10亿美元;Skild AI融资约为14亿美元;Physical Intelligence融资数亿;还有像Wayve的机器人出租车融资约为15亿美元,当然也不能忘记马斯克的Optimus机器人。 这是一波疯狂的资本潮流,但从核心瓶颈的角度来看,自2016年至2020年间,实际上发生了什么变化? 我们听说过视觉模型、强化学习的进展、扩散策略、更好的模拟以及多模态的具身模型,但这些是否真的在大规模上突破了泛化、可靠的操作或真实的模拟与现实之间的差距? 一些问题: 1. 我们是否在朝着能够在混乱的真实环境中有效工作的通用策略迈出了实质性的一步? 2. “机器人基础模型”是否能像大型语言模型(LLMs)对自然语言处理(NLP)所做的那样,解决数据瓶颈? 3. 操作技术是否已经超越了渐进式的改进? 4. 人形机器人是技术上的飞跃,还是仅仅是吸引资本的叙事? 5. 有哪些真实的研究论文或基准显示出显著的进展? 我真心好奇我们是否处于一个技术拐点,还是将再次面临严峻的物理、数据或硬件问题。
1作者: aloneguid2 个月前原帖
适用于Windows的微型屏幕注释工具(小于3MB)。无依赖,无安装程序,无需管理员权限,无追踪,无网页视图,无JavaScript,全部为100%原生应用。