返回首页
最新
嗨,HN——我开发了QuickSummarize,这是一个开源的Chrome扩展,用于通过字幕处理YouTube视频。
核心理念是将视频问答以转录文本为主,而不是将一次性总结视为全部记忆。
当前工作流程:
- 总结
- 基于转录文本的聊天
- 时间线浏览
- 字幕导出
它在Chrome侧边栏中运行,目前专注于YouTube。
我关注的一些实现选择:
- 转录文本是后续问题的主要依据
- 支持自带API,而不是另一个托管订阅
- 支持OpenAI兼容的API和Anthropic风格的API
- 英文/中文用户界面
虽然还处于早期阶段,但我觉得它比通常的一次性“总结这个视频”的流程更有用。
特别希望得到以下方面的反馈:
- 基于转录文本的聊天是否真的是合适的用户体验
- 人们如何看待长视频的记忆/检索
- 字幕可靠性边缘案例
为 Vue 3 构建了一个轻量级的 OTP 输入组件。<p>组合 API<p>自动聚焦 + 退格处理<p>完全可定制<p>小巧的包体<p>简单易用,设计上能够干净地处理常见的边缘情况。<p>代码库:<a href="https://github.com/pratik227/vue-otp-pro" rel="nofollow">https://github.com/pratik227/vue-otp-pro</a>
我之所以构建这个工具,是因为我厌倦了每个AI工具都将我的数据发送到其他服务器。n0x通过WebGPU运行完整的LLM推理,具备自主的ReAct代理、基于您自己文档的RAG,以及通过Pyodide进行沙箱化的Python执行,所有这些都在一个浏览器标签页内完成。
无需账户,无需密钥,无需后端。模型只需下载一次,永久缓存到IndexedDB中。
最大的挑战是为代理循环进行上下文窗口预算,并使WASM向量搜索非阻塞。很高兴能讨论架构。
<p>GitHub: <a href="https://github.com/ixchio/n0x" rel="nofollow">https://github.com/ixchio/n0x</a> | 现场演示: <a href="https://n0x-three.vercel.app" rel="nofollow">https://n0x-three.vercel.app</a>
我花了几周时间整理长期工作场所研究关于人工智能采纳的实际发现,而不是大多数报道中对生产力的乐观预期。
<p>https://medium.com/@dilpreetgrover2/the-ai-productivity-paradox-why-efficiency-is-skyrocketing-while-employees-are-burning-out-3747c44910d3?postPublishedType=initial