返回首页
最新
我发现大多数在线Markdown工具无法正确渲染数学公式。<p>因此,我创建了<a href="https://markdownviewer.cc/" rel="nofollow">https://markdownviewer.cc/</a>。<p>功能:<p>全面支持LaTeX数学公式(行内和块级)
导出为PDF、Word(.docx)和HTML
以富文本格式复制(可直接粘贴到电子邮件、文档等)
无需登录,完全在浏览器中工作
嗨,HN,
我开发了一个完全在浏览器中运行的语音转文本工具。免费版无需注册,也不会将数据发送到我的服务器。
试试吧: [https://voicetotextonline.com](https://voicetotextonline.com)
我为什么要开发这个工具:
- 现有工具需要注册,有时间限制,或者收费
- Google Docs 的语音输入需要 Google 账户
- Dragon 的价格在 $150 到 $500 之间
- Otter.ai 的免费版有使用限制
(A) 免费功能(无需账户):
1/ 核心转录:
- 使用 Web Speech API 实现实时语音转文本
- 支持 55 种以上语言
- 自动标点和句子大小写选项
- 首次加载后可离线使用(PWA)
2/ AI 增强(基于用户调查添加 - 80% 投票支持):
- 自动修正语法、标点和格式
- 一键清理转录文本
3/ 我的项目(本地存储):
- 将转录文本保存到浏览器的 localStorage
- 使用文件夹组织(笔记、工作、个人等)
- 自定义文件夹和标签
- 在所有转录文本中搜索
- 编辑、复制、下载为 TXT
- 100% 私密 - 从不离开您的设备
- 导出:
- 复制到剪贴板
- 下载为 TXT 或 DOCX
(B) 专业功能($10/月或 $1/小时按需付费):
1/ 文件上传与转录:
- 上传音频/视频文件(MP3、WAV、M4A、MP4、MOV、AVI、MKV)
- 每个文件最大 500MB
- 批量上传(一次最多 10 个文件)
- 由 AssemblyAI 提供支持(准确率超过 95%)
- 每月 150 小时转录
2/ 高级功能:
- 实时进度和预计完成时间
- 说话者标签
- 浏览器内音频录制(最长 5 分钟,可暂停/恢复)
- 翻译成 25 种以上语言(GPT-4o)
3/ 导出格式:
- 带时间戳的 TXT、SRT、VTT、JSON
- 段级时间戳精确度
4/ 云存储:
- 云中的转录历史
- 10GB 存储,每月 1,000 个文件
(C) 数据与隐私:
免费版:
- 所有转录文本仅存储在浏览器的 localStorage 中
- 从不接触我们的服务器
- 100% 私密
专业版:
- 音频文件存储在 Supabase(加密)
- 文件保留 30 天以供重新下载,然后自动删除
- 转录文本永久存储在您的账户中
- 您可以随时删除任何转录文本或整个账户
- 我们不会将您的数据用于训练
技术栈:
- Next.js 14(应用路由)
- Web Speech API(免费实时转录)
- AssemblyAI(专业文件转录,准确率超过 95%)
- OpenAI GPT-4o(AI 增强与翻译)
- Supabase(身份验证与存储)
- Stripe(支付)
- Tailwind CSS
- 托管在 Vercel 上
限制:
- 实时转录在 Firefox 中无法使用(不支持 Web Speech API)
- 免费版的准确性取决于 Chrome 的语音引擎
非常希望能收到关于用户体验、定价或功能想法的反馈。考虑将核心转录组件开源。
嗨,HN,
我创建这个库是因为我想要一种清理杂乱文本数据并提取个人身份信息(PII)的方法,而不需要将敏感信息发送到云API或处理脆弱的正则表达式模式。
该工具通过 llama.cpp 在本地运行量化模型,并使用从 Pydantic 模型生成的 GBNF 语法。这强制大型语言模型(LLM)输出严格遵循模式的有效 JSON,从而解决了小模型常见的可靠性问题。目前,它支持 Pandas 和 Polars 数据框,并且可以与任何 GGUF 模型配合使用。
它仍处于早期 alpha 阶段,因此在较旧的 CPU 上的性能可能会成为瓶颈,相较于标准字符串操作,我发现它在正则表达式失效的语义提取任务中非常有用。我非常欢迎对实现的反馈或优化建议。