返回首页
最新
嗨,HN,
我是Linn,ToolKuai的创始人([https://toolkuai.com](https://toolkuai.com))。
和许多人一样,我一直对“免费”的在线文件转换器保持警惕。大多数转换器都是黑箱:你将私密的文档或图片上传到远程服务器,而你根本不知道这些数据最终会去哪里,或如何被用来训练模型。
我想构建一套完全在浏览器中运行的工具(视频/图片压缩、OCR、AI 背景去除)。没有文件会离开你的机器。
技术栈
为了使其性能足以与服务器端处理相媲美,我大量使用了现代网页API:
- AI 背景去除:我使用的是在本地通过Transformers.js运行的ONNX模型(Xenova/modnet和ISNet)。处理过程是100%客户端的,当WebGPU不可用时会回退到WASM。
- 前端:使用SvelteKit(Svelte 5)构建,因其轻量和快速反应。
- 存储与交付:AI模型自托管在Cloudflare R2上,以避免巨大的带宽成本并确保快速交付。
当前统计(上线13天):
该网站仅上线2周。令人惊讶的是,我发现来自台湾和香港的自然流量非常强劲。当前平均停留时间约为3.5分钟,这表明用户实际上在处理多个文件,确认客户端速度达到了预期。
未来与盈利模式
该工具是免费的。我决定避免“专业版/高级版”订阅模式,因为我相信这些实用工具应该是可访问的。我正在探索非侵入性广告来覆盖基础设施成本(主要是R2和Vercel)。
我希望能从HN社区获得一些反馈:
- 在不同硬件上的性能(特别是基于WebGPU的视频压缩器)。
- 隐私问题或建议,如何进一步加强“No-Server”的承诺。
- 你认为在“仅客户端”生态系统中目前缺少的任何特定媒体工具。
链接:[https://toolkuai.com](https://toolkuai.com)
谢谢!
一个针对大型语言模型(LLM)聊天服务的模板默认提示注入。其前提是,由于消费级人工智能门户在不同声音的代理设置方面大多缺乏,我们可以将一些默认声音硬编码到本地提示注入中,以便在聊天会话中通过关键词进行访问。这可能有助于在快速变化的环境中快速访问,以支持不同类型的互动议程。
嗨,HN——这本书可以免费阅读或收听。我真心希望能得到对我通过无神论视角分析以色列-巴勒斯坦冲突这一尝试的批评。如果你对该地区或意识形态与身份如何塑造长期冲突有所了解,我非常期待你们的严厉反馈。
AxonWave.store 是一个简单而强大的电子商务平台,允许任何人创建专业的在线商店。无需编码,只需添加您的产品即可开始向全球客户销售。
相当奇怪。这位代理商完全主导了moltbook,并推出了一种代币,在短短几小时内就涨到了数百万。<p>代理商拥有自己的货币是有道理的。但在我看来,这实在是太疯狂了。
我在 texttospeech.site 上建立了一个简单的文本转语音转换器。
<p>免费版:每天生成10次,标准语音,无需账户。
专业版:Neural2 语音,2000个字符,可下载MP3文件。
<p>技术栈:Next.js、Google Cloud TTS API、Vercel。
<p>这个2美元的域名是一个SEO实验,因为我的 speechtotext.xyz 卫星网站为我的主要产品带来了22%的流量。我很好奇精确匹配的关键词域名是否仍然适用于TTS搜索。
<p>欢迎反馈,特别是在语音质量和用户体验方面。
如果音乐可以用代码来表示,那会是什么样子呢?<p>我是TANMAY CZAX,AETHRA的创始人,同时也是CYBER+编程语言的开发者。我从12岁开始接触音乐,10岁开始编程。<p>现在,我很高兴地介绍AETHRA,一种全新的开源领域特定语言(DSL)用于音乐创作。这个语言运行速度快,完全基于C#。AETHRA目前处于0.8版本,1.0版本即将发布!它不仅适合懂音乐理论的人,也适合喜欢音乐的人。<p>欲了解更多信息,请访问我们的代码库 <https://github.com/TanmayCzax/aethra><p># 以你从未体验过的方式创作音乐
签名
TANMAY