请分享您的真实经历。
什么是一个糟糕的经历,为什么?
返回首页
最新
我创建了TTSLab——一个免费的开源工具,可以直接在浏览器中使用WebGPU和WASM运行文本转语音和语音转文本模型。<p>无需API密钥,无需后端,数据不会离开你的设备。<p>当你打开网站时,你会立即听到声音——登陆页面会自动生成来自三句话的语音,完全在你的浏览器中,无需任何设置。<p>然后你可以自己尝试任何模型:输入文本,点击生成,立刻听到结果。模型只需下载一次并会被缓存到本地。<p>最具实验性的功能:一个完全在浏览器中的语音助手。它将语音转文本 → 大语言模型 → 文本转语音串联起来,所有操作都在你的GPU上通过WebGPU本地运行。你可以与AI进行口头对话,而无需任何网络请求。<p>当前支持的模型:
- TTS:Kokoro 82M、SpeechT5、Piper (VITS)
- STT:Whisper Tiny、Whisper Base<p>其他功能:
- 并排模型比较
- 在你的硬件上进行速度基准测试
- 对支持的模型进行流式生成<p>来源:<a href="https://github.com/MbBrainz/ttslab" rel="nofollow">https://github.com/MbBrainz/ttslab</a>(MIT)<p>我特别希望得到的反馈:
1. 在你的硬件上性能感觉如何?
2. 我应该添加哪些模型?
3. 语音助手对你有效吗?这是最具实验性的部分。<p>基于ONNX Runtime Web(<a href="https://onnxruntime.ai" rel="nofollow">https://onnxruntime.ai</a>)和Transformers.js构建——非常感谢这些社区使得浏览器中的机器学习推理成为可能。
Sowbot是一款开放硬件的农业机器人,旨在弥补“原型差距”,这一问题使得大多数农业机器人初创公司和研究项目面临困境——在你能够开始关注真正感兴趣的内容之前,往往需要花费超过18个月的时间来处理驱动程序、网络、安全监控和用户界面等问题。
该硬件围绕一个可堆叠的10×10厘米计算模块构建,配备两个ARM Cortex-A55单板计算机——一个用于ROS 2导航/扩展卡尔曼滤波(EKF)定位,另一个专门用于视觉/YOLO推理,通过单根以太网电缆连接。
通过双RTK GNSS实现厘米级定位,使用CAN总线进行现场通信,并通过运行Lizard固件的ESP32实现实时电机控制。
所有内容——原理图、PCB布局、固件——均在开放许可证下发布。
软件栈运行在RoSys/Field Friend(适合希望快速迭代的团队)或DevKit ROS(适合已经在ROS生态系统中的团队)上。其理念是,一个国家的实验室可以通过共享Docker镜像来复现另一个实验室的实验。
当前状态:Open Core大脑已基本制造完成,Sowbot全尺寸机身有详细的物料清单,但尚未组装,我们还有两个较小的开发平台(Mini和Pico)正在不同阶段的测试中。
我们是一个小型志愿者团队,正在寻找贡献者——无论是硬件、ROS、固件、文档,或是你能提供的任何帮助。
最好的起点是我们的Discord: [https://discord.gg/SvztEBr4KZ](https://discord.gg/SvztEBr4KZ)——如果你更喜欢直接参与讨论,我们每周都有一次电话会议。
GitHub:[https://github.com/Agroecology-Lab/feldfreund_devkit_ros/tree/caatinga-dev](https://github.com/Agroecology-Lab/feldfreund_devkit_ros/tree/caatinga-dev)
大家好!我们是 Lev 和 Justin,PgDog 的作者(<a href="https://pgdog.dev">https://pgdog.dev</a>),这是一个为 PostgreSQL 提供连接池、负载均衡和数据库分片的工具。如果你在构建高流量的应用程序,你会知道第一个崩溃的往往是数据库。我们通过一个网络代理来解决这个问题,它不需要对应用程序代码进行更改或数据库迁移。
去年的帖子:<a href="https://news.ycombinator.com/item?id=44099187">https://news.ycombinator.com/item?id=44099187</a>
最重要的更新:我们已经投入生产。分片使用频繁,直接到分片的查询(每个查询一个分片)几乎总是有效。跨分片(或多数据库)查询仍在持续改进中,但我们正在取得进展。
聚合函数如 count()、min()、max()、avg()、stddev() 和 variance() 正在正常工作,无需重构应用程序。PgDog 在传输过程中计算聚合,同时透明地重写查询以获取任何缺失的信息。例如,多数据库的平均计算需要总行数来计算原始总和。如果查询中没有 count(),PgDog 会将其添加到查询中,并从发送给应用程序的行中移除。
排序和分组功能正常,包括 DISTINCT,如果结果中引用了列。支持超过 10 种数据类型,如时间戳(tz)、所有整数、varchar 等。
跨分片写入,包括模式更改(CREATE/DROP/ALTER),现在是原子性的,并且在所有分片之间通过两阶段提交进行同步。PgDog 在内部跟踪事务状态,如果第一阶段失败,将回滚事务。你无需对 ORM 进行 monkeypatch:PgDog 会拦截 COMMIT 语句,并执行 PREPARE TRANSACTION 和 COMMIT PREPARED。
全分片表,即复制或镜像(在所有分片上相同),支持原子读写。这一点很重要,因为大多数数据库无法完全分片,所有数据库上会有一些必须保持同步的公共数据。
多元组插入,例如,INSERT INTO table_x VALUES ($1, $2), ($3, $4),会被我们的查询重写器拆分并自动分发到各自的分片。它们被 Prisma、Sequelize 等 ORM 使用,因此现在也可以在不更改代码的情况下工作。
分片键可以被修改。PgDog 会拦截并将更新语句重写为 3 个查询:SELECT、INSERT 和 DELETE,将行在分片之间移动。如果你使用 Citus(对其他人来说,Citus 是一个用于数据库分片的 Postgres 扩展),这可能值得一看。
如果你像我们一样更喜欢将整数作为主键而不是 UUID,我们在 PgDog 内部构建了一个跨分片的唯一序列。它使用系统时钟(和其他几个输入),可以像 Postgres 函数一样调用,并会自动将值注入查询中,因此像 ActiveRecord 这样的 ORM 仍然可以开箱即用。它是单调递增的,就像真正的 Postgres 序列一样,能够每秒生成多达 400 万个数字,范围达到 69.73 年,因此暂时不需要迁移到 UUIDv7。
<pre><code> INSERT INTO my_table (id, created_at) VALUES (pgdog.unique_id(), now());
</code></pre>
重新分片现在是内置的。我们可以每秒移动数GB的表,通过在副本之间并行化逻辑复制流来实现。这真的很酷!上次我们在 Instacart 尝试这个时,花了超过两周的时间在两台机器之间移动 10 TB。现在,我们可以在几个小时内完成,这在很大程度上得益于核心团队在 Postgres 16 中为流式副本添加逻辑复制槽的支持。
没有良好的负载均衡器,分片几乎无法工作。PgDog 可以监控副本,并在故障转移期间将写入流量转移到提升的主节点。这适用于托管的 Postgres,如 RDS(包括 Aurora)、Azure Pg、GCP Cloud SQL 等,因为它只需通过“SELECT pg_is_in_recovery()”轮询每个实例。主节点选举尚未支持,因此如果你使用 Patroni 自托管,暂时应保留它,但你不再需要在数据库前运行 HAProxy。
负载均衡器变得相当智能,能够处理 SELECT FOR UPDATE 和带有 INSERT/UPDATE 语句的 CTE 等边缘情况,但如果你仍然希望在代码中处理读写分离,也可以通过手动路由来实现。这通过在运行时给 PgDog 提供提示来工作:连接参数(-c pgdog.role=primary)、SET 语句或查询注释。如果你的应用程序中有多个连接池,你可以用一个连接到 PgDog 替代它们。对于多线程的 Python/Ruby/Go 应用程序,这有助于减少内存使用、I/O 和上下文切换的开销。
说到连接池,PgDog 可以自动回滚未完成的事务,并排空和重新同步部分发送的查询,努力保持与数据库的连接。如果你见过 Postgres 因应用程序崩溃引起的连接风暴而达到 100% CPU,这可能适合你。排空连接通过接收和丢弃来自被遗弃查询的行,并通过 Postgres 线协议发送 Sync 消息来工作,这会清除查询上下文并将连接恢复到正常状态。
PgDog 是开源的,欢迎以任何形式的贡献和反馈。和往常一样,所有功能都是可配置的,可以随时开启或关闭,因此如果你选择试用,可以按照自己的节奏进行。我们的文档(<a href="https://docs.pgdog.dev">https://docs.pgdog.dev</a>)也应该能提供帮助。
感谢阅读,祝你编程愉快!
我创建EloPhanto是因为我想要一个能够在我的机器上实际执行任务并具备完全可见性的AI代理——而不是一个黑箱API调用。它在本地运行,并利用您现有的会话控制真实的Chrome浏览器(47个工具)。
其突出特点是:当EloPhanto遇到一个没有工具可以处理的任务时,它会自主编写Python代码,进行测试,自我审查,并永久集成这个新工具。到目前为止,它已经以这种方式为自己构建了99个以上的工具。
其他功能包括:
- 多渠道网关(命令行界面、Telegram、Discord、Slack),统一会话
- MCP工具服务器支持(连接任何MCP服务器)
- 文档和媒体分析(PDF、图像、OCR、RAG)
- 代理邮箱(用于服务注册/验证的独立收件箱)
- 加密支付钱包(基础链,消费限额)
- TOTP身份验证器(自主处理双重身份验证)
- 不断发展的身份,能够从经验中学习
- 技能系统与EloPhantoHub市场(28个捆绑技能)
它是开源的(Apache 2.0),以本地优先为设计理念,旨在成为您的个人AI操作系统。
该项目非常新——目前在GitHub上获得了6颗星。我非常希望能收到关于架构、自我开发方法或您希望在本地代理中看到的功能的反馈。
距离上一次HN帖子已经过去几个月了。我为这个应用添加了许多新功能。其中之一是服务功能——现在您可以运行后台任务,比如网页服务器或游戏服务器。期待听到您的反馈,谢谢!
经过多年的为公司开发产品,我终于为自己打造了一款应用。<p>Aura Tracker: Habits & Goals 现在已在 iOS 应用商店上线。<p>这是一套有明确观点的生产力系统,连接了身份 → 目标 → 习惯 → 任务 → 深度工作 → 洞察 → 反思,所有这些都在一个流畅而连贯的流程中。我之所以开发它,是因为我使用的大多数生产力应用都感觉像是生产力工具。此外,我受到许多相关书籍的影响,想要构建一个可以将我所有学习成果付诸实践的应用。<p>附言:这几乎是我待办事项列表上的一项任务,已经快十年了。我去年辞去了工作,全心投入独立创始人的模式。只要我在职,我就一直在关注其他人发布 Show HN,并不断想知道我的时机何时到来。现在它终于来了,感觉真好。这种快乐就像我小时候在 Turbo C 编辑器上写下第一个“Hello World”程序时的感觉(那是很久以前的事)。<p>我不确定这个产品会如何,但我创造了一个将永远留在互联网上的东西(并希望能改善使用它的人的生活),这种感觉是任何企业奖金或限制性股票单位都无法比拟的!!