返回首页
最新
嘿,HN,
我们是 Chonkie 的开发者,一个强大且易于使用的分块库。去年十一月,我们在 HN 上介绍了 Chonkie OSS(<a href="https://news.ycombinator.com/item?id=42100819">https://news.ycombinator.com/item?id=42100819</a>),并收到了非常棒的反馈。今天,我们很高兴地分享 Chonkie Cloud,这是一个完全托管的分块服务,并推出了新工具,使构建和调试 RAG 系统比以往任何时候都更容易。
---
为了提供一些背景信息:
我们在去年底将 Chonkie 作为一个开源项目推出。几周前,我们决定全职投入这个项目。不幸的是,这一转变并没有我们预期的那么顺利。由于一些法律问题,我们不得不在一个新的代码库中从头开始重建整个项目。
重新开始的过程很糟糕,但这给了我们机会来整理和构建更快、更干净、更好的东西。你可以在这里查看新的代码库:<a href="https://github.com/chonkie-inc/chonkie">https://github.com/chonkie-inc/chonkie</a>
---
我们今天推出的内容:
- **Chonkie Cloud** – 一个完全托管的分块服务。只需发送你的文本,就能获得分块结果。它支持我们所有的分块器,并配有一个可视化 RAG 的游乐场。试试看:<a href="https://chonkie.cloud" rel="nofollow">https://chonkie.cloud</a>(无需信用卡)
- **Chonkie Recipes** – 预定义的分块配置,帮助你快速入门。如果你不确定使用哪些设置,只需在我们的配方中找到最接近的匹配。这些配置适用于递归和延迟分块器。可在这里获取:<a href="https://huggingface.co/datasets/chonkie-ai/recipes" rel="nofollow">https://huggingface.co/datasets/chonkie-ai/recipes</a>
- **Chonkie Vizard** – 一个在开发过程中可视化分块输出的工具。如果你曾经用充满破折号和星号的打印语句进行调试,这个工具就是为你准备的。
安装方法:`pip install "chonkie[viz]"`
示例用法 (1):`viz.print(chunks)` # 在终端打印
示例用法 (2):`viz.save("out.html", chunks)` # 保存以备后用
---
接下来要做的事情:
- 一个代码分块器
- 用于清理和准备数据的文件“厨师”
- 与向量数据库和数据提取工具的集成
- 支持更多语言(TypeScript 是我们列表上的第一位)
---
我们非常希望能收到关于我们正在构建的内容的反馈。如果你有功能请求或想法,请在代码库上提出问题(<a href="https://github.com/chonkie-inc/chonkie">https://github.com/chonkie-inc/chonkie</a>)或在这里评论。
谢谢!
嗨,HN!<p>我们非常高兴地推出我们全新且经过大量重构的SimBricks版本,这是一款我们为计算机系统开发的虚拟原型解决方案!无论您是在构建下一代模拟处理器、光学人工智能加速器,还是围绕这些组件构建计算机系统,SimBricks都为您提供了一种测试完整系统的手段,包括多个机器、网络以及完整的软件栈。我们目前正在与首位试点客户探讨的另一个有趣用例是,在构建新计算机组件时,提供更具互动性的演示,以支持早期销售。<p>SimBricks通过对不同现有或自定义模拟器(如qemu、gem5、ns3、omnet、simics、verilator、vivado等)进行模块化组合(高效组合和同步),使这一切成为可能,适用于不同的系统组件。我们可以扩展到模拟包含数百个组件的系统,而不会显著降低速度。根据具体用例,我们的模拟范围从简单的行为模型(例如SystemC)到详细的门级仿真应有尽有。<p>除了让这一切成为可能之外,我们的一个关键优势是使其(相对)易于入门,并提供灵活性以便将其集成到其他工具和流程中,既可以提供输入,也可以处理输出。<p>请查看SimBricks,并告诉我们您的想法。注册后只需执行pip install,您就可以开始使用了!
我建立了一个平台,让用户能够验证自己的身份并进行背景调查,同时安全地分享清白记录的证明,而不暴露个人信息,如全名、地址或出生日期。
这是我们发现其他服务中缺失的地方:他们将数据锁定在系统中,并在你想证明自己安全时分享过多信息。我们构建了一个以隐私为首的解决方案,让你掌控自己的数据。
使用案例:你是一个高知名度的人士,或者只是注重隐私,希望在约会应用上证明自己是安全的,而不想透露你的居住地址或全名。我们的平台为你提供一个经过验证的徽章,基于真实的检查,你可以与他人分享。没有过度分享,也没有可以被人跟踪的集中资料。
现在是免费的,我们正在与约会应用整合,以便用户能够证明安全性和可信度,而无需泄露身份的关键信息。
我们非常欢迎反馈、问题或合作伙伴。
隐私和用户拥有的数据是未来——我们正在努力使这一切成为现实。
www.charisma-check.com
今天早上我看到了一则似乎对科技工作者非常重要的新闻[1]。我想提交这条消息,但却被带到一个页面,显示这条帖子已经被标记为“ flagged”,尽管在原始提交后的4小时内获得了400多个赞。然而,由于这条帖子被标记,我无法在首页上看到它。是谁在决定哪些内容被标记,为什么看起来没有任何真正重要的DOGE新闻能够浮出水面呢?<p>[1] https://news.ycombinator.com/item?id=43691142#43692607