1 分•作者: yeekal•8 个月前•原帖

*DeepSeek OCR* 是一款下一代文档理解工具，采用最先进的双引擎系统，结合了 *DeepSeek-OCR* 的精准度和 *PaddleOCR-VL* 的高速效率。我们的平台旨在掌握各种具有挑战性的OCR任务，使用户能够即时且准确地数字化：* *扫描和数字PDF*（保留原始布局） * *复杂的手写笔记*（来自讲座、会议等） * *数学公式*（输出干净的LaTeX和Markdown） * *表格和表格数据* * *来自任何图像或截图的文本*我们在真正免费的无障碍体验中提供企业级的准确性——无需注册或付款——使先进的文档智能对每个人都可及。## *主要特点** *最先进的准确性和速度：* 我们的双引擎系统动态利用最佳模型，提供复杂文档的精准度和标准任务的高速性能。已证明在公共基准测试中超越领先的替代方案。 * *智能布局识别：* 这是我们的核心优势。我们不仅仅提供一堆文本。我们的AI经过训练，能够理解并保留文档的原始布局，包括列、列表甚至复杂的表格。 * *多源能力：* 超越完美的PDF。从具有挑战性的现实世界来源中获得惊人的结果，包括*手写笔记*、*相机扫描的教科书页面*和*数字截图*。 * *多功能Markdown和LaTeX输出：* 为现代工作流程而设计，我们的工具为您的笔记（Notion、Obsidian）提供干净、结构化的Markdown，为您的学术论文提供标准的LaTeX，节省您数小时的格式调整时间。 * *真正免费且无障碍：* 这是我们的承诺。享受无限的高质量OCR转换，无需注册、信用卡、无水印，也没有“免费试用”的限制。它旨在从第一点击起就真正有用。 * *广泛的语言支持：* 我们的底层引擎支持超过100种语言，确保对来自全球范围文档的文本和符号进行强大的识别。

Android 16 QPR1 源代码已在 AOSP 上发布。

1 分•作者: nickexyz•8 个月前•原帖

英国的通信管理局正在根据《在线安全法》监测虚拟专用网络（VPN）。

1 分•作者: robtherobber•8 个月前•原帖

展示HN：Bebored – 停止无尽滑动的无聊锻炼（iOS/Android）

1 分•作者: oparinov•8 个月前•原帖

bebored 是一款小型移动应用，提供短暂的“无聊训练”（5-10分钟），旨在培养应对无聊的能力，并将其带入日常生活。该应用已在 iOS 和 Android 平台上线；链接可在 <a href="https://beboredapp.com" rel="nofollow">https://beboredapp.com</a> 找到。 _我为什么要开发它_ 我之前在 Vivino 负责产品和工程。在此期间及之后，我不断听到朋友和同事们说：“我知道冥想会有帮助，但我坚持不下去。那些应用感觉太灵性或时间太长。” 我开始尝试一些非常小且有限的练习，这些练习更像是“锻炼”而不是“课程”：盯着一个点看，观察你的注意力如何变化，忍耐查看手机的冲动，专注于呼气几分钟等等。早期的测试者反馈，他们更愿意开始这些练习，而不是进行20分钟的冥想，其中一些人还将其作为进入工作状态的前奏。 bebored 就是这个实验转变为应用的结果。 _它的功能_ 该应用目前有五种类型的“无聊训练”，每个训练时长为5-10分钟。应用内还有一个日记功能“Moss”，可以在每次训练后总结你所写的内容，并尝试指出随时间变化的模式（例如：“你大多数提到焦虑的条目都是在晚上”）。 _与典型冥想应用的不同之处_ - 它避免使用“冥想”语言和灵性框架；所有内容都以务实的术语描述（“这是练习，关注这个”）。 - 课程故意设置得短且有限；目标是“我现在可以做一个练习”，而不是“我应该成为一个冥想的人”。 - 视觉效果简单且高对比度，而不是自然场景；更像是一个小型游戏界面，而非健康应用。 - 重点专注于无聊和不安作为训练的对象，而不是将平静作为主要目标。 我希望获得的反馈 ？“无聊训练”的框架是否合理，还是让人困惑？？如果你尝试了，在哪些地方你在入门或开始第一次训练时遇到了困难？？日记功能 + 总结是否有用，还是你会完全跳过？？从开发者/产品的角度来看，如果这是你的产品，你会首先改变什么？

Vex8s：通过解析Kubernetes的SecurityContext生成VEX文档

1 分•作者: alegrey91•8 个月前•原帖

一位母亲和一位牧师射杀了两只逃脱的实验猴。

2 分•作者: _tk_•8 个月前•原帖

埃隆·马斯克表示，特斯拉机器人可以防止未来的犯罪。

1 分•作者: saubeidl•8 个月前•原帖

导致BBC危机的政治干预

3 分•作者: strogonoff•8 个月前•原帖

展示HN：适合孩子的离线纸笔游戏（无屏幕，无广告）

2 分•作者: malczak•8 个月前•原帖

展示HN：YaraDB – 基于FastAPI构建的轻量级开源文档数据库

5 分•作者: ashfromsky•8 个月前•原帖

灾难模型

1 分•作者: Gedxx•8 个月前•原帖

ChatGPT 水印去除工具 – 即时且安全的工具

1 分•作者: lizbo•8 个月前•原帖

请捐款以维持网络时间协议的运行 – 目标 1000 美元

1 分•作者: gastonmorixe•8 个月前•原帖

你想知道你的音域范围吗？快来测试一下你的声乐范围吧！

1 分•作者: bitvvip•8 个月前•原帖

HAProxy统一网关（测试版）

1 分•作者: rfmoz•8 个月前•原帖

人工智能正在取代我们的工作，现在连细微的线条也不例外。

1 分•作者: velvet_thunderr•8 个月前•原帖

振动黑客攻击填充oracle

1 分•作者: beny23•8 个月前•原帖

我教授创意写作。这就是人工智能对学生的影响。

5 分•作者: the-mitr•8 个月前•原帖

NaNoWriMo与迫在眉睫的恐惧所带来的创造力

2 分•作者: maguay•8 个月前•原帖

展示HN：全语言自动语音识别 – 支持1,600种语言的全球语音识别

1 分•作者: lu794377•8 个月前•原帖

嗨，HN，我们开发了Omnilingual ASR，一个大规模的多语言语音识别系统，旨在让全球的转录变得更加可及。它支持1600多种语言，包括500种之前不被支持的低资源语言，所有语言的识别准确率均达到最先进的水平。与通常仅限于主要语言的语音识别模型不同，Omnilingual ASR在430万小时的多语言音频上进行训练，对于78%的支持语言，其字符错误率低于10%。它的参数规模从3亿到70亿不等，允许用户根据任务需求在速度和精度之间进行平衡。主要特点： • 1600多种语言覆盖 – 可通过零样本学习扩展到5400多种语言 • 零样本适应 – 仅需几个上下文示例即可添加新语言 • 多说话人检测 – 自动识别和区分说话人 • 闪电般的处理速度 – 数小时的音频在几分钟内完成转录 • 灵活的集成 – 提供REST API、Python SDK和网页用户界面，适用于云端或边缘计算应用场景：全球媒体字幕、企业转录、多语言在线学习、无障碍服务和语言研究。我们希望获得以下方面的反馈： • 低资源语言转录的潜在应用场景 • 集成需求（API、SDK、插件） • 研究或语言保护应用 <a href="https://www.omnilingualasr1.com/?i=d1d5k" rel="nofollow">https://www.omnilingualasr1.com/?i=d1d5k</a>

上一页 1...3472 3473 3474 3475 3476...6918 下一页

最新