返回首页
24小时热榜
大多数处理PDF或图像的产品实际上都在悄悄重建同样的东西:一个临时拼凑的“路由器”,负责选择调用哪个OCR/视觉API,规范化响应,并希望月底的账单是合理的。
DocsRouter就是这样一个产品层:一个稳定的API,可以与多个OCR引擎和视觉大语言模型(LLM)进行通信,允许您根据成本、质量和延迟对每个文档进行路由,并提供规范化的输出(文本、表格、字段),这样您的应用就不必关心使用了哪个提供商。
它是为那些认真处理文档的团队而设计的:发票/收据、合同、工资单、医疗/行政表格、物流文档等,这些团队要么被“我们几年前选择的OCR”困住,要么被新视觉模型的更迭所压倒。
目前,您可以获得一个REST API、简单的SDK(即将推出)、一些可插拔的后端(经典OCR + 更新的视觉模型)、一些基本的路由策略,以及一个可以上传文档并并排比较输出的游乐场。
我希望从HN(黑客新闻)获得关于两件事的反馈:
1. 如果您已经在处理多个OCR/视觉提供商,您自制的路由器是什么样的?您需要什么条件才能信任一个外部的路由器?
2. 您更喜欢使用这个产品,还是直接使用LLM/OCR提供商,并且有可能不时更换提供商?
演示和文档请访问: [https://docsrouter.com](https://docsrouter.com)