返回首页
最新
嗨,HN,
我一直在开发一个专门针对机器学习数据集准备的OCR管道。它旨在处理复杂的学术材料,包括数学公式、表格、图形和多语言文本,并输出干净、结构化的格式,如JSON和Markdown。
一些特点:
- 多阶段OCR,结合了DocLayout-YOLO、Google Vision、MathPix和Gemini Pro Vision
- 能够提取和理解图表、表格、LaTeX风格的数学公式以及多语言文本(包括日语、韩语和英语)
- 针对机器学习训练管道进行了高度调优,包括数据集生成和RAG或微调任务的预处理
包含了样本输出和基于真实考试的示例(如EJU生物、东京大学数学等)。
非常期待听到大家的反馈或改进建议。
GitHub: [https://github.com/ses4255/Versatile-OCR-Program](https://github.com/ses4255/Versatile-OCR-Program)
YourIVFPath是一个帮助准父母在美国寻找和比较试管婴儿(IVF)诊所的工具,利用来自CDC的透明数据驱动见解。<p>试管婴儿是一段非常个人化、情感上具有挑战性且财务上重要的旅程。然而,对于许多人来说,找到合适的诊所就像在黑暗中摸索——信息分散、成功率不明确、选择令人不知所措。<p>YourIVFPath旨在改变这一现状。我们的理念是将公开可用的诊所数据整合成一个简洁、易于访问的格式,以便家庭能够清晰、自信地做出明智的决策。<p>如果您认识正在探索生育治疗选项的人,希望这能为他们的旅程带来更多的透明度。<p>欢迎反馈和建议!<p>技术栈:我使用Supabase存储数据,使用Ruby进行数据抓取,使用StackBlitz的bolt.new进行网站设计和大部分React代码,使用Vercel进行部署,当然在每一个步骤中都使用了ChatGPT。所有数据均来自CDC。
你好,
我是卢卡斯。我在运营Wisent,一家专注于表示工程的公司。我创建了保护机制,可以在潜在空间层面上阻止某些模式的LLM激活。现在它已经完全自托管并且开源。想象一下,能够阻止幻觉、LLM的有害思维或糟糕的代码生成。请告诉我它在你的使用案例中效果如何——我很乐意帮助你从中获得最大的价值。
了解更多信息,请访问 https://www.wisent.ai 或 https://www.lukaszbartoszcze.com