2作者: ses42550000015 天前原帖
嗨,HN, 我一直在开发一个专门针对机器学习数据集准备的OCR管道。它旨在处理复杂的学术材料,包括数学公式、表格、图形和多语言文本,并输出干净、结构化的格式,如JSON和Markdown。 一些特点: - 多阶段OCR,结合了DocLayout-YOLO、Google Vision、MathPix和Gemini Pro Vision - 能够提取和理解图表、表格、LaTeX风格的数学公式以及多语言文本(包括日语、韩语和英语) - 针对机器学习训练管道进行了高度调优,包括数据集生成和RAG或微调任务的预处理 包含了样本输出和基于真实考试的示例(如EJU生物、东京大学数学等)。 非常期待听到大家的反馈或改进建议。 GitHub: [https://github.com/ses4255/Versatile-OCR-Program](https://github.com/ses4255/Versatile-OCR-Program)
1作者: thathoo15 天前原帖
YourIVFPath是一个帮助准父母在美国寻找和比较试管婴儿(IVF)诊所的工具,利用来自CDC的透明数据驱动见解。<p>试管婴儿是一段非常个人化、情感上具有挑战性且财务上重要的旅程。然而,对于许多人来说,找到合适的诊所就像在黑暗中摸索——信息分散、成功率不明确、选择令人不知所措。<p>YourIVFPath旨在改变这一现状。我们的理念是将公开可用的诊所数据整合成一个简洁、易于访问的格式,以便家庭能够清晰、自信地做出明智的决策。<p>如果您认识正在探索生育治疗选项的人,希望这能为他们的旅程带来更多的透明度。<p>欢迎反馈和建议!<p>技术栈:我使用Supabase存储数据,使用Ruby进行数据抓取,使用StackBlitz的bolt.new进行网站设计和大部分React代码,使用Vercel进行部署,当然在每一个步骤中都使用了ChatGPT。所有数据均来自CDC。