2作者: tomelliot15 天前原帖
我一直在尝试使用MCP服务器,以便更好地了解这个生态系统。我发现了一个真正的问题,但不确定在这种架构下有哪些解决方案——我是不是漏掉了什么? 大型语言模型(LLM)总是处于任何管道的中间。这意味着在每次工具调用之间,可能会出现混乱和数据丢失的翻译(更不用说与进程之间直接传输数据相比,这种方式极其缓慢且浪费资源)。 我使用的例子是:我希望Claude为我协调对Stripe数据的分析。我让它获取上个月的所有交易并将其写入磁盘(作为第一步,在实际执行任何操作之前)。由于从Stripe输出的数据在写入磁盘之前需要经过LLM处理,这导致数据完全混乱,只写入了很小一部分。 我正在努力拼凑出一个让聊天机器人在我的生活中做有用事情的拼图。是否存在一个未来状态,在这个状态下,这个问题不再是固有的障碍?我想到了一些解决方法: - 使用Python解释器,让LLM编写代码。但这样一来,使用Stripe的Python库或API还有什么意义呢? - 建立某种MCP服务器之间的通信协议。此时,我们实际上是在为LLM构建一个操作系统。
5作者: lmazgon15 天前原帖
Benchi 是一个命令行工具,用于运行基准测试和收集指标。它使用 Docker Compose 来编排基准测试所需的基础设施和工具,使得在不同机器上重复运行变得可行。它允许您对不同工具运行相同的基准测试,并比较收集到的结果。 该仓库包含一个简单的示例。有关更详细的示例,请查看我们如何使用 Benchi 比较在 Conduit 和 Kafka Connect 上运行的数据管道,这两者都是数据流工具(仍在进行中):[https://github.com/ConduitIO/streaming-benchmarks](https://github.com/ConduitIO/streaming-benchmarks)
1作者: daniel-munro15 天前原帖
我对缩小数学常数(如拉姆齐数、忙碌海狸函数等)的界限的集体过程感到着迷。我想创建一些可视化图形,但找不到方便的历史界限更新来源,因此我创建了这个仓库。 这个汇编数据的两个主要目标是以视觉上信息丰富的方式呈现数据,方便浏览,并提供多种格式(如JSON、CSV等)供下载。 我并不是专业的数学家,因此欢迎任何建议,以便使这个项目对数学家和爱好者更有用、更直观。也欢迎通过GitHub讨论区进行贡献!
1作者: lerno15 天前原帖
从这里获取:<a href="https://github.com/c3lang/c3c" rel="nofollow">https://github.com/c3lang/c3c</a> <p>在2019年,我在为C2语言贡献代码时,开始了“C3”这个宠物项目,期间在等待拉取请求被批准……</p> <p>现在已经过去6年,C3正朝着1.0版本稳步前进,上周发布了0.7.0版本。</p> <p>与其他C语言替代品不同,C3试图在不考虑向后兼容性的情况下对C语言进行演进。</p> <p>C3为C语言添加的功能包括:</p> <ul> <li>模块系统</li> <li>语义宏和编译时反射</li> <li>轻量级泛型模块</li> <li>零开销错误处理</li> <li>内置切片和SIMD类型</li> <li>渐进式合约</li> <li>调试模式下的内置检查</li> </ul> <p>您可以在网站上找到更多详细信息:<a href="https://c3-lang.org" rel="nofollow">https://c3-lang.org</a></p> <p>查看示例可能会很有趣:<a href="https://c3-lang.org/language-overview/examples/" rel="nofollow">https://c3-lang.org/language-overview/examples/</a>,看看这个语言在一些简单示例中的表现。</p> <p><i>以下是一些可能感兴趣的其他链接:</i></p> <p>我之前在HN上发布过关于C3的内容,特别是:</p> <ul> <li><a href="https://news.ycombinator.com/item?id=24108980">https://news.ycombinator.com/item?id=24108980</a></li> <li><a href="https://news.ycombinator.com/item?id=27876570">https://news.ycombinator.com/item?id=27876570</a></li> <li><a href="https://news.ycombinator.com/item?id=32005678">https://news.ycombinator.com/item?id=32005678</a></li> </ul> <p>以下是一些关于C3的采访:</p> <ul> <li><a href="https://www.youtube.com/watch?v=UC8VDRJqXfc" rel="nofollow">https://www.youtube.com/watch?v=UC8VDRJqXfc</a></li> <li><a href="https://www.youtube.com/watch?v=9rS8MVZH-vA" rel="nofollow">https://www.youtube.com/watch?v=9rS8MVZH-vA</a></li> </ul> <p>这里有一个系列,展示了在C3中完成各种任务:</p> <ul> <li><a href="https://ebn.codeberg.page/programming/c3/c3-file-io/" rel="nofollow">https://ebn.codeberg.page/programming/c3/c3-file-io/</a></li> </ul> <p>一些项目:</p> <ul> <li>Gameboy模拟器 <a href="https://github.com/OdnetninI/Gameboy-Emulator/" rel="nofollow">https://github.com/OdnetninI/Gameboy-Emulator/</a></li> <li>RISCV裸机Hello World: <a href="https://www.youtube.com/watch?v=0iAJxx6Ok4E" rel="nofollow">https://www.youtube.com/watch?v=0iAJxx6Ok4E</a></li> <li>“Daemonheim的深渊”类roguelike <a href="https://github.com/TechnicalFowl/7DRL-2025" rel="nofollow">https://github.com/TechnicalFowl/7DRL-2025</a></li> </ul>
2作者: snehanairdoc15 天前原帖
我们最近进行了深入的基准测试,将Docsumo的专有OCR技术与Mistral OCR和Landing AI的Agentic文档提取进行了比较。我们的目标是评估它们在实际文档处理任务中的表现,特别是在复杂布局和低质量扫描的情况下。 <p>主要发现:</p> <p>准确性:Docsumo的OCR在各种文档类型(包括发票和银行对账单)的文本提取中表现出更高的精确度。</p> <p>布局保持:我们的技术更有效地保持了文档的原始结构,确保提取数据的可用性更好。</p> <p>处理速度:Docsumo实现了更快的处理时间,使其更适合高容量的文档处理任务。</p> <p>为了确保透明性和可重复性,我们已将基准测试结果公开。您可以在这里查看并排的输出、准确性评分和布局比较:</p> <p><a href="https://huggingface.co/spaces/avinash112/ocr-benchmark" rel="nofollow">https://huggingface.co/spaces/avinash112/ocr-benchmark</a></p> <p>有关我们方法论和详细发现的全面分析,请参阅我们的完整报告:</p> <p>[插入博客链接]</p> <p>我们邀请社区审查我们的发现,并分享对生成式OCR工具在生产环境中准备情况的见解。它们真的能胜任这个任务吗?</p>
40作者: joshdickson15 天前原帖
嗨,HN!<p>今天我很高兴地推出 OpenNutrition:一个免费的、遵循 ODbL 许可的日常通用、品牌和餐厅食品的营养数据库,一个可以浏览网络以导入新食品的搜索引擎,以及一个将数据库和搜索功能整合为免费的宏观追踪应用的伴侣应用。<p>持续记录你所吃的食物已被证明有助于长期健康结果(1)(2),但轻松做到这一点依赖于拥有一个大型、准确且最新的营养数据库。免费的公共数据库往往过时、难以导航,并且缺乏关键的覆盖(如品牌餐厅食品)。用户生成的数据库可能不可靠或是闭源的。商业数据库则伴随持续的、通常是按座位收费的许可费用,以及限制创新的使用限制。<p>作为一名业余的力量举运动员和长期保持体重的人,帮助他人追求健康目标是我非常关心的事情。在去年退出我的上一家初创公司后,我想探讨使用大语言模型(LLMs)创建所需的数据库和基础设施,以打造一个优秀的食品记录应用,并使其成本工程化,以便免费和广泛分发,因为我相信这些工具的可用性是公共利益。这促成了我今天发布的数据集;营养数据是公共记录,其组织和传播也应该如此。<p>数据库中有什么?<p>- 5,287 种常见日常食品,3,836 种准备好的通用餐厅食品,以及来自约 50 家美国热门餐厅连锁的 4,182 种独特菜单项;食品具有标准化名称、一致的数值份量、估计的微量营养素轮廓、描述,以及尽可能引用 USDA、AUSNUT、FRIDA、CNF 等的来源。<p>- 313,442 种最受欢迎的美国品牌超市产品,具有标准化名称、解析的份量和添加剂/过敏原数据,基于品牌的 USDA 数据;最受欢迎的 1% 产品有估计的微量营养素数据,目标是实现全面覆盖。<p>即使是最大的商业数据库,在搜索没有现有覆盖的食品或自定义时也可能令人沮丧。为了解决这个问题,我创建了一个实时版本,使用与构建核心数据库相同的方法,可以在需要时浏览网络以了解新食品或食品自定义(例如,高度定制的星巴克订单)。网络上有一个有限的演示,在应用内你可以通过文本搜索、条形码扫描或图像记录食品,所有这些都可以在需要时搜索网络为你导入食品。通过这些搜索发现的食品会反馈到数据库中,我计划在覆盖范围扩大时发布更新版本。<p>- 搜索与探索: <a href="https://www.opennutrition.app/search" rel="nofollow">https://www.opennutrition.app/search</a><p>- 方法论/关于: <a href="https://www.opennutrition.app/about" rel="nofollow">https://www.opennutrition.app/about</a><p>- 获取 iOS 应用: <a href="https://apps.apple.com/us/app/opennutrition-macro-tracker/id6670272666">https://apps.apple.com/us/app/opennutrition-macro-tracker/id...</a><p>- 下载数据集: <a href="https://www.opennutrition.app/download" rel="nofollow">https://www.opennutrition.app/download</a><p>OpenNutrition 的 iOS 应用提供免费的基本记录和有限数量的主动搜索功能,以及支出追踪和持续的饮食建议,类似于一流的付费应用。付费层($49/年)解锁额外的搜索和功能(数据备份、优先覆盖记录食品的微量营养素),并帮助资助进一步开发和更广泛的库覆盖。<p>我很想听听你的反馈、问题和建议——无论是关于数据库本身、一个非常好的/糟糕的搜索结果,还是应用。<p>1. Burke 等人,2011,<a href="https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3268700/" rel="nofollow">https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3268700/</a><p>2. Patel 等人,2019,<a href="https://mhealth.jmir.org/2019/2/e12209/" rel="nofollow">https://mhealth.jmir.org/2019/2/e12209/</a>