2作者: andy895 个月前原帖
我们构建了一个简单的 SAML 测试工具,您可以在无需注册的情况下配置身份提供者(IDP)和服务提供者(SP)设置。非常适合快速测试 SAML 实现或进行配置实验。 主要功能: - 配置 IDP 元数据、实体 ID 和重定向 URL - 测试 SP 设置(ACS URL、实体 ID、属性映射) - 可选的 SCIM 配置用于目录同步 - 无需账户 - 只需打开即可开始测试 - 完全免费使用 欢迎尝试,并告诉我们如何为开发者社区改进该工具!
1作者: cpcdoy5 个月前原帖
嘿,HN!我最近发表了一篇题为《空间文本渲染:推动大语言模型空间理解的极限》的文章,在文中我分享了一种我已经使用了一段时间的技术,旨在帮助仅处理文本的大语言模型(LLMs)处理视觉上复杂的文档,这在视觉语言模型(VLMs)可用之前就已经开始了。我认为这对任何从事文档处理工作的人都可能有帮助! <p>摘要:本文介绍了空间文本渲染(STR)方法,它通过保留赋予文档意义的关键空间信息,弥合了视觉复杂文档与仅文本大语言模型之间的鸿沟。尽管视觉语言模型(VLMs)在不断进步,但我们需要一种能够处理中东和北非地区(MEA)复杂金融文档的即时解决方案(但不限于此),包括阿拉伯文本和混合的从右到左的书写方式。STR利用图像处理技术提取文档的基础结构,并将其渲染为大语言模型可以理解的空间感知文本。 <p>关键点和亮点: <p>- 金融文档面临独特的挑战:复杂的布局、混合语言以及需要绝对精确的数据 <p>- 空间文本渲染包括:文档预处理/去斜、带空间坐标的光学字符识别(OCR)、结构提取和结构线检测 <p>- 我们使用基于文本的渲染方法,将视觉结构转换为大语言模型在预训练中已经理解的格式 <p>- 压缩过程显著减少了令牌的使用,同时保留了关键信息 <p>- 测试显示在多个大语言模型(如Claude、GPT-4o等)上取得了优异的结果,即使没有进行微调 <p>- 该方法为文档处理提供了即时解决方案,同时视觉语言模型仍在不断发展并变得更加经济实用 <p>开放讨论:我观察到的一个有趣方面是,许多大语言模型似乎仅凭其预训练就具备了强大的空间推理能力,尽管它们并没有专门针对这一任务进行训练。这表明,大语言模型可能通过仅文本的训练吸收了比之前认为的更多的空间理解。我很好奇其他人是否也观察到并利用了类似的能力? <p>欢迎分享你的想法!
1作者: jemiluv85 个月前原帖
我开发了一个开源的替代品来替代Wakatime,因为我认为Wakatime的高级订阅费用不应该超过GitHub Copilot的订阅费用。Wakatime解决的问题相对简单。他们最难的部分是创建所有那些插件,除此之外,后端只是接收插件数据并将其整理成一个仪表板,以提供开发者工作习惯的洞察。 我也觉得像目标、发票和客户管理这样的功能不应该需要高级订阅。从大多数情况下来看,我认为我是对的,尤其是在实现这些功能之后。 网站目前处于测试阶段,我非常希望能听到你们对一些目前在Wakatime网站上没有的指标的反馈。 我已经添加了关于编写代码所花费的编码时间的统计数据。对我来说,这到目前为止感觉是个大事。 我还在考虑一个想法,展示开发者的专注力/注意力,作为一段时间内心跳的数量或心跳频率的变化。 我觉得还有更多的可能性。期待听到你的反馈。