返回首页
最新
嗨,HN!<p>我创建了Lockbridge,因为在2025年,安全文件共享和加密工作流程仍然过于复杂。<p>Lockbridge专注于简化端到端加密传输,使其简单、可审计且与云服务无关。<p>核心功能:
桥接:可分享的加密上传/下载链接,具有自动过期功能。
云联邦:统一的仪表板,支持S3、Azure、GCP、Google Drive、Dropbox及其他兼容S3的解决方案。
区块链审计日志(可选):基于Polygon的不可更改日志,用于HIPAA/SOX合规。
零知识加密:真正的客户端端到端加密——我们无法访问或解密您的文件。<p>示例用例:
创建一个桥接,将链接发送给客户,他们可以安全地将文件直接上传到您的Google Drive、S3或Dropbox。桥接会自动过期(例如,24小时或1周)。对于受监管行业,每次传输可以选择记录到Polygon,以便生成不可更改的合规记录。<p>我们目前处于测试阶段,非常希望能收到关于以下方面的反馈:<p>桥接用户体验——是否直观?
多云集成体验。
区块链审计日志在受监管行业之外是否具有实际价值。<p><a href="http://lockbridge.com" rel="nofollow">http://lockbridge.com</a><p>感谢您提供任何想法、问题或您认为我们应该考虑的边缘案例。
我很好奇,训练人工智能模型的成本(计算、能源、数据等)是如何随时间变化的。<p>有没有公开的资源或数据集跟踪开放权重模型的训练成本(我猜对于封闭模型来说,这些数据很难获取,但如果我错了,我很乐意接受纠正。)<p>我特别想了解哪些架构变化(例如,注意力变体、参数共享、专家混合)导致了主要的成本优化,而不仅仅是来自这些模型背后的公司,而是来自任何训练或复制过这些模型的人。
嘿,HN!我在Waymo构建了自驾模拟和评估系统。现在,我正在开发Scorecard,旨在将这种方法应用于代理评估:为人工智能提供可重复、自动化的评分。Scorecard让你可以:
- 在代理工作流程中运行大型语言模型作为评审的评估:测试工具使用情况、多步骤推理和在CI/CD或游乐场中的任务完成情况。
- 使用OpenTelemetry追踪调试失败:查看哪个工具失败、为什么你的代理出现循环,以及推理出错的地方。
- 在数据集、模拟代理和评估指标上进行协作。
试试吧 → [https://app.scorecard.io](https://app.scorecard.io)(免费套餐,无需付款!)
文档 → [https://docs.scorecard.io](https://docs.scorecard.io)
我们是一个小团队(4人),刚刚筹集了375万美元,目前已有早期客户在法律科技领域使用Scorecard进行评估。
我们的使命是消除非确定性错误。你见过的最奇怪的LLM输出是什么?