我见过的每个运行多个机器学习模型的地方,最终都会形成一堆定制的推理服务:不同的API、不同的身份验证、不同的日志记录、半成品的仪表板,以及将这一切联系在一起的部落知识。
我正在构建一个小型的副项目,试图标准化推理部分——在异构模型(本地、托管云、不同团队)前面设置一个单一的网关,处理推理API、版本控制/回滚、身份验证、基本指标和健康检查。不涉及训练、不涉及自动机器学习,也不是“端到端的MLOps平台”。
在我投入更多时间之前,我想弄清楚这是否是:
一个人们默默用内部解决方案掩盖的真实缺口,还是
听起来有用但在现实约束下崩溃的东西。
对于那些实际上在生产环境中运行机器学习的人:
你们是否已经有了这样的内部推理层?
推理通常在哪些地方出错(部署、版本控制、调试、合规)?
在什么规模下,抽象就不再值得?
我并没有宣布任何事情——我真心好奇这是否引起共鸣,还是我只是重新发现了为什么每个人都选择自己实现。
返回首页
最新
嗨,HN,
我创建了Fileloom,因为我在PDF生成过程中遇到了同样的问题:在Linux服务器上字体渲染出现问题,Puppeteer的设置非常麻烦,而且大多数服务每月收费15到30美元,仅能生成几百个PDF。
Fileloom是一个简单的PDF生成API。您只需发送HTML(或使用带有Handlebars语法的保存模板),在2秒内即可获得PDF。
包含的内容:
- 单一端点:POST到/v1/pdf/generate
- 70多个内置的Handlebars助手(货币格式、日期、循环、条件、数学运算)
- 自动字体处理——不再需要调试为什么字体在本地正常但在生产环境中不工作
- 可以将PDF存储在我们的基础设施上或您自己的基础设施上(如S3、Supabase)
- pdf.generated和pdf.failed事件的Webhook
免费套餐每月提供200个PDF,无需信用卡。付费计划起价为每月7.20美元。
我非常欢迎对API设计和开发者体验的反馈。
MCP(模型上下文协议)服务器,允许人工智能助手实时检查域名的可用性。<p>功能:
- 多源支持:Porkbun、Namecheap、RDAP、WHOIS
- 各注册商的价格比较
- 社交账号检查(GitHub、Twitter、npm等)
- 高级域名检测及价格洞察<p>与任何兼容MCP的客户端兼容。<p>安装方式:npx -y domain-search-mcp