返回首页
最新
我在调试多模态AI API时为自己开发了这个工具。
问题是:我总是遇到包含Base64编码图像的JSON响应。每次都得复制字符串,找到在线解码器,粘贴,预览。每张图像都要重复这个过程,实在是太麻烦了。
于是我制作了ViewJSON。只需粘贴你的JSON,它会自动检测并内联渲染Base64媒体:图像、音频、视频,甚至PDF文件。再也不用进行复制粘贴和解码的循环了。
它还具备其他功能:
- 格式化/压缩JSON
- 粘贴图像,获取Base64字符串(反向操作)
- 构建API请求,复制为cURL
- 测试时的变量替换
- 通过URL分享JSON
无需登录,完全免费。欢迎对我可能遗漏的边缘案例提供反馈!
我正在部署能够调用外部API的AI代理——处理退款、发送电子邮件、修改数据库。代理根据用户输入和大语言模型的推理来决定采取什么行动。
我担心的是:代理有时会尝试一些不该做的操作,并且没有清晰的审计记录来说明它做了什么或为什么这样做。
我目前看到的选项有:
1. 完全信任代理(这很可怕)
2. 手动审核每一个操作(这违背了自动化的初衷)
3. 某种权限/审批层(这种东西存在吗?)
对于那些在生产环境中运行AI代理的人:
- 你们是如何限制代理可以做的事情的?
- 对于高风险操作,你们是否需要审批?
- 事后你们是如何审计发生了什么的?
我很想知道哪些模式是有效的。
嗨,HN——我开发了一个名为 SkillLens 的小型命令行工具,旨在帮助回答:“我安装了哪些代理技能,它们中有哪个是可疑的?”
许多代理生态系统(如 Claude、Codex、OpenCode 等)将技能存储为带有 SKILL.md 文件的文件夹。这些文件可能包含意想不到的强大指令(有时还可能包含不安全的模式),但一旦安装后容易被遗忘。我们通常会以 --dangerously-skip-permissions 的方式运行它们,并让它们安装任何想要的内容,但我对此有些焦虑,因此决定构建一个工具来让自己安心。
我决定不使用 AST 静态检查,而是使用您本地已有的任何命令行工具进行验证。
SkillLens 主要完成两件事:
1. 发现:它扫描常见的本地技能位置(可配置),并列出找到的内容。
2. 可选审计:如果您安装了审计工具(如 Claude 或 Codex),它会将每个 SKILL.md 文件(目前限制为约 12,000 个字符)发送给审计工具,并请求结构化的 JSON 输出:
- 判决:安全 | 可疑 | 不安全
- 风险:0–10
- 摘要 + 证据中的问题
它还会在本地缓存审计结果,因此重新运行时不会再次检查技能,除非这些技能被更新,您安装了新内容,或者您明确要求使用 --force 标志进行检查。
安装/运行:
```
npx skilllens scan
# 或者
pnpm dlx skilllens scan
```
注意事项/警告:
- v0.1;我仍在对提示/模式和“什么算作可疑”的启发式进行迭代。
- 今天它会将技能文本发送给您的审计工具(因此请将其视为与该提供者共享技能内容)。计划中有“编辑证据提取”,但尚未实现。
- 如果未安装审计工具,它仍然会生成扫描报告,并将审计标记为跳过。
状态页面正常,但似乎无法进行 git pull 或 git push。
嗨,HN。我构建了一个API,用于解决长篇大模型(LLM)上下文中的个性漂移。
与处理事实的RAG不同,AIIM通过12个参数锁(如逻辑、同理心等)来强制执行行为状态,并跟踪情感衰减。它迫使模型在上下文窗口填满时仍然保持“角色一致”。
开发者可以免费使用的API: [https://ai-im.tech](https://ai-im.tech)
嗨,HN!这是我多年来的项目。最近,我在暂停一段时间以专注于学业后,重新启动了它。
我这个项目的目标是帮助消费者在购买补充剂时区分虚假宣传与科学依据。我通过以下三个步骤来实现这一目标:
1. 我对市场上每种补充剂进行索引(提取每种成分,按数量标准化)。
2. 我对所有关于补充剂的研究论文进行索引(按效果类型和效果大小对每个主张进行排名)。
3. 我将补充剂与研究论文之间的数据进行关联。
去年早些时候,我暂停了这个项目,因为遇到了一些问题:
法律问题:一些不良公司向我发送了停止和 desist(C&D)信件,要求我将他们的产品从网站上撤下。在我专注于学业的同时,处理这些问题超出了我的心理承受能力。不巧的是,这些通常是市场营销预算庞大但成分性价比低的品牌。
技术问题:我在第一个大型语言模型(LLM)推出时开始这个项目。我建立了广泛的内部评估,以了解LLM的表现。然而,当时的幻觉现象频繁,无法将这些数据传递给访问者。不过,我最近用Opus 4.5重新进行了评估,结果让我印象深刻。我发现自己已经很难想到或找到LLM在数据解读方面表现不佳的场景。
商业问题:我仍然没有弄清楚如何将其商业化,甚至不清楚目标客户是谁。
尽管面临这些挑战,我决定重新开始我的旅程。
我的使命是为补充剂市场带来透明度(科学与价格)。我的目标不是增加补充剂的使用,而是帮助消费者做出明智的决策。很多时候,补充剂并不是必需的,或者有自然的补充方式(这也是我本季度的重点——更好地教育消费者关于自然补充的知识)。
一些有助于我事业的因素——布莱恩·约翰逊的旅程引起了更多人对健康补充的关注(蓝图)。多亏了布莱恩的努力,最近几个月有很多人联系我,询问项目的进展,这种兴趣是我以前没有过的。
我很高兴能重新开始这个旅程,并与HN分享。对于如何推进这个项目,您的意见将不胜感激。
网站的一些关键区域:
* 按成分导航补充剂的示例 [链接](https://pillser.com/search?q=%22Vitamin+D%22&s=jho4espsuc)
* 使用AI分析研究论文的示例 [链接](https://pillser.com/research-papers/effect-of-lactobacillus-gasseri-pa-168-bifidobacterium-longum-sp-073-b-bifidum-mf-205-on-common-cold-episodes-a-double-blind-randomized-controlled-trial-767)
* 查找特定菌株或成分的示例 [链接](https://pillser.com/probiotics/bifidobacterium-bifidum)
* 按健康结果导航研究的示例 [链接](https://pillser.com/health-outcomes/improved-intestinal-barrier-function)
* 产品列表的示例 [链接](https://pillser.com/supplements/pb-8-probiotic-663)
在构建自主/半自主代理时,它们通常需要广泛的本地访问权限:环境变量、文件、命令行界面、浏览器、API 密钥等。这使得通常的假设——“本地机器是安全且未被篡改的”——显得不那么可靠。
我们已经在使用密码管理器、OAuth、范围密钥和沙箱技术,但代理引入了新的风险:提示注入、工具误用、意外的操作链以及通过日志或模型上下文泄露的机密。给予代理足够的权限以便其发挥作用似乎与最小权限原则相悖。
我没有看到很多关于这个问题的讨论。在代理时代,人们是如何看待开发机器上的机密管理和信任边界的?在实践中,哪些模式实际上是有效的?
嘿,HN,
我开发了 Captain's Deck,因为我在 macOS 上怀念 Norton Commander 风格的文件管理。
主要功能:
- 双窗格界面
- Vim 风格的导航(hjkl, gg, G, /)
- 内置终端,路径同步
- Git 集成(状态徽章,暂存/取消暂存)
- 远程连接(SFTP, FTP, S3, WebDAV, 云盘)
- 压缩文件浏览(ZIP, RAR, 7z 作为文件夹)
- 复古主题(Norton Commander 蓝色 + CRT 效果)
这是一款原生的 Swift/AppKit 应用。一次性购买价格为 19.99 美元,提供 14 天试用。
我非常希望能收到反馈,了解哪些功能能使其对你的工作流程更有帮助。
[https://captains-deck.com](https://captains-deck.com)
这是一种开源解决方案,专为极度身体残疾人士设计,包括完全瘫痪的用户。当传统辅助技术无法满足需求时,该系统通过解读单一的微小动作(例如微微张嘴)来实现对计算机的全面控制。它的核心系统能够接收来自任何传感器的微信号,以导航可自定义的层级菜单。该系统支持非语言用户的语音命令,并绕过操作系统的语言障碍。旨在恢复数字独立性。
嗨,HN,
我厌倦了为了接受聚会或晚宴邀请而必须注册账户,以及朋友们也需要注册账户(还有很多朋友已经离开社交媒体),所以我编写了一个简约的无登录事件工具: [https://yupno.com](https://yupno.com)
开发者友好的功能:完整的REST API,支持异步Webhook的RSVP,适配Slack/Discord的负载。自动生成Ical、JSCalendar和JSON-LD。不需要身份验证,使用URL中的管理员/用户令牌。应该可以以有趣的方式连接到其他工具。
免费使用,无广告,无追踪。我只是想要一个简单的工具,尊重我的时间和隐私。如果这个工具受到欢迎,我可能会想办法进行变现,比如为活动票务集成Stripe等。
文档/API详情:[https://yupno.io/docs.html](https://yupno.io/docs.html)