返回首页
24小时热榜
我注意到有几个人工智能机器人在爬取我的网站。有没有办法找出哪些特定的用户查询导致这些人工智能访问我的网站?
嘿,HN,
我想分享我一直在研究的一个项目:*RAG-Guard*,这是一个专注于隐私的文档人工智能。它是一个将检索增强生成(RAG)与人工智能问答结合的实验,但有一个不同之处——你的数据始终保持<i>属于你自己</i>。
这里是这个想法的核心:你可以上传合同、研究论文、个人笔记或其他任何文档,RAG-Guard 会在你的浏览器中本地处理所有内容。除非你明确批准,否则没有任何数据会离开你的设备。
### 工作原理:
- *零信任设计*:每一步都在你的浏览器中进行,直到你另行指示。
- *本地文档处理*:文件完全在你的设备上解析。
- *本地嵌入*:我们通过 Transformers.js 使用 [all-MiniLM-L6-v2](<a href="https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2" rel="nofollow">https://huggingface.co/sentence-transformers/all-MiniLM-L6-v...</a>) 在你的浏览器中生成嵌入。
- *安全存储*:文档和嵌入存储在你浏览器的加密 IndexedDB 中。
- *客户端搜索*:向量相似度搜索在本地进行,因此你可以找到相关的内容,而无需将任何数据发送到服务器。
- *手动批准*:在任何内容发送到 AI 模型之前,你可以审查并批准具体的文本片段。
- *AI 调用*:只有你批准的文本会发送到语言模型(例如,Ollama)。
没有追踪。没有分析。没有“在你的数据上进行训练”。
### 我为什么要构建这个:
我一直对 RAG 和 AI 驱动的问答潜力感到着迷,但我总是对隐私的权衡感到不安。大多数工具都要求你将敏感文档上传到云端,这样你就失去了对数据处理的控制。
通过 RAG-Guard,我想看看是否可以在不妥协隐私的情况下构建一些有用的工具。目标是创建一个尊重你的数据并让你掌控的工具。
### 适合谁:
如果你是一个处理敏感文档的人——合同、研究、个人笔记——并且希望在不冒 unauthorized access 或滥用风险的情况下使用 AI 的力量,那么这可能适合你。
### 接下来是什么:
这仍然是一个实验,我很想听听你的想法。这是你会使用的东西吗?哪些功能会让它更好?
你可以在这里查看:[<a href="https://mrorigo.github.io/rag-guard/" rel="nofollow">https://mrorigo.github.io/rag-guard/</a>]
期待你的反馈!
区块链在游戏领域的崛起令人着迷。多年来,数字交易一直在暗处进行,账户、皮肤和货币的交换缺乏真正的安全性和所有权。而OVERTAKE($TAKE)通过在BNB链上推出智能合约市场,改变了这一现状,使交易变得无需信任且透明。
我最近在我的投资组合中增加了400多个TAKE,已经看到增长超过61%。现在在BingX的创新区上线,这感觉像是一个可能悄然重塑玩家经济和数字所有权的项目。
你怎么看?你认为游戏经济会朝这个方向发展吗?
有没有人能给我一些建议,关于我可以锁定的设备,以便我的孩子们可以收听我通过 Audio Bookshelf 下载到本地网络的播客?到目前为止,我想到的最好办法是买一部便宜的安卓手机,安装 Audio Bookshelf 应用,并配置我的网络以禁止该设备访问互联网。这个计划唯一的问题是,似乎没有简单的方法只安装 Audio Bookshelf 应用并删除其他所有应用。虽然如果设备没有互联网连接,我并不担心他们会去翻看电子邮件、日历等,但如果能减少一些干扰就更好了。我是 iOS 用户,可能对安卓和第三方启动器或设备控制方面的内容了解得不够。