我为处理敏感文档(PDF/TXT)的专业人士构建了一个本地AI工具。
- 运行在Ollama(llama3.2)上
- 数据100%保留在您的设备上 — 完全离线
- 自动语言检测(法语/英语/德语)
- 开源核心(MIT许可证)
- 轻量级、快速且注重隐私
非常适合律师、会计师、审计师以及在欧洲注重隐私的团队。
GitHub: [https://github.com/erabytse/docudeeper](https://github.com/erabytse/docudeeper)
演示: 
欢迎反馈!
返回首页
最新
在周末,我进行了一项小实验,看看我能多快从构思到实现一个可工作的最小可行产品(MVP),使用人工智能辅助开发工具。<p>结果是一个简单的网页应用程序,它生成简短的个性化睡前故事,并用我自己的声音进行讲述。代码库在某些地方故意保持粗糙,但应用程序可以正常工作,并且在实际环境中可用。<p>让我感到最惊讶的是,能够在一个真实的、已部署的系统上轻松迭代,而不被早期的架构决策所束缚。<p>技术栈:FastAPI、Supabase、Fly.io、Vercel<br>工具:Cursor、Lovable、Claude、ChatGPT<p>我很好奇这里的其他人是如何进行人工智能辅助开发的,以及在将事物固化为生产环境之前,你们是如何划定界限的。<p>链接:<a href="https://sleepli.app" rel="nofollow">https://sleepli.app</a>
在这个冬季风暴季节,我在五个不同的网站之间跳来跳去感到很烦,所以我创建了“StormWatch”。这是一个简单易用、适合移动设备的网页(仪表盘),可以在一个简单的界面中显示我所需要的所有信息。
<p>功能:</p>
- 实时国家气象局(NWS)警报及安全提示
- 雪/冰/降水积累预测(加上风速)
- 基于您的警报的动态准备清单
- 根据家庭规模的物资计算器
- 区域天气新闻
<p>这个工具是免费的,无需登录,适用于任何设备。只需输入您的邮政编码。</p>
<p><a href="https://jeisey.github.io/stormwatch/" rel="nofollow">https://jeisey.github.io/stormwatch/</a></p>
<p>使用了NWS和GDELT的API,并且是开源的。欢迎随意分叉和修改。</p>
<p>对于开发者:</p>
- 使用API测试工具验证所有端点、响应模式、类型和速率限制
- 使用范围和验证工具保持功能简单、专注并经过测试
- VS-code Copilot(开发代理使用Sonnet 4 + 范围和验证使用Opus 4.5)
我发现了一些关于iCloud的高级数据保护(ADP)的问题,这是苹果并未披露的:被删除的文件实际上从他们的服务器上并没有被真正移除。
测试:
我有一个5 Mbit/秒的上传连接。我将6GB的个人文件(音乐、视频、照片)复制到iCloud Drive。它们在15分钟内“上传”完成——这在我的带宽下是不可能的。这些文件早在很久以前就已经上传并被删除了。
为了验证,我检查了活动监视器:自启动以来,仅发送了3.42GB的数据,包括网页浏览。6GB的上传根本没有发生。
确认测试:
创建了一个包含随机数据的100MB文件:dd if=/dev/urandom of=randomfile.dat bs=1m count=100
上传到iCloud:花费了2-3分钟,活动监视器显示发送了122MB(正确)
从iCloud Drive中删除该文件
从“最近删除”中“永久删除”,并清空数据恢复中的任何文件。
重新上传相同的文件:在1秒内完成
活动监视器:几乎没有数据发送
苹果即使在“永久删除”后也保留了加密块。
一个月的测试(正在进行中):
我将保留这个随机文件,并计划在30天后尝试重新上传,以查看苹果是否会按任何时间表清除数据,还是无限期保留。
为什么这很重要:
ADP被宣传为让用户对其数据拥有独占控制权
“删除”和“永久删除”选项暗示数据会被移除
上传进度条显示虚假的“上传”状态以进行去重操作
用户无法验证苹果保留了哪些数据。
要尝试永久删除,必须禁用ADP的网络访问。
不清楚的是:
这是否适用于健康数据、密码和其他受ADP保护的内容?
苹果会保留“已删除”的加密块多久?
用户是否能真正删除他们的数据?
我并不是说加密技术很弱——可能没问题。但苹果在数据保留和ADP去重方面缺乏透明度令人担忧。“永久删除”应该意味着永久删除。
还有其他人注意到这种行为吗?在完成30天的保留测试后,我会更新这篇文章。
我刚刚进行了一次顺利的风险投资电话会议。他们要求进行演示,并提到会引入一位运营合伙人,我也分享了一些细节等。之后就没有消息了(过了一两天)。<p>对于那些有过融资经历或在风险投资行业工作过的人:<br>这通常只是内部审查的时间,还是演示后沉默通常意味着他们决定不投资?<p>我并不是在寻求确认,只是想了解这个阶段通常是如何进行的。<p>谢谢。
我构建了 Polymcp,这是一个框架,可以将任何 Python 函数转换为可供 AI 代理使用的 MCP(模型上下文协议)工具。无需重写,无需复杂的集成。
<p>示例</p>
<p>简单函数:</p>
```python
from polymcp.polymcp_toolkit import expose_tools_http
def add(a: int, b: int) -> int:
"""添加两个数字"""
return a + b
app = expose_tools_http([add], title="数学工具")
```
<p>运行命令:</p>
```
uvicorn server_mcp:app --reload
```
<p>现在,add 函数通过 MCP 暴露,可以被 AI 代理直接调用。</p>
<p>API 函数:</p>
```python
import requests
from polymcp.polymcp_toolkit import expose_tools_http
def get_weather(city: str):
"""返回某个城市的当前天气数据"""
response = requests.get(f"https://api.weatherapi.com/v1/current.json?q={city}")
return response.json()
app = expose_tools_http([get_weather], title="天气工具")
```
<p>AI 代理可以调用 get_weather("London") 来即时获取实时天气数据。</p>
<p>业务工作流函数:</p>
```python
import pandas as pd
from polymcp.polymcp_toolkit import expose_tools_http
def calculate_commissions(sales_data: list[dict]):
"""根据销售数据计算销售佣金"""
df = pd.DataFrame(sales_data)
df["commission"] = df["sales_amount"] * 0.05
return df.to_dict(orient="records")
app = expose_tools_http([calculate_commissions], title="业务工具")
```
<p>AI 代理现在可以自动生成佣金报告。</p>
<p>对企业的重要性:</p>
- 立即重用现有代码:遗留脚本、内部库、API。
- 自动化复杂工作流:AI 可以可靠地协调多个工具。
- 即插即用:多个 Python 函数可以在同一 MCP 服务器上暴露。
- 减少开发时间:无需自定义包装器或中间件。
- 内置可靠性:包含输入/输出验证和错误处理。
<p>Polymcp 使 Python 函数能够被 AI 代理立即使用,标准化了企业软件的集成。</p>
<p>代码库:<a href="https://github.com/poly-mcp/Polymcp" rel="nofollow">https://github.com/poly-mcp/Polymcp</a></p>
嗨,HN,我是Loclean的作者。
我之所以开发这个工具,是因为我处理敏感数据,无法将其发送到OpenAI,但传统工具如正则表达式对于现实世界输入的复杂性(例如地址拼写错误或不一致的日期格式)来说太脆弱了。
Loclean是一个Python库,具有以下特点:
- 完全在本地运行(对CPU友好),使用通过llama-cpp-python量化的模型。
- 使用Pydantic来强制执行严格的模式(不再出现幻觉或无效的JSON)。
- 与Pandas/Polars/PyArrow工作流兼容。
它旨在成为严格的正则表达式和昂贵/有风险的云大型语言模型之间的“中间地带”。
代码库链接:[https://github.com/nxank4/loclean](https://github.com/nxank4/loclean)
我很想听听你们对API设计的反馈,或者你们在本地数据清洗方面可能有的用例。谢谢!