我一直在进行一个项目,旨在弥合人工智能生成与我的AxiDraw之间的差距,我认为我终于找到了一个可以避免常见麻烦的工作流程。
如果你尝试过绘制AI生成的图像,你可能知道其中的困难:通用的追踪工具(如Potrace)只追踪线条的<i>轮廓</i>,导致出现双重笔画,破坏了视觉效果,并且绘制时间翻倍。
我之前尝试过的方式:
- Potrace / Inkscape Trace:对于填充形状效果很好,但对于线条艺术则产生“空心”线条。
- Canny边缘检测:通常过于杂乱;它会拾取噪声并产生抖动的路径。
- 标准SDXL:在几何一致性方面表现不佳,常常断线或产生幻觉透视。
- 一堆声称是txt2svg的项目,但在笔绘制方面产生的结果极差。(如Chat2SVG、StarVector、OmniSVG、DeepSVG、SVG-VAE、VectorFusion、DiffSketcher、SVGDreamer、SVGDreamer++、NeuralSVG、SVGFusion、VectorWeaver、SwiftSketch、CLIPasso、CLIPDraw、InternSVG)
我的方法:
我最终编写了一个Python工具,结合了几种特定技术,以获得真正的“中心线”矢量:
1. 提示工程:一个大型语言模型(LLM)重写提示,以强制执行针对生成器优化的“技术绘图”风格。
2. 生成:我使用Flux.2-dev(4位)。它在保持直线和一致几何方面似乎显著优于SDXL。
3. 骨架化:这是关键部分。与其追踪轮廓,我使用Lee的方法(通过scikit-image)将图像腐蚀到1像素宽的骨架。这恢复了实际的笔画路径。
4. 图形转换:将像素骨架转换为图形,以识别节点和边缘,修剪小的伪影/噪声。
5. 优化:最后,我将其输入vpype,以合并段落并对路径进行排序(TSP),以避免绘图时的频繁跳动。
你可以在Github仓库中的示例中查看结果:
[https://github.com/malvarezcastillo/txt2plotter](https://github.com/malvarezcastillo/txt2plotter)
该项目目前相对简单,但产生的结果优于我测试过的其他选项,因此我决定发布它。我对实现更好的前/后处理、基于API的生成以及识别交叉阴影的形状感兴趣。
返回首页
最新
嘿,HN!<p>我正在尝试一些工具,帮助你理解哪些内容会影响你在AI搜索查询中的可见性。<p>我开发了一个工具,可以让你在浏览器中快速对ChatGPT、Perplexity和Google AI Overview进行多次提示,并抓取AI引用的所有链接并进行排名。这个工具的目的是最终帮助你联系作者,为你的产品获取反向链接。<p>你可以在这里试用:<a href="https://trysonar.ai/tools/citescout" rel="nofollow">https://trysonar.ai/tools/citescout</a><p>使用折扣码 HACKERNEWS100 可以免费获得10倍或25倍的查询次数。
大家好,我是肯尼斯。我曾在Cloudflare担任高级SRE多年。
随着时间的推移,我逐渐意识到,大多数故障、安全问题和合规性演练并不是因为缺乏工具,而是因为缺乏上下文。人们不知道正在运行什么,事物是如何连接的,或者最近发生了什么变化,尤其是在系统分散在多个云、代码库和团队之间时。
这就是我正在构建OpsCompanion的原因。
我们的目标很简单:保持一个实时的、共享的视图,展示实际运行的内容以及它们之间的关系。
OpsCompanion帮助工程师:
- 查看服务、基础设施和依赖关系的实时可视化地图
- 在不需要翻阅五个工具、Slack线程或过时文档的情况下回答“发生了什么变化?”
- 保留操作上下文,以便下一个值班的人不必从零开始
这并不是要增加更多的日志或警报,或者在现有仪表板上简单地添加AI。它是关于捕捉经验丰富的操作员在脑海中持有的思维模型,并保持其共享和更新。
现在还处于早期阶段,仍有一些粗糙之处。我已经向一小部分接近生产环境的工程师开放,以便获得诚实的反馈。如果它有用,那就太好了。如果没有,我真心希望了解原因以及如何改进。
你可以在这里试用:
<a href="https://opscompanion.ai/?utm_source=hn&utm_medium=show_hn&utm_campaign=jan_2026" rel="nofollow">https://opscompanion.ai/?utm_source=hn&utm_medium=show_hn&ut...</a>
我会在评论区出现。欢迎提问技术问题,表达怀疑,或者讨论实际系统中发生的故障。
Claude Code 有一个实验性的 'mcp-cli' 工具,可以从 bash 中调用 MCP 服务器(如 Google Workspace、GitHub 等)。
问题:默认情况下,它是顺序执行的。我的工作流程涉及 50 多个 MCP 调用。这导致了 191 秒的延迟——在 Claude 能够合成任何内容之前,等待时间超过 3 分钟。
我发现可以在单个 Bash 工具调用中协调并行调用:
```
mcp-cli call google/get_events '{}' > /tmp/cal.json &
mcp-cli call google/list_tasks '{}' > /tmp/tasks.json &
mcp-cli call github/list_issues '{}' > /tmp/issues.json &
wait
```
不明显的部分是:这之所以有效,是因为后台作业(&)继承了父 shell 的环境。Claude Code 的会话上下文——包括 MCP 端点文件——仍然可访问。
如果你启动一个新的子 shell(bash -c 'mktemp -d; mcp-cli...'),上下文会中断,出现“找不到 MCP 端点文件”的错误。这是我花了一段时间才弄明白的陷阱。
基准测试(2026 年 1 月验证):
```
2 次调用: 7.6s → 3.8s (2 倍)
10 次调用: 38s → 3.0s (13 倍)
20 次调用: 76s → 4.9s (16 倍)
50 次调用: 191s → 10.3s (18 倍)
```
我将其打包成一个自包含的工具包:
- CLAUDE.md 片段,包含使用说明
- .claude/rules/ 模式(禁止/必需示例)
- 提醒并行模式的建议钩子
- 项目或用户级别的安装脚本
https://github.com/AIntelligentTech/claude-code-mcp-cli-parallel-godmode
需要设置 ENABLE_EXPERIMENTAL_MCP_CLI=true(mcp-cli 仍然是实验性的)。
我很好奇其他人是否也遇到了类似的瓶颈,或者是否发现了其他针对 MCP 密集型 Claude Code 工作流程的优化模式。
以下是翻译内容:
https://github.com/deskflow/deskflow/pull/8780
https://github.com/deskflow/deskflow/pull/8989
https://github.com/deskflow/deskflow/pull/9348
我发布这个主要是为了给朋友们一个参考,当他们抱怨某件事情太竞争激烈或太难获得时。想在这里也分享一下。<p>编辑:我忘了链接博客。重新发布在这里:https://news.ycombinator.com/item?id=46684815
发生了一些不寻常的事情。我无法再立即打开一个新的Safari窗口(我使用新窗口,而不是标签页,我不喜欢标签页,请不要评判……)<p>总之,回到这个不寻常的情况。要想立即打开一个窗口,我必须打开一个新的通用窗口(命令、选项、Shift、2)。按下命令N会打开一个新的个人窗口,而在M4 Max上,这需要2秒钟。这太疯狂了。我不记得自己曾配置过个人浏览窗口,而且我也无法更改默认行为。<p>究竟发生了什么,苹果工程师是否在用某种方法来解决这个令人恼火的行为?<p>附注:我不会改变我的习惯去使用标签页。