返回首页
最新
我进行了一项实验,想看看命令行界面(CLI)是否真的是调用工具的最直观格式(正如一位前Manus AI后端工程师所声称的)。我给我的模型提供了随机场景和一个单一的工具“运行”——我告诉它这就像一个命令行界面。我让它猜测命令。
它猜测出了很好的命令,但总是以冒号开头格式化,比如:
:help
:browser
:search
:curl
它是根据终端的外观进行训练的,而不是根据你实际输入的内容(你并不会输入“:”)。
此后,我更新了我的代理工具代码,以避免与这种直觉相悖。
大型语言模型(LLMs)学习的是文档/资料中命令的样子,而不是人类在键盘上实际输入的内容。
这看起来是显而易见的。这就是为什么你必须测试你的LLM,看看它是如何自然工作的,这样你就不必在系统提示中与其抗争。
顺便提一下,这是Kimi K2.5。
我创建了 Burn Room——一个自托管的 SSH 聊天服务器,消息在 1 小时后自动消失,房间在 24 小时后自毁。所有数据都不会写入磁盘。无需账户、电子邮件或浏览器。
<p><pre><code> ssh guest@burnroom.chat -p 2323
密码:burnroom
</code></pre></p>
或者通过浏览器连接(xterm.js 网络终端):<a href="https://burnroom.chat" rel="nofollow">https://burnroom.chat</a>
大家好,我创建了Veevo Health,这是一项服务,您可以在美国20多个影像中心预约进行30分钟的CT血管造影心脏扫描,并获得经过临床医生审核的结果,显示您心脏动脉的真实健康状况。网站地址是 https://veevohealth.com。
我之所以创建这个服务,是因为我的父亲因突发心脏病去世。心脏病仍然是最大的健康威胁之一,而预防的最佳方法就是尽早了解您的动脉健康状况。
您可以在线预约,前往进行30分钟的扫描,并获得带有个性化行动计划的结果。该服务符合HSA/FSA的资格。
调度系统是最困难的部分。协调不同影像中心的可用性以及各自不同的系统需要大量的工作。
我非常希望能听到任何对预防心脏病或直接面向消费者的诊断服务有了解的人的反馈。
这个功能非常适合同时浏览目录和读取文件,特别是因为我的笔记本没有 Home 和 End 键。现在我不需要回到命令的开头,将 `ls` 改为 `cat` 或 `nano`。我还添加了 `-e` 选项,这样你可以通过按上箭头键,输入 `-e`,然后按回车来编辑文件,而不需要使用 Home/End 键(如果你没有这些键的话)。
语法:
- `lc ~`:显示主目录中的所有文件
- `lc ~/my-file.txt`:显示 `my-file.txt` 的内容
- `lc ~/my-file.txt -e`:使用 nano 打开 `my-file.txt` 进行编辑(你也可以替换为 vim 或其他编辑器)
使用方法:将以下内容添加到你的 `.bashrc` 文件中并刷新它:
```bash
# lc 命令
lc() {
edit=false
opts=()
paths=()
for arg in "$@"; do
case "$arg" in
-e)
edit=true
;;
-*)
opts+=("$arg")
;;
*)
paths+=("$arg")
;;
esac
done
if [ ${#paths[@]} -eq 0 ]; then
ls --color=auto "${opts[@]}"
return
fi
for p in "${paths[@]}"; do
if [ -d "$p" ]; then
ls --color=auto "${opts[@]}" "$p"
elif [ -f "$p" ]; then
if $edit; then
nano "${opts[@]}" "$p"
else
cat "${opts[@]}" "$p"
fi
else
echo "lc: $p: 没有这样的文件或目录" >&2
fi
done
}
```
厌倦了在终端界面上眯着眼睛,并在大量标签之间切换。我需要一个用户界面来启动和管理我新的 swarm 库 oompa:
<a href="http://github.com/nbardy/oompa" rel="nofollow">http://github.com/nbardy/oompa</a>
Cursor 有一个不错的用户界面,但不支持使用你的 Codex Pro 或 Claude Max 订阅。因此,我想要一个开源解决方案,能够将现有的工具整合成一个友好的跨客户端用户界面。
一些核心功能:
- 允许你在所有 Claude Code、Codex、Gemini-Cli 和 OpenCode 会话之间搜索
- 开源,可以使用你的 IDE 编辑你自己的 IDE。愿 emacs 和 vim 的梦想长存
- 允许你启动、管理和查看一群代理,基于我使用了几个月的 swarm 管理工具
- 原生支持 Markdown 和图像预览内联显示
我在Reddit上看到一个播客,Karpathy描述了他是如何从自己编写80%的代码变成完全不写代码的,处于一种“人工智能精神错乱”的状态,因为可能性似乎是无限的。
我个人发现我的工作流程变得非常“机会主义”——我感觉自己可以用人工智能做任何事情,所以我尝试了各种可能。这可能是好事……也可能是坏事。我很想知道HN的看法,或者是否还有其他人有类似的经历。
这里是Reddit的帖子链接以供参考:https://www.reddit.com/r/ClaudeAI/comments/1s08r1c/karpathy_says_he_hasnt_written_a_line_of_code/
有没有人也有这样的感觉?如果不是精神错乱(这可能是夸张),那么就是感到更有压力、焦虑,或者其他什么。
嗨,HN!<p>我正在构建一个处理高价值凭证的项目,我希望它比仅仅在丢弃时清零内存更加稳健。在最近的一个Show HN评论中,我意识到对低级内存保护技术的认识可能没有我想象的那么普遍。<p>这里的想法是将所有工具整合到一个库中,并提供相对简单的API。
* 使用mlock/VirtualLock防止敏感内存被交换(例如KeePass转储)
* 在Linux和Android上使用MADV_DONTDUMP进行核心转储排除
* 使用mprotect来最小化暴露时间
* 使用保护页来缓解下溢/上溢问题<p>经过一些实战测试,我的目标是为密码管理器和加密货币钱包等提供更安全的内存基础。<p>这是一个有趣的项目,我学到了很多——非常欢迎任何反馈!<p>[0] - <a href="https://news.ycombinator.com/item?id=47073430">https://news.ycombinator.com/item?id=47073430</a>
Cronbox 是一个定时任务工具,AI 代理按照预定的时间表工作。我们相信,许多重复性的任务可以从 AI 代理中获得很大帮助。而将这些任务安排在云端可以让你解放双手。
你可以做一些事情,比如截取网站的屏幕,调整大小到 1000 x 1000,并检查页面上的价格变化,然后通过电子邮件通知你。
或者,当 OpenAI 发布新模型时,要求它绘制一幅“骑自行车的鹈鹕”的 SVG 图,并将其发送给你。
每个任务都在自己的 Linux 沙箱中运行,因此可以实现更多的功能。
虽然 Claude 的云调度受到限制沙箱的约束,并且不支持屏幕截图或 SVG,但 cronbox.sh 提供了一个强大的环境,拥有无限制的库、curl 和原生网页捕获功能。