返回首页
最新
大家好,感觉现在有太多信息需要消化和跟上世界的步伐。我很好奇这里更有经验的人是如何在这个现代时代存储和利用信息的?你们使用什么工具来整合、存储,并在需要时方便地访问这些信息?
我正在寻找可以作为“AI第二大脑”的选项,允许我在需要时请求它检索信息。我尝试过一些工具,比如 notebooklm、tana 和 saner,但我始终乐于学习你们的方法和推荐。谢谢!
嘿,HN,
我创建了 Hot or Slop([https://hotorslop.com](https://hotorslop.com))——一个视觉图灵测试,你可以通过滑动照片来猜测它们是 AI 生成的还是现实中的。这既是一个游戏,也是一个众包研究实验。
在 50 名玩家和大约 3,600 次猜测后,早期数据非常有趣:
* 平均人类准确率:65%(仅比随机猜测稍好)
* 表现最佳的玩家准确率达到 85%–90%
* FLUX 和 Imagen 模型在 80% 以上的情况下能够欺骗玩家
* 速度很重要——匆忙的猜测会使准确率下降约 15%
每一次猜测都会为一个透明的数据集提供数据,跟踪哪些 AI 模型最难以检测,以及随着模型的改进,我们的集体检测能力如何演变。可以把它看作是人类与 AI 感知差距的实时测量。
技术栈:React 19 + Vite(前端),Express + SQLite 通过 sql.js(后端),Hugging Face 数据集(OpenFake 用于合成图像,COCO–Caption2017 用于真实照片)。该游戏在每次猜测中跟踪大约 15 个元数据点(模型、提示长度、延迟、置信度等)以便分析。
当前挑战:sql.js 将整个数据库加载到内存中,因此在大约 3,600 次猜测时我达到了内存限制。计划迁移到 better-sqlite3 或 Postgres 以便扩展,但我想快速发布并根据使用模式进行迭代。
滑动时的视觉指示器使用渐变叠加(红色表示 AI,绿色表示真实),搭配 EB Garamond 字体,呈现出简洁的美感。简单但有效的用户体验——大多数人第一次玩时会进行 50 次以上的回合。
想听听大家的看法:
1. HN 的朋友们准确率是多少?(我怀疑会高于平均水平)
2. 对于检测模式有什么想法?有人声称纹理/光照是线索,其他人则关注构图“线索”
3. 关于在不迁移到完整数据库服务的情况下扩展分析的想法?
试试吧:[https://hotorslop.com](https://hotorslop.com)
(温馨提示:奇怪地上瘾)