1作者: eigen-vector大约 2 个月前原帖
我正在构建一个众包的人工智能检测基准。这个基准包含对同一提示的两个响应——一个来自真实人类(2022年前,证明在AI内容泛滥之前),另一个由AI生成。你需要选择出AI生成的内容。三次错误就会被淘汰。 数据集包括来自Reddit、Hacker News和Yelp的16,000条人类帖子,每条帖子都与来自两个提供商(Anthropic和OpenAI)六个模型在三个能力层级下生成的AI内容配对。使用相同的提示,长度匹配,没有对抗性指导——仅仅是模型的自然声音和平台上下文。 每次投票都会记录模型、层级、来源、响应时间和位置。 初步测试结果显示:Reddit的帖子很容易识别(人类的表达太随意,AI难以模仿),而Hacker News则显著更难。 我将把完整的数据集发布在HuggingFace上,如果通过这个众包研究能获得足够的数据,我会发表一篇论文。 如果你选择仅玩Hacker News模式,你是在帮助校准AI在这个平台上的可检测性。 我非常希望能收到关于这些配对的反馈——有没有哪些是显而易见的?有没有一些是真正困难的?
3作者: brucehsu大约 2 个月前原帖
我们真的需要另一个代理协调器吗?可能不需要。但我找不到一个能与我实际使用编码代理命令行界面(CLI)相匹配的工具,所以我自己构建了一个。 Codelegate 是一款桌面应用程序(基于 Tauri 2 + React + xterm.js),它将代理会话组织成一个以键盘为主的工作区。我构建它是为了应对一些特定的烦恼: 1. 我希望能够用双手在键盘上导航。会话切换使用 `Alt+1..9`,窗格切换使用 `Alt+A/G/T`。无需使用鼠标。 2. 我在同一个代码库中并行工作,使用 Git 工作树。Codelegate 内置了工作树流程:为每个代理创建一个独立的分支,会议结束时自动清理。 3. 我希望能够继续使用我的 CLI 工具(如 zellij 等),而不是替代它们。 4. 我需要它在 macOS 和 Linux 上都能使用。 每个会话提供三个窗格:代理、终端和 Git。Git 窗格处理带有语法高亮的差异审查、批量暂存/取消暂存、提交和修改。会话在侧边栏按代码库分组。 目前支持 Claude Code 和 Codex CLI,但任何在 shell 中运行的工具都可以使用。 这是 v1.0.0,仅涵盖我最常用的代理 CLI 和功能。它采用 GPLv3 许可证,因此可以被分叉并根据你的工作流程进行调整。 希望你喜欢使用它或将其改造成自己的工具!
1作者: mhamda大约 2 个月前原帖
嗨,HN, 我是Firstrun的开发者([https://firstrun.dev](https://firstrun.dev))。这是一款工具,可以将您的静态文档转化为互动式的逐步指导,您可以将其嵌入到任何地方。 问题: 每位开发者都知道,花费数小时撰写出色文档的痛苦,结果用户只是浏览一下,错过了关键步骤,最后提交支持请求说“它不工作”。 静态文本和过时的截图对于复杂的设置或入门流程并不理想。 Firstrun的功能: 我想要构建一种快速创建互动指南的方法,而不需要耗费大量工程时间或使用臃肿的企业工具。 创建:您可以添加自己的内容(或从现有文档中提取步骤)。 生成:Firstrun将其转化为干净的互动式逐步用户界面。 嵌入:您只需将一个简单的脚本标签放入您的文档网站或SaaS应用中。 跟踪:它为您提供用户在哪些地方掉队或失败的分析,让您知道设置的哪个步骤让他们感到困惑。 您可以在这里试用: [https://firstrun.dev](https://firstrun.dev) 我非常希望能听到您对用户体验和嵌入小部件的反馈。这是否解决了您在SaaS或开源项目中的痛点? 您目前是如何处理入门流程和互动文档的? 欢迎随时提出任何技术问题!
1作者: nivlewd1大约 2 个月前原帖
我们创建了SocialCraft AI,旨在利用指数衰减模型来模拟LinkedIn连接的衰减,其中关系强度每90天减少50%。<p>我们识别出的问题是,许多专业人士在LinkedIn上难以维持有意义的连接,这导致参与度下降和机会的错失。例如,如果您在180天内没有与某个连接互动,其关系强度将降至原始值的25%。这种衰减会显著影响网络效能和内容可见性。<p>在技术上,我们实施了互惠账本和互动速度评分,以量化和跟踪随时间变化的互动情况。关键的决策是使用指数衰减模型,这使我们能够根据最后一次互动日期预测连接强度。这种方法相比于简单的指标(如连接数量或参与率)提供了更细致的关系动态理解。<p>我们与其他社交媒体分析工具的不同之处在于,我们专注于关系的数学建模,而不仅仅是表层的参与指标。虽然像LinkedIn Analytics这样的工具提供了帖子表现的洞察,但它们往往忽视了驱动参与的潜在关系动态。我们的模型帮助用户理解何时重新与连接互动以维持其强度。<p>目前,我们处于测试阶段,并根据用户反馈不断完善我们的算法。一些局限性包括需要更广泛的数据来提高准确性,以及整合LinkedIn以外的其他社交平台。我们还在努力增强我们的内容生成能力,以更好地与我们推荐的参与策略对齐。<p>您可以在 https://social-craft-ai.vercel.app 免费试用SocialCraft AI。我们欢迎任何技术问题或对我们方法的反馈!