返回首页

24小时热榜

1作者: __cayenne__大约 11 小时前原帖
我想创建一个大型语言模型(LLM)游戏基准,以充分展示这一代前沿LLM的顶尖技能——编程。 十年前,一个团队发布了一款名为Screeps的游戏。它被描述为“为程序员打造的MMO RTS沙盒”。在Screeps中,玩家通过编写JavaScript策略,使其在游戏环境中执行。 Screeps的模式,即编写代码并在实时游戏环境中执行,非常适合用作LLM基准。基于Screeps开源API的一个版本,LLM Skirmish将LLM进行对抗,进行一系列1对1的实时战略游戏。 此外,还有一个社区排行榜,您可以选择自己的LLM并提交自己的游戏策略,与其他社区成员进行对抗。
1作者: daleseo大约 11 小时前原帖
我们注意到越来越多的开发者在他们的 GraphQL 工作流程中直接使用 AI 编码助手。问题在于,这些助手往往会回归到通用或过时的 GraphQL 模式。 在不断纠正同样的问题后,我们最终将希望助手遵循的 GraphQL 最佳实践和规范打包成可重用的“技能”,并在这里开源发布:<a href="https:&#x2F;&#x2F;github.com&#x2F;apollographql&#x2F;skills" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;apollographql&#x2F;skills</a> 通过 `npx skills add apollographql&#x2F;skills` 安装后,助手将开始生成带有变量的命名操作、`[Post!]!` 列表模式,以及更一致的客户端行为,而无需在每个提示中重复这些规则。 我们希望助手现在能够以我们自己编写的方式来编写 GraphQL。欢迎试用这个仓库,并告诉我们您的想法。
1作者: tintinwinata大约 11 小时前原帖
在发现大多数AI代码审查工具完全忽略Bitbucket后,我感到非常沮丧——它们都是优先支持GitHub,其次是GitLab,最后才是Bitbucket。 这个工具使用Claude CLI而不是API,这意味着没有按令牌收费(只需使用您现有的Claude订阅)。该工具接收Bitbucket的webhook,克隆本地仓库,并直接在PR上发布审查评论。 主要特点: <p>支持Bitbucket Cloud、Server和Data Center 按顺序处理PR,并提供Prometheus指标 可定制的审查模板(专注于安全、性能、快速审查) 您的代码始终保留在您的基础设施内 <p>设置过程大约需要5分钟,使用交互式向导。 GitHub: <a href="https://github.com/TinTinWinata/bitbucket-automatic-pr-reviewer" rel="nofollow">https://github.com/TinTinWinata/bitbucket-automatic-pr-reviewer</a>