SBOM Workbench v1.19 发布了。
新功能:
• 直接导入原始结果
• 导入带源代码的项目
• CycloneDX 输出与 Dependency Track 更加兼容
获取链接: https://github.com/scanoss/sbom-workbench/releases/tag/v1.19.0
返回首页
最新
嘿,HN!我希望能找一些人来试试我为学习DSPy而制作的小项目!我一直是小说和网络小说的忠实读者,对两个问题充满好奇:大型语言模型(LLMs)如何能够根据读者反馈逐步学习写得更好,以及哪些LLMs在创意写作方面实际上表现最佳(研究基准很酷,但不一定能转化为现实世界的使用)。
这正是我创建 narrator.sh 的原因!这个平台接受用户输入的小说创意,然后通过使用 DSPy 根据真实的读者反馈逐章生成连载小说。我使用了链式思维(CoT)和并行模块来分解写作任务,精炼模块和将LLM作为评判者的奖励函数,以及SIMBA优化器来重新编译之前章节的用户评分,以改善后续章节。
与其使用合成基准,我追踪真实的读者指标:阅读时间、评分、书签、评论和回访。这创建了一个排行榜,显示哪些模型实际上写出人们想要完成的引人入胜的小说。
目前,关于创意写作LLMs的评估主要来自作者的视角(例如OpenRouter对Novelcrafter等工具的使用数据)。但最终决定好坏的还是读者,而不是作者。
你可以在这里试试:<a href="https://narrator.sh" rel="nofollow">https://narrator.sh</a>。这是当前的排行榜:<a href="https://narrator.sh/llm-leaderboard" rel="nofollow">https://narrator.sh/llm-leaderboard</a>(现在有点空荡荡的,因为用户不多,哈哈)。
(友情提示:由于我在Reddit上发布了寻找测试者的帖子,导致一些人对提示进行了创意发挥,因此有一些成人内容。我正在努力丰富内容!)
我一直在使用Cursor进行一些非编码任务,效果非常好。问题是VS Code IDE是为编码设计的,我需要一个更好的界面来处理这些非编码任务。于是我开发了一些扩展来添加自定义层:
1. CSV查看器,用于数据分析,将CSV文件呈现为可编辑的电子表格。
2. 幻灯片制作器,将.md文件呈现为幻灯片,并可以通过Cursor代理进行创建和编辑。
3. 国际化管理器,将多个翻译文件加载到一个表格中并并排显示,同时Cursor通过代理更新翻译。
为了让每个人都能使用这个工具,我将核心组件开源为一个工具包,可以用来快速编码自定义扩展。它配备了一个强大的提示模板,通过添加您的需求,您只需一个提示就能获得一个完全可用的扩展。
我这样做部分是为了实验,看看在人工智能时代,软件分发是否可以通过快速编码的帮助,让用户参与到最后一公里的贡献中。
我使用OpenAI API进行命名实体识别(NER)任务以及基于方面的情感分析,效果相当不错。最近,有人问我是否可以通过在聊天界面上传文本来让ChatGPT进行同样的分析。我尝试了一下,发现与我从API获得的结果相比,效果相当差。原因在于ChatGPT只是编写Python代码,并使用现成的自然语言处理模块来执行这个任务。
你有什么建议可以解决这个问题吗?我希望ChatGPT生成文本,而不是Python代码,并执行那段代码。