嗨,HN,我是蒂娜。
我在使用大型语言模型(LLMs)时遇到的一个主要困扰是“幻觉”:那些听起来很自信但实际上是虚构的回答。比如虚假的引用、错误的数字,甚至整个“系统报告”。
因此,我正在开发CompareGPT,旨在通过以下方式提高AI输出的可信度:
- 将多个LLM并排对同一查询进行比较
- 方便查看一致性(或缺乏一致性)
- 在浪费时间或造成损害之前帮助识别幻觉
链接在这里:<a href="https://comparegpt.io/home" rel="nofollow">https://comparegpt.io/home</a>。我们已经开启了候补名单,期待收到反馈,特别是来自研究、金融或法律领域的LLM使用者的意见。
谢谢!
返回首页
一周热榜
嗨,HN,我是Valerii,PlanEat AI的创始人。
在我经营创业工作室的漫长日子里,晚餐成了每天都要做的决策。我尝试过一些流行的应用程序,但没有一个能够根据时间限制、过敏情况和个人口味规划整整一周的菜单,并生成一份整洁的购物清单。因此,我创建了PlanEat AI。
它的功能包括:
• 根据饮食、过敏、个人喜好、每日餐数和烹饪时间个性化每周菜单
• 生成一份整合的购物清单,按类别分组并去重数量
• 允许你随时更换菜品,并即时重新计算计划、食谱和清单
• 专注于简单健康的饮食,不进行卡路里追踪
技术方面:
使用Flutter和Dart,Supabase Postgres和边缘函数,搭建了一个小型的LLM层用于食谱排名,StoreKit用于订阅。
我希望获得以下方面的反馈:
• 用户引导流程和偏好捕捉
• 针对不同饮食和时间预算的菜单质量
• 购物清单的分组和命名
• 你希望接下来有哪些集成
很高兴回答问题并分享更多细节。