返回首页
一周热榜
如果你喜欢Wordle,欢迎试试我刚制作的新游戏。欢迎任何反馈 :)
60% 是氛围编码,40% 是思考,你怎么看?<p>https://firstusers.tech
嗨,HN,我是Tina。
和你们中的许多人一样,我对大型语言模型(LLM)的幻觉感到沮丧——这些输出听起来非常自信,但实际上是虚构的。因此,我创建了CompareGPT.io,这是一个工具,可以:
- 在多个LLM(如ChatGPT、Gemini、Claude、Grok等)上运行相同的查询
- 并排显示结果,以便更容易发现差异(和幻觉)
- 提供统一的API,便于集成
我们刚刚开放了候补名单(并提供半价的早鸟优惠和终身计划赠送)。
我很想听听这个社区的反馈:你们认为多模型一致性是否可以成为减少法律、金融或研究领域幻觉的标准方法?
谢谢!