展示HN:每60分钟随机发现来自开放互联网的网站1 分•作者: whothatcodeguy•大约 21 小时前•原帖我昨天发布了这个,但之后对其进行了些许修改。这个想法很简单——我想发现一些有趣的新网站,于是从Common Crawl数据集中随机抽取50个网站,让ChatGPT对它们进行总结,并将结果展示在页面上。然后我给自己一个小时的时间,看看是否能发现一些有趣的内容,直到刷新出一组新的网站。 在这个过程中有很多噪音和商业内容,我想找出过滤这些的办法,但除此之外,我发现了各种有趣和奇怪的东西。比如人们的旧博客、食谱、摄影作品,还有一些我从未听说过的小镇的旅游网站。这一切都很有趣。