返回首页
最新
嗨,HN,
我是Mo。我目前正在创建一家初创公司,想要在通勤或洗碗时找到一种方式来听取研究论文以获得灵感。
我尝试过使用谷歌的NotebookLM,但输出效果对我来说并不理想。它听起来有点机械,对话太短,而且在技术细节上没有深入。
因此,我构建了PaperBot FM来解决这个问题。
它会将一篇研究论文(以及最多两篇支持性论文以提供背景)合成一集播客。目前,播客的平均时长约为30分钟,尽管我还在调整时长。
技术方面:
主要的挑战在于音频。我找不到一个能够有效处理三种不同声音在单一对话流中的TTS服务。为了解决这个问题,我围绕Gemini TTS构建了一个自定义包装器,协调三种不同的“角色”,以保持对话的趣味性。
运行方式:
目前,网站只是一个每日社区信息流。用户提交论文,投票,系统根据获胜者每24小时生成一集播客。这个服务完全免费,所有集数都是公开的。
接下来有什么计划?
我正在评估两个方面的兴趣:
- 将其转变为一个可以按需生成播客集的服务(用于解释、内部文档等)。
- 将声音协调功能开放为API,因为找到一个支持超过两个并发声音的服务出乎意料地困难。
希望你喜欢这个项目!如果你对生成自定义播客集或声音生成API感兴趣,请告诉我。
经过两年的研究、规划和工程开发,我即将推出 earsay。这是一款旨在提供愉悦使用体验的 iOS 播客应用。它能够在设备上100%检测广告,限制广告网络的追踪,并且不需要任何外部服务或订阅费用。
我一直在尝试使用Claude Code来研究政治主题,利用伯明翰大学提供的联合国大会演讲档案(<a href="https://www.ungdc.bham.ac.uk/" rel="nofollow">https://www.ungdc.bham.ac.uk/</a>)。以下是一些初步结果。
在大多数周五晚上和周末,我和妻子会花30分钟以上的时间在Netflix上滚动浏览,互相否决对方的电影建议。我们的口味交集非常小。她喜欢浪漫喜剧和偶尔的惊悚片,对评分毫不在意。而我则倾向于那些获得好评的作品和超过三小时的史诗电影。最终,我们总是会选择一些我们都不太想看的电影,或者是一些舒适的电视剧。
因此,我创建了movieagent.io来帮助我们。它是一个能够找到你今晚想看的电影的代理。这个代理充当仲裁者,尽力弥合用户之间的差距。整个过程大约需要2-3分钟,具体取决于意见分歧的程度(以及Anthropic的API负载)。
代理会问几个快速问题,然后进行“对决”,向你展示两部电影,并询问哪部电影更能引起你的共鸣。你的选择会揭示代理应该更深入探讨的方向。
最后,用户会收到4-5部电影的推荐,并附有个性化的推荐说明,解释为什么这部电影是今晚的好选择。
虽然有时结果仍然不尽如人意,但确实帮助我们度过了几次精彩的电影之夜。
在过去的六个月里,我通过Vibed编写了这个餐厅和酒吧推荐应用程序。我没有写过一行代码。欢迎反馈。
我不想要另一个应用程序、通知或仪表板。
我想要的是一种通过我每天都在查看的东西——我的桌面,来进行微妙的每日提醒。
于是,我构建了一个小型的本地优先守护进程,它每天更新一次壁纸,显示与我的目标相符的信息。
网站:https://gen-wal.laptopserver.dev
GitHub:https://github.com/nicemit/gen-wal
非常希望能收到反馈。