1作者: rahimnathwani11 个月前原帖
有些东西很难在没有观察他人操作的情况下学习。<p>这个人尝试编制了一份精选的隐性知识视频列表: https://www.lesswrong.com/posts/SXJGSPeQWbACveJhs/the-best-tacit-knowledge-videos-on-every-subject<p>他向lesswrong社区征求建议。我想知道HN上的朋友们是否有其他的建议。
1作者: atleastoptimal11 个月前原帖
在这个网站上,似乎普遍存在对人工智能进展的悲观态度。我认为这种怀疑是有道理的,但似乎每隔几个月就会有新的人工智能发展彻底颠覆我们对人工智能“永远”无法做到的许多假设。 在一个宇宙中,人工智能模型不断进步,最终在所有认知任务上超越人类,随后精细的运动任务(通过类人机器人和其他类型的机器人)也将紧随其后。 在这个宇宙中,假设我们在那时仍然活着,如果我们能够回到2025年中期,告诉过去的自己如何以最佳方式生活,考虑到这一切的发生,最好的做法是什么? 这篇文章并不是讨论人工通用智能(AGI)是否会很快出现或是否可能,我只是想知道,在这个假设的前提下,基于我们所知道的,最好的行动方案是什么?
1作者: cpard11 个月前原帖
我不断看到合成数据管道推动最新的LLM“突破”: • TinyZero的30美元微调工作流程 • Sky-T1的450美元推理模型构建 • Meta AI的Llama 3群体(2024年论文详细介绍了他们的合成数据训练) • 伯克利开放思想(“推理模型的数据配方”),昨天发布 还有一些开源工具包可以供你实验: https://github.com/meta-llama/synthetic-data-kit https://github.com/bespokelabsai/curator 但这仍然感觉非常以研究为导向。我没有找到很多这些管道在实际产品中运行的例子。 我很好奇: 1. 目前谁在生产中使用合成数据管道? 2. 它实际上改善了哪些任务。例如,为特定任务微调较小的模型? 任何真实世界的案例、指引或进一步阅读的建议都将非常感激。谢谢!