返回首页
最新
嗨,我们刚刚发布了一篇关于 Kevin-32B = K(ernel D)evin 的博客文章。<p>据我们所知,这是第一个在 CUDA 内核上进行强化学习训练的开源模型。我们的目标是展示使用 GRPO 进行多轮强化学习。我们使用了来自 KernelBench 数据集的 180 个 Python 到 CUDA 的转换任务。<p>结果令人惊讶地强劲!我们能够超越顶尖的推理模型,如 o3 和 o4-mini。<p>我们在博客文章中分享了我们的训练设置和经验。此外,该模型已在 HuggingFace 上发布:<a href="https://huggingface.co/cognition-ai/Kevin-32B" rel="nofollow">https://huggingface.co/cognition-ai/Kevin-32B</a>
可以分析:
- 教科书
- 讲座
- 视频
生成:
- 闪卡
- 练习考试
- 消息
内置:
- 白板
- 计算器
- 图形工具
你好,HN,
从小我就对机器学习和深度学习产生了浓厚的兴趣。目前我在加拿大多伦多的计算机科学本科专业读二年级,已经在行业中积累了近两年的经验(计算机视觉和自然语言处理),同时在学术界也有超过一年的全职人工智能研究经历。此外,我有不少开源项目(全部与深度学习相关),总共获得了超过1000个星标,其中一些在各自的领域内非常知名。然而,最近我感觉这个领域已经饱和,每天都有新的研究成果发布,作为一名人工智能开发者,我觉得自己不过是机器中的一个齿轮。我理解所有领域在某种程度上都受到这种现象的影响,但在人工智能领域,我的工作完全没有个人色彩,反而让我觉得自己像一个机器人,训练视觉变换器进行分类,微调大型语言模型以处理特定类型的文档,进行架构调整以实现微小的性能提升,等等。
你能建议我考虑计算机科学中的哪些替代方向吗?我有两个主要优先考虑的方面:
* 创造力:我并不想寻找典型的软件开发职位,比如全栈开发者。相反,我对那些需要创造力的机会感兴趣,几乎像是在解谜一样,并且不会在一段时间后变得“例行公事”。
* 行业:我的目标是进入行业,而不是学术界。这并不是因为我不喜欢研究(事实上,我更喜欢研究而非应用工作),但尽管我不情愿承认,薪资确实在我的决策中起着一定作用,我的目标是六位数的收入。
举个具体的例子:我热爱逻辑、编程语言研究、理论计算机科学等工作,因为这些都满足我的第一个标准,但遗憾的是,似乎就业机会大多局限于学术界?
我非常感谢你的想法和反馈。