返回首页
最新
嗨,HN!我们想分享我们构建的一个项目:BesiegeField——一个大型语言模型在物理基础的建造游戏《Besiege》中设计、测试和完善机器的环境。
机器设计被视为一个代码生成问题:大型语言模型选择标准部件并指定如何连接它们,使得这个任务非常适合语言模型。
该环境包括诸如远投石头或在崎岖地形中导航等任务,并支持自定义目标和环境。
我们利用它探索了无需微调的自主工作流程和强化学习,尝试了构建汽车和投石机等任务。
它在Linux集群上运行100多个并行进程,以支持可扩展的强化学习训练。
欢迎来自人工智能、强化学习、工程和游戏开发社区的反馈。
GitHub: [https://github.com/Godheritage/BesiegeField](https://github.com/Godheritage/BesiegeField)
HuggingFace演示(单代理):[https://huggingface.co/spaces/Godheritage/BesiegeField-MachineGenerator](https://huggingface.co/spaces/Godheritage/BesiegeField-MachineGenerator)
我是一名长期使用Snowplow的用户和非官方的推广者。我对其创始人Alex和Yali深感敬佩,曾与他们见过几次面。
让我爱上Snowplow的原因在于它没有偏见,能够访问原始事件数据,并且是真正的开源。2013年,这一切对我来说都改变了。我再也无法以同样的方式看待谷歌分析(GA)。
多年来,分析逐渐转向由更便宜的CPU和存储驱动的SQL数据仓库,dbt、可重复性和透明性也随之而来。我意识到需要一个民主化的Snowplow管道,于是在2019年推出了一个托管版本。
在2024年1月,Snowplow更改了其许可证(SLULA),实际上通过限制生产使用结束了开源Snowplow。当这一切发生时,我意识到开放数据和开放架构的精神已经消失。
一周后,我对其进行了分叉,想要让这个理念继续存在。
OpenSnowcat在Apache 2.0许可下保留了原始的收集器和丰富器,并与现有的Snowplow管道完全兼容。我们定期维护它,进行补丁更新、性能优化,并与现代工具(如Warpstream Bento)进行集成,以便进行事件处理和路由。
我们的目标很简单:保持开放分析的开放性。
我很想听听社区其他人对如何在数据基础设施中保持开放性的看法,因为“开源”正变得越来越商业化。
就这些,我本应该早些在这里发帖,但现在觉得时机正好。
对于一位有经验的软件开发者,希望开始进入人工智能开发领域。您会推荐哪些在线课程给今天想要进入这个领域的人呢?<p>任何关于从哪里开始或应该关注哪些领域的指导都将非常感激。虽然我更倾向于在线课程,但我也愿意接受其他学习形式,比如书籍、YouTube频道或教程。<p>提前感谢您的建议!
大家好。我们为M系列硬件开发了自己的Mac应用程序。该应用程序基于我们自己的引擎,名为uzu(可在GitHub上以MIT许可证获取)。
我们完全从零开始编写,包括推理部分。我们的目标是展示使用本地模型可以实现的功能。在应用程序部分,我们将发布一些用例,您可以轻松地在自己的应用中实现。
我们非常欢迎任何反馈。<p>目前我们还没有一套正式的基准测试。总体来说,我们的速度比llama.cpp快,与MLX相当。在下一个版本中,我们的速度将超过这两者。
大家好,这是我在HN的第一次发帖。
我使用Typescript、Faust、Web Audio Modules和WASM构建了一个网页数字音频工作站(DAW)。
我花了一年时间来开发这个项目,其中大约四个月是从零开始重写的。
这个DAW以及目前的所有乐器和效果都是完全免费的。您还可以离线保存和导入项目。通过谷歌云端硬盘的云保存功能可以使用,但尚未经过验证,所以我建议您暂时不要使用。
未来我可能会出售一些样本包、其他效果和乐器作为附加功能。不会有订阅服务,因为这与创造文化背道而驰。
基本上,在这个四轨道软件中,您可以在“图表”上写下歌词,所有的MIDI和音频片段将与图表上的该部分关联。
作为一名词曲作者,我总是对大多数DAW中留下的“笔记”部分感到烦恼,或者在写歌时需要打开电子邮件或记事本来写歌词。
这个软件的目标是让创作歌曲、歌词和音乐的体验更加整合。
此外,尽管我本可以选择更传统的波形视图多轨录音机的路线,但我希望能够 encapsulate 使用四轨磁带录音机的感觉。有时候,限制会给我们带来自由,尤其是在创作领域。
我希望这个工具能吸引那些有兴趣写歌的人,帮助他们专注于使歌曲令人难忘的本质——歌词、旋律和节奏。对于声音设计和全面制作来说,还有许多更高级的工具。这更像是一个音乐草图本。
希望您喜欢这个工具,抱歉里面有很多bug(:
谢谢!
# 人文学科的最后一战
对于许多代人来说,知识一直是确保人类能够创造自身价值的工具。这种力量正处于向少数依赖其闭源价值的公司转移的边缘,知识的完整性完全掌握在他们手中。“知识就是力量”这一理念变得愈发明显,且越来越集中于少数人手中。
> 第一阶段 - 数据挖掘
真正的价值尚未显现。成本高昂,克隆每一个数据源都是一项艰巨的任务。幸好有一些开源项目,提供免费的数据(https://index.commoncrawl.org/),几百个PB的数据应该是一个不错的起点。
> 第二阶段 - 依赖性创造,价值低于成本
让我们从商业基础知识开始,掠夺性定价(https://en.wikipedia.org/wiki/Predatory_pricing)应该是一个好的起点。我们很懒,既然我们已经收集了6.4 PB的数据,就把剩下的收集工作留给那些愿意付费的用户,让我们可以使用他们的数据(https://help.openai.com/en/articles/5722486-how-your-data-is-used-to-improve-model-performance),这多好啊!
> 第三阶段 - 排挤竞争对手
哦,天哪!大多数人将他们的问题输入到我们的模型中,忽视其他开源和开放知识转移(https://blog.pragmaticengineer.com/stack-overflow-is-almost-dead/)。
他们选择忽视这些,任其消亡,因为流量的缺乏意味着广告等收入不再得到支持,导致竞争对手迟早破产。互联网因此而衰退,发布任何内容都变得毫无意义,因为它们只会被挖掘并成为那些大模仿者的牺牲品。真是太酷了,你们正在为他们做工作!
> 第四阶段 - 盈利
知识现在已经集中化;人们习惯于随便输入一个提示就能得到答案,无论他们的活动是什么。他们像僵尸一样服从,无论提示机器输出什么,他们都会相信,因为他们的理智一点点地在流失。这可能不会那么快发生,但如果每个人都在对你撒谎,你会失去理智,最终自己也会相信这些谎言(https://en.wikipedia.org/wiki/Asch_conformity_experiments)。无论提示机器背后是谁,他们现在都能控制你。
灵感来源:
https://ia801705.us.archive.org/4/items/Various_PDFs/NeilPostman-AmusingOurselvesToDeath.pdf