我会直截了当地谈谈我的处境,因为我不知道还能向谁求助。
我父亲被诊断出癌症。在他住院期间,市政厅清空了他的房子。我所有的东西都在那栋房子里。价值超过2万英镑的设备,多年的研究成果,一台存有数千小时工作的服务器。我孩子的头发锁,照片,统统被扔进了垃圾场。
我的家人让我的垂死父亲对我产生了敌意。我最终和一个患有偏执型精神病的人住在一起。在那里,我完成了接下来要描述的大部分工作。三天前,我经历了24小时的虐待,现在我和我的狗住在帐篷里。气温5°C,没有钱。
市政厅拒绝提供住房。政府不承认我的自闭症。他们希望我在帐篷里每周找工作35小时。
我并不是无能。我养活过一个家庭,整个成年生活都在工作。监督团队,纹身,自由职业编程,在与Linux合作的20年中构建专有后端系统。我的自闭症在这里并不是一种残疾。它是我能够在脑海中容纳整个操作系统架构并看到每个组件如何连接的原因。当我将这个大脑指向一个问题时,它能以大多数人无法理解的速度产生有效的系统。
在过去的四个月里,我一直在构建OctantOS。这是一个为自主AI代理设计的操作系统。不是框架,也不是容器封装,而是一个具有自己内核(OctantCore,完全从头开始用Rust编写)、自己的虚拟机监控器(OctantVMM)、单一二进制Rust用户空间,以及一个在内核级别强制执行代理权限的10层安全堆栈的实际操作系统。
大约130万行代码,约80万行Rust,50个库,约25个卫星项目,3900多个测试。独立开发者,没有计算机科学学位,四个月的时间。
论文主题:应用层信任对自主代理来说是不够的。OctantCore将代理身份、能力边界、TTL强制执行和审计作为一流的内核原语。清单编译为内核强制执行策略。代理并不决定自己能做什么,内核来决定。
Rust LSM补丁已由Google的Rust-for-Linux团队和LSM维护者在lore.kernel.org上审查。OctantCore在OctantVMM上启动,具有内存管理器、中断、系统调用接口、代理描述符表和在启动时初始化的能力强制器。通过同时协调10-12个并行的AI编码会话构建而成。
这超越了隔离。代理能够识别自身知识的空白,并主动寻找他们不知道的东西(好奇心子系统,已实现)。背景推理整合学习到的模式(梦境)。在宪法安全边界内的七阶段自我进化管道。新技能通过网状层在全球每个OctantOS实例中传播,所有这些都受到内核的约束。
之前从未存在过这样的东西。如果我无法继续下去,这一切都将消亡。
我需要稳定性。一个可以居住的地方,以及足够的资金来维持基本生活三个月,以便让OctantOS准备好接受投资。一个愿意支持我度过这段时间的天使投资人。一个说“来这里工作,我们有地方”的公司。我愿意明天和我的狗搬到任何地方。或者只是希望能得到一些曾经历过此事的人的建议。
我只需要有人对我的大脑在不在帐篷里受冻的情况下能做什么下个赌注。
https://github.com/MatrixForgeLabs/OctantOS
https://octant-os.com
https://gofund.me/f554a86ee
返回首页
一周热榜
我需要找一个合作伙伴来推出我的应用程序。我是一名建筑专业人士,开发了一款处于未开发领域的应用。这是一款出色的工具,完全离线使用,不需要云端、不需要账户,也没有订阅。没有人想要那些麻烦的东西!为我们建筑专业人士开发的所有移动应用都很糟糕,我试过它们所有的。<p>我接触了许多移动应用开发者,但他们都没有咨询或合作推出应用的途径。在开发之前,他们都收取高额费用。<p>我们该去哪里找到你!
大家好,我基于我高度升级的 VITS 模型,制作了一个 TTS 模型,该模型以外部说话者嵌入(Resemble AI 的 Resemblyzer)为条件。<p>这个模型大约有 3100 万个参数(ONNX 格式),经过调优以实现低延迟和本地推理,并且已经导出。我试图突破小型快速模型的极限。它在服务器 CPU 上的运行速度是实时的 5.6 倍。<p>该模型支持声音克隆和声音混合(将两个或多个说话者的声音混合以生成新声音),许可证为 Apache 2.0,并使用 DeepPhonemizer(MIT 许可证)进行音素化,因此没有许可证问题。<p>代码库包含检查点、运行方法以及 Colab 和 HuggingFace 演示的链接。<p>不过,由于模型体积小,音频质量并不是最佳,并且由于它是基于 LibriTTS-R 和 VCTK(这两个都是完全开放的数据集)进行训练的,因此说话者的相似性也不是很好。<p>尽管如此,我希望它能对你们有所帮助。
我发布了 WebAssembly4J,并附带了两个运行时绑定:
- Wasmtime4J – Wasmtime 的 Java 绑定 [链接](http://github.com/tegmentum/wasmtime4j)
- WAMR4J – WebAssembly Micro Runtime 的 Java 绑定 [链接](http://github.com/tegmentum/wasmr4j)
WebAssembly4J 是一个统一的 Java API,允许在不同的引擎上运行 WebAssembly [链接](http://github.com/tegmentum/webassembly4j)。
这个项目的动机在于,当前 Java 有多个新兴的 WebAssembly 运行时,但每个运行时都暴露了自己的 API。如果你想尝试不同的引擎,就必须每次都重写集成层。
WebAssembly4J 提供了一个单一的 API,同时允许在底层使用不同的运行时提供者。
项目目标:
- 从 Java 应用程序运行 WebAssembly
- 允许跨引擎比较运行时
- 使 WebAssembly 运行时对 Java 开发者更易获取
- 在运行时演变的同时提供稳定的接口
当前支持的引擎:
- Wasmtime
- WAMR
- Chicory
- GraalWasm
为了支持传统和现代的 Java 环境,该项目的目标是:
- Java 8(JNI 绑定)
- Java 11
- Java 22+(支持 Panama)
构件已发布到 Maven Central,因此可以直接添加到现有项目中。
我非常希望听到从事 Java + WebAssembly 集成或运行时实现的人的反馈。
我和一个朋友开发了一个浏览器原型,可以通过使用 getDisplayMedia、客户端唤醒词检测和服务器端多模态推理来回答屏幕上显示的内容的问题。
<p>困难之处:</p>
– 让模型能够指向特定的用户界面元素
– 在多步骤工作流程中保持一致性(例如:“帮我在 Tinkercad 中创建一把剑”)
– 防止无限镜像效应,以及窗口共享与全屏共享之间的混淆
– 保持语音 → 截图 → 推理 → 语音的延迟足够低,以便让对话感觉自然
我们把它包装成“Clippy”以增加趣味,但真正的实验是让模型工具调用新的截图,以帮助它获取更多上下文。
<p>一个实际的应用案例是远程技术支持——下次我妈妈打电话时,我会把这个发给她,而不是进行屏幕共享。</p>
<p>想知道哪些地方会出问题。</p>