返回首页
最新
嗨,HN——我们是 BrowserOS.com 的创始人(YC S24),正在构建一个开源的自主网络浏览器。我们是 Chromium 的一个分支,目标是让非开发者能够在自己的浏览器上创建和运行有用的代理。
--- 当我们一个月前推出时,我们认为我们采用了正确的方法:一种“单次”代理,用户只需给出一个高层次的任务,比如“从亚马逊订购牙膏”,代理就会制定计划并执行。
但我们很快遇到了一个问题,从那时起我们一直在努力解决:用户体验完全是碰运气。有时它像魔法一样工作,但其他时候代理会卡住、生成错误的计划,或者偏离方向。它的可靠性不足以让任何人信任。
这迫使我们重新审视用户体验。我们在过去几周尝试了三种不同的用户构建代理的方法:
A) 拖放工作流:类似于 n8n 等工具。这种方法创建的代理非常可靠,但我们发现界面对新用户来说显得复杂且令人畏惧。一位测试者(我的妻子)说:“这比自己动手做任务还要麻烦。”构建一个简单的工作流需要超过 20 分钟的配置时间。
B) “单次”代理:这是我们的起点。用户给代理一个高层次的目标,代理完成其余工作。当它工作时感觉很神奇,但它不够稳定,较小的本地模型在独立创建良好计划时确实很困难。
C) 跟随计划的代理:一种折衷方案,用户用自然语言提供一个简单的高层次计划,LLM 执行每一步。LLM 不需要计划,只需按照指示操作,就像一个初级员工。
--- 在构建并尝试了这三种方案后,我们认为 C) 是可靠性和易用性之间的最佳折衷。这里是演示链接 <a href="https://youtu.be/ulTjRMCGJzQ" rel="nofollow">https://youtu.be/ulTjRMCGJzQ</a>
例如,用户不仅仅说“订购牙膏”,而是提供一个简单的计划:
1. 导航到亚马逊
2. 搜索 Sensodyne 牙膏
3. 从结果中选择一包 Sensodyne 牙膏
4. 将选中的牙膏加入购物车
5. 进行结账
6. 验证购物车中只有一件商品。如果有多于一件商品,请提醒我
7. 最后下订单
在这个指导下,我们的成功率从 30% 提升到了约 80%,即使是使用本地模型。折衷之处在于:用户花 30 秒写一个计划,而不是仅仅陈述一个目标。但他们得到了可靠性作为回报。请注意,我们的代理构建器提供了一个良好的起始计划,用户只需进行编辑/自定义。
--- 您可以尝试我们的代理构建器,并告诉我们您的想法。我们非常支持隐私,因此我们为本地 LLM 提供一流的支持。您可以通过 Ollama 或 LMStudio 尝试 GPT-OSS,效果很好!
我今天大部分时间都会在这里,乐意回答任何问题!
想知道其他人是如何找到早期创业公司加入的。考虑到创业公司正在招聘的第一位工程师,可能是前20名员工之一。
大家好,我们是Phil、Ian和Jonny,我们正在构建BlankBio([https://blank.bio](https://blank.bio))。我们正在训练RNA基础模型,以支持一个用于治疗的计算工具包。我们的第一个应用是mRNA设计,我们的愿景是让任何生物学家都能设计出有效的治疗序列([https://www.youtube.com/watch?v=ZgI7WJ1SygI](https://www.youtube.com/watch?v=ZgI7WJ1SygI))。
BlankBio源于我们在该领域的博士研究,这些研究是开源的。我们有一个模型[2]和一个带有API访问的基准[0]。
mRNA有潜力编码疫苗、基因疗法和癌症治疗。然而,设计有效的mRNA仍然是一个瓶颈。目前,科学家通过手动编辑序列AUGCGUAC...并通过反复试验测试结果来设计mRNA。这就像编写汇编代码并管理单独的内存地址。这个领域充斥着针对治疗公司的资本:Strand(1.53亿美元)、Orna(2.21亿美元)、Sail Biomedicines(4.4亿美元),但解决这些问题的工具仍然处于低级水平。这正是我们希望解决的问题。
一个大问题是mRNA序列难以理解。它们编码一些特性,比如半衰期(RNA在细胞中存活的时间)和翻译效率(蛋白质产出),但我们不知道如何优化它们。为了获得有效的治疗,我们需要更高的精度。科学家需要针对特定细胞类型的序列,以减少剂量和副作用。
我们设想一个未来,RNA设计师可以在更高的抽象层次上操作。想象一下这样的代码:
```python
seq = "AUGCAUGCAUGC..."
seq = BB.half_life(seq, target="6 hours")
seq = BB.cell_type(seq, target="hepatocytes")
seq = BB.expression(seq, level="high")
```
为了实现这一目标,我们需要来自预训练模型的可泛化RNA嵌入。在我们的博士研究期间,Ian和我致力于RNA的自监督学习(SSL)目标。这种方法使我们能够在未标记数据上进行训练,并具有以下优点:(1)我们不需要嘈杂的实验数据;(2)未标记数据的数量远大于标记数据。然而,挑战在于标准的自然语言处理(NLP)方法在基因组序列上效果不佳。
通过使用联合嵌入架构的方法(对比学习),我们训练模型识别功能相似的序列,而不是预测每个核苷酸。这一方法效果显著。我们的1000万参数模型Orthrus在4个GPU上训练14小时,超越了在1000个GPU上训练一个40亿参数模型Evo2一个月的结果[0]。在mRNA半衰期预测方面,仅通过对我们的嵌入进行线性回归,我们的表现超过了监督模型。这项在我们学术时期完成的工作是我们正在构建的基础。我们正在改进训练算法,扩大预训练数据集,并利用参数扩展,目标是设计出有效的mRNA治疗。
我们有很多话要说,为什么其他SSL方法比下一个标记预测和掩蔽语言建模效果更好:其中一些可以在Ian的博客文章[1]和我们的论文[2]中查看。一个重要的结论是,当前将NLP应用于生物序列模型扩展的方法无法完全解决问题。基因组的90%可以变异而不影响适应性,因此训练模型预测这种嘈杂序列会导致次优的嵌入[3]。
我们认为数字革命和RNA革命之间有很强的相似性。在计算机早期,程序员编写汇编代码,直接管理寄存器和内存地址。今天的RNA设计师通过反复试验手动调整序列,以提高稳定性或降低免疫原性。正如编译器解放了程序员不必关注低级细节,我们正在为RNA构建抽象层。
我们目前与一些早期阶段的生物科技公司进行试点,证明我们的嵌入的实用性,我们的开源模型已被赛诺菲和GSK等公司使用。我们正在寻找:(1)在RNA相关领域工作的合作伙伴;(2)希望从任何尝试设计RNA序列的人那里获得反馈,你们遇到了哪些痛点?(3)其他应用的想法!我们与一些生物标志物提供公司进行了交谈,一些初步分析显示出改善的分层效果。
感谢您的阅读。欢迎就技术方法、基因组与语言的不同之处或其他任何问题进行提问。
- Phil、Ian和Jonny
founders@blankbio.com
[0] mRNABench: [https://www.biorxiv.org/content/10.1101/2025.07.05.662870v1](https://www.biorxiv.org/content/10.1101/2025.07.05.662870v1)
[1] Ian的博客关于扩展: [https://quietflamingo.substack.com/p/scaling-is-dead-long-live-scaling](https://quietflamingo.substack.com/p/scaling-is-dead-long-live-scaling)
[2] Orthrus: [https://www.biorxiv.org/content/10.1101/2024.10.10.617658v3](https://www.biorxiv.org/content/10.1101/2024.10.10.617658v3)
[3] Zoonomia: [https://www.science.org/doi/10.1126/science.abn3943](https://www.science.org/doi/10.1126/science.abn3943)
<a href="https://archive.ph/5gJNi" rel="nofollow">https://archive.ph/5gJNi</a>