返回首页
一周热榜
嗨,
我进行了一项有趣的实验,试图通过仅使用Gemini 2.5在模拟中超越丹麦C25指数。
我给Gemini 2.5输入了股票数据、丹麦新闻文章、维基百科和谷歌趋势的热门列表,以及更多的数据,比如欧盟统计局的数据,以看看能否让Gemini超越丹麦C25股票指数(如诺和诺德、嘉士伯、马士基等)。
它只能看到当前日期的数据以及过去的数据,并被提示不要使用训练数据中的未来数据。它被提示遵循以下策略:
- 从长远角度看待问题
- 对持仓规模保持谨慎
- 只有在看到明确机会时才进行交易
它表现得相当不错,但最终做了一些糟糕的决策,在不合适的时机卖出——这几乎让人感觉它有些慌乱。
数据范围是从2025年1月1日到2025年11月12日。
---
你有什么改进的建议吗?我认为下一步是使用更多的思维链过程和多个角色来评估每项投资。
我最近关注了过去12到18个月内推出的多款开发工具和人工智能工具,发现一个反复出现的模式:
- 产品强大,技术价值明确
- 早期用户来自朋友、Twitter或社区
- 然后在转化为付费用户时停滞不前
看起来效果不如预期的事情:
- 排名靠前但不转化的内容
- 产生讨论但没有收入的社区帖子
- “公开构建”但没有明确的付费路径
可能有效但不稳定的事情:
- 集成和生态系统
- 非常狭窄的目标客户群 + 外部推广
- 创始人主导的销售持续时间远超预期
对于今天积极推出开发工具的创始人:
- 实际上是什么让你获得了前10到50个付费用户?
- 什么看起来有前景但最终却是死胡同?
- 如果你在2026年重新开始,你会优先关注什么?
我对现在有效的做法感到好奇,而不是理论上听起来不错的东西。
我现在的主要工作流程是协调多个独立的Claude实例,以同时处理代码库的不同部分。<p>我发现最大的障碍是上下文切换。我尝试过手动管理git工作树、自定义Claude技能以及各种封装工具,但它们都显得太繁重、缓慢或限制太多。我希望能有一种解决工作树管理开销的方法,而不需要试图“掌控”我整个开发过程。<p>因此,我构建了cwt来填补这个空白。它是一个轻量级的文本用户界面(TUI),使得为AI代理快速搭建和拆除沙箱环境变得简单。它没有强加任何新的抽象或工作流程。它的底层就是git,因此没有任何额外的开销。<p>这个项目是用Ruby和Ratatui编写的。我很想听听其他人在同一个代码库上同时运行四到五个不同的AI“冲刺”时是如何管理状态的。