返回首页

一周热榜

2作者: ggm5 天前原帖
我希望有一位专业的经济学家能在博客上指出,马斯克(以及其他超级富豪)并没有像图表所暗示的那样,能够随意在他们的游艇上堆积流动现金。 即便是出售他在特斯拉、X和SpaceX的股份,都会改变这些资产的价值,影响某个国家的税收收入,印钞的过程也需要时间和精力,运输这些资金则会产生成本。 拥有对1万亿美元投资配置的有效影响力是惊人的,但这在质上并不等同于“1万亿美元”,也不仅仅是“100万美元”的数量关系。因为这相当于整个美国经济的1/30(大约30万亿美元),因此实质上改变了美国营运资本的3%和整个美国股市的1%以上。 为了获得这些资金,他将制造出一场即时的流动性危机。他会吸走所有的股票交易现金,从而瞬间贬值其他所有股票。这将是一次巨大的事件。
2作者: RoyalTnetennba7 天前原帖
我需要一个分类器来处理一些细微且主观的分类,这些分类超出了典型的机器学习应用场景(例如,“这算是剧透吗?”,“这在事实上的正确性如何?”,“这个用户是在恶意攻击吗?”)。最终,我对自己构建的架构感到非常满意,因此将其推出为一个独立的API和服务,名为CriteriaBot。 **它的功能:** 你提供内容和用通俗英语描述的标准。它会给出一个真/假的裁决,判断该内容是否符合这些标准。 **工作原理:** 除了传统的分类器外,分类请求还会通过一组小型的开放权重的语言模型(LLM)进行路由,以达成共识裁决。我构建了一个预投票因子分解机,根据主题/类别的嵌入选择一个优化信号强度的LLM子池。第二个因子分解机则读取投票和嵌入,以得出单一裁决。该裁决会根据用户在语义相似评估中与模型的一致/不一致历史动态调整。 这些模型还连接到维基百科和Wolfram,以支持需要当前信息或数学基础的边缘案例。 **发现:** * 在相同的框架和样本集下,Gemma 4 26B的准确率仅比Opus 4.8低约1个百分点。 * 纯预言机在理论上非常优秀——目前数据集的准确率约为98%。我使用第二个因子分解机作为组合器,因为它理论上可以超越预言机的结果,但它也是一个有趣的备选方案。 * 最有用的单一LLM令我感到惊讶——LFM2 24B对共识的贡献最大,尽管在当前的LLM池中它的表现最差。它与其他模型的相关性最低(可能是由于其独特的架构?),这使得它在某些问题上成为有用的信号。 * 处理用户提交的图像的法律义务相当复杂。在我解决这个问题之前,我已禁用非我的用户的图像支持(如果你希望尝试“热狗,不是热狗”)。 * Rails将“criteria”单数化为“criterium”,而我直到修复这个问题时才意识到这是错误的,修复过程相当繁琐。 **我为什么要发布:** 我已经处理了一段时间的倦怠,而让这个项目运行起来让我感到无比充实。我的大多数个人生活中的人都是非技术背景,因此很难得到超出“这是什么?”的反应。 我非常期待你们的任何诚实反馈。
2作者: SpecialistK4 天前原帖
我正在查看我未命名的反向代理和CDN服务的日志。爬虫机器人群体像是对我的PHP应用感到不满一样,不断发起请求,所以我在查看哪些奇怪的用户代理字符串被允许连接。其中有“Sogou”和“meta-webindexer”,还有少量来自“SleepBot/1.0”的请求。 什么是SleepBot? 其ASN是谷歌,用户代理字符串为:“Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; 兼容; SleepBot/1.0; +http://sleepbot.com/) Chrome/131.0.0.0 Safari/537.36”(已编辑为不可点击链接)。 于是我访问了这个网站。看起来这是一个有趣的科技和氛围音乐爱好者的主页,他仍在运行一个Shoutcast在线广播流,但在过去五年里几乎没有在线活动。Wayback Machine显示十多年来几乎没有变化。但是,简历链接指向一个不同URL和用户名的GitHub账户,该账户在今年三月报告了一个问题。事情似乎更复杂了。 到底发生了什么?是谷歌或相关公司的员工在运行个人爬虫,还是在浏览网页时使用了自定义的用户代理字符串?难道有人打错了字?还是这是一种奇怪的安全游戏/替代现实游戏,而我正是那个上钩的人?