返回首页

一周热榜

9作者: ge96大约 17 小时前原帖
我感觉我没有选择,只能接受这一点。如果我想保住我的工作,就必须使用它。我曾为用代码制作东西感到自豪,但现在只需在提示框中输入几个词就能生成代码,这让我觉得一切都变得空洞了。写代码的乐趣不复存在。 我知道在个人爱好方面我可以这样做……但我需要钱,这是关键,我还不能离开,但如果每份工作都变成这样,我想我会选择离开。 我并不是否认它的能力,比如今天我需要制作一个能够支持HFP的蓝牙安卓应用,立刻就要。我凭目前的知识无法做到这一点,但人工智能可以……任何会打字的人都能使用它,那么我还有什么用呢? 所以,现在我的计划是利用这些工具,做我喜欢的事情,然后赚到足够的钱再离开。我会为自己的乐趣写代码。 我从2013年开始做开发/写代码。 我并不是说我反对这项技术让其他人能够编码,我只是觉得如果我必须使用它,而不再需要自己写代码,我对此感到难过。没有成就感。 还有一点是,如果你对此有所抵触,你就会被视为消极的人/反技术者,大家都在用,你也应该这样做。
9作者: todience5 天前原帖
我一直有一个冲动,希望我的两台MacBook能够互相通信。在一台电脑上工作时让另一台闲置,感觉像是资源的浪费。因此,我开发了Loopsy。最初的目标是通过本地网络进行文件传输,后来又增加了运行命令的功能。我尝试从一台机器运行编码代理到另一台机器,结果成功了。 后来我意识到,应该有更好的方法可以在健身房通过手机远程继续我的Claude会话。因此,我做了一个Cloudflare Worker,连接到我的本地机器。我只需要确保笔记本电脑是插电的。 我知道我可能是在重复造轮子,但我喜欢它能够正常工作。目前仍在进行端到端加密的开发,iOS应用还在审核中。 请告诉我你的想法。
8作者: khurdula7 天前原帖
在构建依赖于大型语言模型(LLMs)的工作流程时,我们通常使用结构化输出来处理程序化用例,例如将发票转换为行、将会议记录转换为工单,甚至将复杂的PDF文件转换为数据库条目。 模型可能会返回您想要的架构,但其中的虚构值(例如,`invoice_date`可能偏差2个月,或转录数组的顺序错误)。虽然JSON是有效的,但其中的值却不正确。 如今,结构化输出在使用LLMs时占据了重要部分,尤其是在构建确定性工作流程时。 当前的结构化输出基准(例如,JSONSchemaBench)仅验证JSON架构和类型的通过率,而不检查生成的JSON中的实际值。 因此,我们设计了结构化输出基准(SOB),通过测量JSON架构的通过率、类型以及在文本、图像和音频三种模式下的值准确性来解决这一问题。 在我们的测试集中,每条记录都与一个JSON架构和一个经过人工和LLM交叉验证的真实答案配对,因此缺失或虚构的值将被视为错误。 开源方面表现相当不错,GLM 4.7紧随GPT 5.4之后排名第二。 我们注意到不同模式之间的排名变化:GLM-4.7在文本领域领先,Gemma-4-31B在图像领域领先,Gemini-2.5-Flash在音频领域领先。 例如,GPT-5.4在文本中排名第三,但在图像中排名第九。 模型大小也不是一个预测因素:Qwen3.5-35B和GLM-4.7在值准确性上超越了GPT-5和Claude-Sonnet-4.6。Phi-4(14B)在文本上超过了GPT-5和GPT-5-mini。 结构化幻觉是最难解决的bug。这类值在类型上是正确的、在架构上是有效的,并且看起来合理,因此它们往往会逃过大多数保护措施。例如,在一条音频记录中,真实值是“target_market_age”: “15到35岁”,而模型返回的是“25到35”。没有字段级检查,这种错误是不可见的。 我们的目标是成为最优秀的通用模型,以处理确定性任务,而确定性的一项关键方面是可控且一致的输出结构。改善结构化输出的第一步是对其进行测量,并与最佳标准进行对比。
8作者: moomoo117 天前原帖
我真的很想了解我是否会改变现在的看法。在2019/2020年之前,我非常喜欢科技、电子产品,并且跟上潮流。<p>在过去的5到6年里,我逐渐对科技采取了一种选择退出的态度。<p>我已经不再关心这些了,我觉得这并不是因为我变老了……我是在20多岁中后期才接触科技的,所以我并不是像你们大多数人那样从小就对这些东西感兴趣的“天生极客”。<p>随着产品和服务的质量下降速度加快,我使用的大多数产品和服务都存在许多问题,需要寻找解决方法、黑客手段,或者只是忍受糟糕的用户体验。<p>那时我曾花费数万美元购买最新的科技产品,包括软件和硬件。<p>如今,我只使用从Verizon获得的免费智能手机,通常用2到3年。当我查看旧照片时,真的分不清是iPhone 7拍的还是iPhone 15(我甚至不知道具体型号)。<p>我以950美元买了一台二手的M1 Max,现在仍在使用,我觉得这台机器还能再用3到5年。我还在使用我的高性能游戏/工作站,配备5950x和128GB内存。以前我会花5000美元买一台新Mac。<p>我曾经拥有特斯拉和其他酷车,现在我把它们都卖掉了,只是走路。我买了更好的鞋子。<p>我之前的家里充满了智能家居科技和其他东西,现在我住在一栋完全模拟的老房子里,这感觉很好(而且小得多!)。<p>我现在唯一的订阅是Prime和YouTube。<p>我在人工智能方面尝试过很多,花费超过10亿个代币构建了许多有趣的东西,但说实话,我现在觉得我已经了解了它的局限性和优点。我不再觉得它那么有趣,因为在图像生成(这是我真正想要的,无论迭代次数和花费时间多少)、可靠地整理笔记等方面,它表现得很糟糕。作为代码助手它表现不错,但当它不工作时又显得无聊。<p>那么接下来该怎么办?或者我是否就这样完全选择退出,像我已经开始的那样?
8作者: dakiol1 天前原帖
所以我不介意因为几乎任何其他原因而失去我的工作。糟糕的市场、公司的转型,甚至我自己的愚蠢错误……好吧,这就是生活。但因为我在开源项目中投入的热情而失去工作?拜托,这真的让我很生气。 我像其他人一样,周末做一些副项目只是为了好玩,凌晨两点在Stack Overflow上为陌生人解答问题,做一些没人付我钱的代码库……老实说,这种文化是作为开发者时最好的事情,而现在却成了训练数据。我讨厌OpenAI、谷歌、Anthropic等公司抓取这一切,学习其中的内容,然后把我们的热情作为产品卖回给我们。没错,我明白,这是资本主义,随便吧,但我感觉自己是个最大的傻瓜。我想我只能接受这一切,低下头继续前行。不过,有一件事我最不喜欢:这里的人们美化人工智能和大型语言模型。高层们迟早会正常化因为人工智能而进一步裁员,90%的人都会受到影响。人们,事情并不只是关于技术细节!
7作者: holg4 天前原帖
嗨,HN — 我是作者。iesna.eu 是一个基于浏览器的生态系统,用于处理光度数据:解析标准的灯具文件(LDT/EULUMDAT、IES LM-63、Oxytech、ATLA-S001),根据 EN 13201 / ANSI/IES RP-8 / CJJ 45 / IES-IDA MLO 进行设计计算,以及(我最想展示的部分)在 Bevy 中渲染真实的城市场景,利用光度数据驱动实际的路灯行为,包括天空辉光的贡献。 天空辉光分析演示将一个真实的 LDT 文件加载到 Bevy 场景中(Khronos Bistro 测试资产)。灯具的光强分布直接驱动路灯的渲染——没有任何虚假处理——而天空辉光等级会随着你调整向上照明的百分比实时更新。切换到全切断灯具时,天空的等级会从 F(严重)变回 A(优秀)。你可以在建筑物和天空中看到这种差异。 技术栈:Rust 核心(eulumdat-rs 及相关库,大约 20 个库处理光度格式),Bevy 用于 3D 渲染,WASM 用于浏览器部署。没有后端;一切都在客户端运行。在现有光度库的基础上增加了大约一千行新代码,以实现 Bevy 的集成。 我希望获得反馈的几个方面: - 目前的大气散射模型是单次散射的 Rayleigh+Mie。这对于我的使用案例是否合理,还是应该朝多次散射的方向发展? - Bistro 测试场景在视觉上效果很好,但并不是一个受控环境。 - 有没有人知道一个更典型的公共城市几何资产,适合真实的路灯评估? - CJJ 45 实现(中国国家道路照明标准)是我唯一一个需要从翻译的 PDF 中逆向工程的标准。如果有人有相关的第一手经验,我会很感激能进行一次理智的检查。 在 GitHub 上开源(eulumdat-rs 和相关库)。 Crates.io: eulumdat