返回首页
最新
嗨,HN,我是一名来自尼泊尔的本科生。
在过去的35年里,计算化学和人工智能药物发现一直依赖SMILES来表示分子。这在1980年代是很好的,但在今天却成为了一个巨大的瓶颈。它是非规范的,立体化学解析脆弱,并且在尝试表示有机金属化合物、合金或聚合物时完全失效。要可靠地解析它,基本上需要一个300MB的C++依赖库(RDKit),依赖于几十年的硬编码启发式算法。
我感到沮丧,并意识到表示物质并不是一个图论问题——而是一个语言学问题。
为了解决这个问题,我构建了SCRIPT(结构化化学文本表示)。我将核心解析器基于帕尼尼的梵语语法的生成语言学。SCRIPT并不是将分子视为一串无意义的节点,而是将其视为一个由根、状态(Vibhakti)和关系(Sandhi)组成的语言。
我今天为π日发布了V3版本。
它的工作原理及修复内容:
• 无混乱的芳香性:SMILES使用小写字母(c1ccccc1),这导致了无尽的解析歧义。SCRIPT在环闭合上使用Anubandha(治理标记)。C1CCCCC&6:明确告诉解析器,DFS路径中的最后6个原子是共振的。
• Vāk顺序立体化学:在SCRIPT中,手性通过深度优先搜索序列顺序作为本地坐标框架内在地得到解决,使其在数学上具有顺序不变性。
• 有机金属化合物与材料:由于语法设计,SCRIPT原生支持触觉键(*5)、分数合金(Ti<~0.9>N<~0.1>)、晶相([[Rutile]] Ti(O)2)和随机聚合物({[CC]}n)。
• 独立于RDKit:核心引擎使用纯Python的Lark语法。它在解析过程中捕捉六价碳,生成100%原生的双向转换,并在不依赖RDKit的C++后端的情况下实现95.9%的RDKit InChI一致性。
示例:
阿司匹林(SMILES):CC(=O)Oc1ccccc1C(=O)O(或许多其他有效字符串)
阿司匹林(SCRIPT):CC(=O)OC1=CC=CC=C1C(=O)O(确定性规范化)
顺铂:Pt<sqp>(Cl)2(NH3)2@(保持平面正方形几何形状和顺式构型)
我只是一个在代码中像小孩一样嬉戏的愚蠢本科生(我的湿实验滴定一团糟,没错,我用嘴巴来吸取液体)。我非常希望能收到你们最严厉的技术反馈,特别是来自解析器爱好者、化学信息学家或任何从事人工智能药物发现的人。很乐意回答关于语法或解析器架构的任何问题!
和2025年其他人一样,我曾以为“只需在其上加一个向量数据库”就能创建一个连贯的长期智能体,但我看到我的Python助手慢慢变成了一个健忘的金鱼,甚至还有囤积癖。
经典的失败模式:
用户(第1天):“我最喜欢的编辑器是VSCode”
用户(第47天):“其实我换成了Cursor”
智能体(第92天):“你喜欢VSCode,对吧?”
或者,记忆索引慢慢变成这样:
用户偏好Python
用户真的非常偏好Python
Python基本上就是用户的个性
所有这些权重相同,永远如此。
向量搜索在相似性方面表现出色,但在当前真相方面却很糟糕。
人类的记忆会淡化旧观点并覆盖错误看法。
而我的智能体?是我所说过的一切的永久档案。
因此,我构建了MemX作为一个小实验:如果智能体的记忆实际上有生命周期,会发生什么?
诸如:
重要性信号
频率强化
重复压缩
显式更新/替代
过时事实的温和衰减
技术栈故意简单:
SQLite
FAISS
一些伪装成“记忆操作系统”的评分逻辑
小示例:
```python
from memx import MemX
m = MemX()
m.add("用户的最爱编辑器:VSCode")
m.add("用户切换到Cursor")
m.compress()
m.rag("我应该使用什么编辑器?")
```
快速基准测试(50个噪声 + 5个真实记忆):
向量RAG召回@3: ~0.75
MemX召回@3: ~1.0
更长的模拟:
10,000次交互 → ~9,000个记忆
在我的笔记本上的延迟:
10,000个记忆 → ~0.3毫秒
100,000 → ~3毫秒
1,000,000 → ~30毫秒
这并不是想要取代向量搜索或成为下一个智能体框架。它只是一个实验,看看如果记忆有生命周期而不是永久文档档案,智能体的表现是否会更好。
我很好奇其他人在长期运行的智能体中如何处理矛盾或不断发展的记忆。
代码库:
https://github.com/mohitkumarrajbadi/memx
(是的,关于辣椒的事情是真的。智能体仍然对此争论不休。)
Fortress是一种专为开源情报(OSINT)、侦察、报告和网络而设计的领域特定语言(DSL)。该语言使用Go语言编写,易于使用。您可以创建自己的库,并尝试更多酷炫的功能。
<p>为什么选择Fortress?</p>
<p>简单、快速和强大</p>
<p>= Fortress</p>
<p>您可以在这里了解更多信息 --></p>
<p><a href="https://github.com/CzaxStudio/Fortress" rel="nofollow">https://github.com/CzaxStudio/Fortress</a></p>
<p>或者访问官方网站 --></p>
<p><a href="https://fortresslang.pages.dev/" rel="nofollow">https://fortresslang.pages.dev/</a></p>
<p># 尝试一次,您会在几分钟内爱上它。</p>
展示HN:PDR AI – 面向非技术混乱的开源创业加速器引擎(市场营销、产品需求文档、入职培训)
几周前,我分享了PDR AI作为一个开源工具,用于解决创业文档混乱的问题。自那时起,我更加坚定了核心愿景:这不仅仅是另一个RAG聊天工具——它是一个由人工智能驱动的加速器引擎,帮助技术创始人跳过非技术性的陷阱,更快地前进。
作为一名独立的技术创始人,我在零散的市场营销计划、不完整的产品需求文档、入职文档和法律模板上浪费了太多时间。PDR AI将所有内容集中在一个可自托管的知识库中,并通过以下方式积极加速进展:
- 文档有效性检查器(验证文档内容的有效性和一致性,提取关键信息)
- 市场营销管道:针对Reddit/X/LinkedIn/Bluesky的内容创意/趋势,提供可选的网络增强分析。
- 团队加速层:基于角色的访问权限、邀请、审批、审计记录——非常适合小团队或加速器小组审核文档。
- 实时仪表板:跟踪使用情况、准确性(样本约99%)、合规差距和生产力。
- RAG基础功能做得很好:上传PDF/Notion/Slack/GitHub导出,支持OCR,pgvector语义搜索,页面级引用,快速响应。
完全开源(MIT许可证),通过Docker/Vercel自托管,支持自带LLM密钥(目前支持OpenAI/LangChain,Ollama/本地版本即将推出)。没有锁定,完全隐私。
网站: [https://pdrai.online](https://pdrai.online)
代码库: [https://github.com/Deodat-Lawson/LaunchStack](https://github.com/Deodat-Lawson/LaunchStack)
(原名PDR_AI_v2;已有788+颗星,持续增长)
寻找:
- 独立创始人/小团队使用它来“加速”他们的非技术部分
- 加速器项目/导师测试其用于小组文档审核
- 反馈:加速器框架是否有效?哪些市场营销/产品工作流程最痛苦?
- 贡献者:欢迎提交PR/问题,特别是代理改进或集成。
我创建Kromacut是因为我不想为HueForge付费,没想到它最终变成了一个超出我最初预期的项目。
上传一张图片,Kromacut会将其转换为多色的光雕3D打印。你首先在2D部分对图像进行预处理,然后切换到3D部分,在这里你可以使用手动模式手动排列层,或者使用更有趣的自动上色模式。在自动上色模式中,你需要定义你的耗材(颜色 + 半透明度),它会模拟光线通过堆叠层的过程,使用比尔-朗伯光学计算最佳的层叠结构。对于订购,它会根据你拥有的耗材数量或选择的选项使用模拟退火或遗传算法。
一切都在浏览器中运行,作为一个静态网站,无需注册且没有后端。也可以通过Tauri作为本地桌面应用程序使用。支持导出为STL和3MF格式,并提供打印说明,告诉你何时更换耗材。
我过去还发布过其他帖子,包括在r/3Dprinting上的初始Reddit帖子,反响很好,激励我继续这个项目。如果你想查看应用早期版本的一些截图或讨论,可以在这里找到:<a href="https://www.reddit.com/r/3Dprinting/comments/1noq9ku/i_made_a_free_and_open_source_hueforge/" rel="nofollow">https://www.reddit.com/r/3Dprinting/comments/1noq9ku/i_made_...</a>
因为社区对它的喜爱,我不断收到反馈、想法或关于这个项目的消息,所以我会在空闲时间继续致力于这个项目,并永远保持它免费和开源。
试试吧:<a href="https://kromacut.com" rel="nofollow">https://kromacut.com</a>
来源:<a href="https://github.com/vycdev/Kromacut" rel="nofollow">https://github.com/vycdev/Kromacut</a>
很高兴回答问题或听取反馈。谢谢!