返回首页
最新
我是一名硬件工程师,主要阅读电路图,而不是源代码。在管理项目时,我需要理解代码库,但无法理解其语法。因此,我开发了一个工具,可以将任何代码库转换为带有通俗英语解释的互动视觉地图。
只需将其指向一个文件夹,就能得到嵌套的彩色块,显示结构(目录 → 文件 → 类 → 函数)。点击可以深入查看。AI生成的摘要是为人类而写,而不是程序员。架构模式显示依赖关系图,让你可以看到模块之间的连接。
整个工具大约花了30小时构建,使用了多节点的AI工作流程:Claude用于规划和决策,Claude Code用于实现,另外五个模型用于对抗性安全审查(经过6轮共42个修复)。我做出了每一个设计决策;AI编写了每一行代码。
可以选择云端AI(OpenAI/Groq)或本地AI(Ollama)。只需运行`pip install codedocent`并启动设置向导。
采用MIT许可证。希望能收到实际编写代码的人的反馈——在熟悉不熟悉的代码库时,这个工具是否有帮助?
美国司法部发布了约350万页的爱泼斯坦文件,分为12个数据集。其中埋藏着207篇学术论文和14本书籍,这些内容之前并没有受到太多关注。据我了解,这些论文通常并不免费提供,但由于它们是公共文件,现在可以访问了。
我觉得看到这个人阅读的内容很有趣。你可以在jeescholar.com上查看。
处理流程:
1. 下载所有12个司法部数据集和众议院监督委员会发布的文件
2. 进行启发式预筛选(摘要检测、DOI正则表达式、引用块模式、机构字符串)以减少噪音
3. 使用大型语言模型分类器确认并提取元数据
4. 使用CrossRef和Semantic Scholar API进行DOI匹配、引用计数和摘要获取
5. 207篇论文中有87篇获得了DOI匹配;其余论文已被识别但不在主要索引中
技术栈:FastAPI + SQLite(FTS5用于全文搜索) + Cloudflare R2用于PDF存储 + nginx/Docker在Hetzner上部署。
这些领域确实很有趣:有一组关于儿童虐待/诱导研究的论文,还有量子引力、AGI安全、经济物理学和再生医学等领域。每篇论文都链接回其原始政府PDF和Bates编号。
这绝对不是一个详尽的列表。如果有人发现更多内容,我很乐意添加。