返回首页
最新
我们构建了SPECTRA——一个传输真实数字数据的系统,伪装成自然声音和光学现象。<p>没有Wi-Fi,没有GSM,没有互联网。只有隐藏在看似环境噪声中的二进制或三进制编码信号:鸟鸣声、光闪烁、风的调制。<p>与明显的无线电信号不同,SPECTRA使用:<p>声学掩蔽:嵌入自然声音模式中的频移编码。<p>光学掩蔽:通过LED和激光传输的二进制或RGB三进制编码,伪装成正常的光变化。<p>目标:创建一个具有韧性和隐秘性的通信系统,能够在传统网络失效或受到监控时生存下来。<p>灵感来自于原住民部落模仿鸟类发送信息的方式——现在通过嵌入式微控制器和动态适应进行了重新构想。<p>我们结合了光学和声学传输,以增强在不同环境条件下的生存能力。<p>早期原型及更多细节:<a href="https://alexs749266.github.io/SPECTRA-Communication/" rel="nofollow">https://alexs749266.github.io/SPECTRA-Communication/</a><p>欢迎分享任何想法或黑客创意!
最近,我的一位朋友正在进行一个个人项目,我想分享一下。Diffulab的目标是提供一个灵活且模块化的框架,用于从零开始训练扩散模型。该项目仍处于早期阶段,他正在积极添加新功能和改进。
终于在真实硬件上成功运行了我的爱好操作系统。我非常喜欢老款的IBM ThinkPad,所以觉得这是一个完美的机器来实现这个目标。我已经在这个项目上努力了很长时间,这次的成功是一个重要的里程碑!
你好,HN!我想分享一个我开发的开源工具——Gemini 文档处理器。
这个工具使用谷歌的 Gemini AI(他们最新的 API)从 PDF 和 EPUB 文件中生成高质量的泰语摘要。主要功能包括:
- 支持 PDF 和 EPUB 文件
- 智能分块,以便高效处理 Gemini API
- 自动从文档中提取图像
- 与 Obsidian 的直接集成(可直接导出到库中)
- 当发生错误时的智能重试系统(切换模型/增加超时时间)
- 通过网页界面实时跟踪进度
我开发这个工具是因为我需要阅读大量英文文档,并希望能获得详细的泰语摘要。
如果你经常阅读长文档或想从多个来源建立知识库,这个工具可以为你节省大量时间。
输出结果是一个格式良好的 Markdown 文件,包含图像和元数据,非常适合存储在 Obsidian、Notion 或其他个人知识管理系统中。
你可以通过克隆代码库并使用 Python 运行它来试用(需要谷歌 Gemini API 密钥)。
欢迎反馈、建议和贡献!