我这个域名闲置了很长时间,最终决定将其打造成为一个简约的“一站式商店”,为同样学习这门语言的人提供服务。这里的所有内容都是免费提供给公众的,都是源于我自身的需求和愿望而产生的。
返回首页
最新
如果你在使用Cursor或其他编辑器的MCP服务器,日常使用中有什么<i>实际</i>有用的东西吗?有没有什么意想不到或令人惊讶的情况?
大家好!我们是来自 Exa 的 Will 和 Jeff(<a href="https://exa.ai">https://exa.ai</a>)。我们最近推出了 Exa Websets,这是一款基于嵌入技术的搜索引擎,旨在准确返回您所询问的内容。您可以获得针对复杂查询的精确结果,例如“所有在旧金山的开源开发工具初创公司,成立于 2021-2025 年”。
演示视频请见这里 - <a href="https://youtu.be/Unt8hJmCxd4" rel="nofollow">https://youtu.be/Unt8hJmCxd4</a>
我们开始开发 Exa 是因为我们感到沮丧,尽管大型语言模型(LLM)的技术每周都在进步,但谷歌的搜索体验却逐渐变差。互联网曾经像一个神奇的信息门户,但如今在不断被推向 SEO 优化的点击诱饵时,这种感觉已经不复存在。
Websets 是朝着相反方向迈出的一步。对于每一次搜索,我们会在 Exa 的网络向量数据库上执行数十次嵌入搜索,以找到合适的搜索候选项,然后对每个结果运行代理工作流,以验证它们是否完全符合您的要求。
Websets 的结果之所以优秀,有两个原因。首先,我们为我们的主要搜索算法训练了定制的嵌入模型,而不是典型的关键词匹配搜索算法。我们的嵌入模型专门训练以返回您所请求的确切类型的实体。实际上,这意味着如果您搜索“从事纳米技术的初创公司”,基于关键词的搜索引擎会返回关于纳米技术初创公司的列表,因为这些列表与查询中的关键词匹配。相比之下,我们的嵌入模型返回的是实际的初创公司主页,因为这些主页与查询的含义相匹配。
第二个原因是 LLM 提供了验证每个结果所需的最后一公里智能。每个结果和数据片段都有支持性参考,帮助我们验证该结果是否确实符合您的搜索标准。这就是为什么 Websets 的运行时间可能需要几分钟甚至几小时,具体取决于您的查询和请求的结果数量。对于有价值的搜索查询,我们认为这是值得的。
值得注意的是,Websets 是表格,而不是列表。您可以添加“丰富”列,以获取有关每个结果的更多信息,例如“员工人数”或“作者是否有博客?”,并且单元格会异步加载。希望这种表格格式能让网络感觉更像一个数据库。
以下是一些可以使用 Websets 进行的搜索示例:
“由非美国教师创建的数学博客” - <a href="https://websets.exa.ai/cma1oz9xf007sis0ipzxgbamn">https://websets.exa.ai/cma1oz9xf007sis0ipzxgbamn</a>
“关于如何避免变换器中 O(n^2) 注意力问题的研究论文,其中第一作者的名字以“A”、“B”、“S”或“T”开头,并且是在 2018 年至 2022 年之间写的”: <a href="https://websets.exa.ai/cm7dpml8c001ylnymum4sp11h">https://websets.exa.ai/cm7dpml8c001ylnymum4sp11h</a>
“总部位于美国的医疗保健公司,员工超过 100 人且有技术创始人”: <a href="https://websets.exa.ai/cm6lc0dlk004ilecmzej76qx2">https://websets.exa.ai/cm6lc0dlk004ilecmzej76qx2</a>
“所有在湾区的程序员,具有初创公司经验,懂 Rust 并且之前发布过技术内容”: <a href="https://youtu.be/knjrlm1aibQ" rel="nofollow">https://youtu.be/knjrlm1aibQ</a>
您可以在 <a href="https://websets.exa.ai/">https://websets.exa.ai/</a> 尝试使用,API 文档在 <a href="https://docs.exa.ai/websets">https://docs.exa.ai/websets</a>。我们期待您的反馈!
嗨,HN,
我一直在开发Masari Cabal,这是一个专为希望围绕股票、加密货币、外汇和商品等市场进行深入讨论的交易者和投资者设计的社交平台。
主要功能包括:
• 用于分享市场见解的私密频道
• 一个系统,允许贡献者通过私密帖子或群组会员资格选择性地将内容货币化
• 旨在为严肃的市场参与者提供清晰、无干扰的设计
我的动机源于对主流平台(如Twitter和Discord)上讨论内容分散和嘈杂的失望。我的目标是提供一个让深思熟虑的见解和高质量讨论蓬勃发展的空间——减少噪音,增加结构。
目前,我专注于稳定第一个版本(私密频道 + 高级内容系统)。基于社区需求,计划在后期引入比特币支付和人工智能驱动的工具。
我很想听听任何对交易、投资或构建社交平台感兴趣的人的反馈、想法或建议。欢迎随时提问!
在2017年,我宣布推出我的YC公司——“7000万就业”,这是第一个为1亿名有犯罪记录的美国人提供的就业平台。在18个月内,我们实现了盈利,并帮助数千人找到工作。然而,COVID疫情爆发后,公司裁员,我们的员工失去了工作,招聘也停止了。我们不得不关闭。
除了就业,受司法系统影响的人们还谈到了他们对社区的需求。他们渴望同伴的支持,而不是在羞耻和孤独绝望中服刑终老。他们需要一个可以找到友谊、倾诉和获得灵感的地方。还有爱,还有乐趣。一个属于他们自己的Facebook,一个真正欢迎他们的俱乐部。
我相信新兴技术与社会对这一群体态度的积极变化交汇在一起,使得这个时机变得恰到好处。它正在迎来自己的“时刻”。
我认为这也代表着一个重要的商业机会。他们消费大量的汉堡和运动鞋,但无论是麦当劳还是耐克都从未直接向他们营销。他们可以轻松选出任何一位总统,但没有政治家在争取他们的选票。
但如果团结在一起,他们可以展现出集体的经济实力和政治影响力。
我的目标是将“ Commissary Club”置于这一重大变革的中心。
我们将帮助人们找到工作和住房,整个过程中我们会全程协助。我们的会员将找到导师、律师,参加课程,获得建议,约会并交朋友。一起享受乐趣。为前科犯打造的Facebook。
我在这个领域已经待了15年,并且我也曾经历过监禁。我们一直需要这样的平台。
大家好,我叫Kevin Lin,这是我关于乐谱智能眼镜项目的Show HN。我在周五发布的视频登上了首页:<a href="https://news.ycombinator.com/item?id=43876243">https://news.ycombinator.com/item?id=43876243</a>,但Dang建议我们也做一个Show HN,所以我来了!
我一直想把乐谱放进智能眼镜里很久了,直到二月中旬,Mentra(YC W25)在推特上发布了他们举办的智能眼镜黑客马拉松的消息——获胜者可以带走一副眼镜。我参加了活动,和我的队友一起制作了许多与音乐相关的应用,结果我们获胜了,所以我带着眼镜回家,进一步完善了项目,并制作了一段很酷的视频(<a href="https://www.youtube.com/watch?v=j36u2i7PKKE" rel="nofollow">https://www.youtube.com/watch?v=j36u2i7PKKE</a>)。
这副眼镜是Even Realities G1s。它们看起来很普通,但配备了两个麦克风,每个镜片都有一个屏幕,甚至可以根据处方定制。我遇到的每一个试戴过的人都对显示效果感到惊讶,而视频录制的效果却无法完全展现它们的优点。
软件运行在AugmentOS上,这是Mentra的智能眼镜操作系统,适用于多种第三方智能眼镜,包括G1s。制作应用程序时,我只需使用AugmentOS SDK编写并运行一个TypeScript文件。这为你提供语音转录和原始音频作为输入,文本或位图作为输出到屏幕,其他一切都被完全抽象化。你的眼镜与AugmentOS应用程序通信,然后该应用程序与你的TypeScript服务通信。
唯一困难的部分是创建一个Python脚本,将乐谱(MusicXML格式)转换为小型优化的位图以在屏幕上显示。首先,现有的音乐相关Python库文档相当薄弱,我遇到了多个前所未见的错误信息。缩小到眼镜屏幕的小尺寸也意味着音符的杆和五线谱线会消失,因此我想使用形态学膨胀来强调这些元素,而不使音符变得难以辨认。最终的处理流程是:MusicXML -> music21库渲染小节为png -> 使用opencv膨胀 -> 缩小 -> 使用Pillow转换为位图 -> 使用imagemagick优化位图。这远不是我写过的最好代码,但LLMs在这个任务上的尝试非常糟糕,我多年的Python经验在这里得到了充分展现。代码在GitHub上:<a href="https://github.com/kevinlinxc/AugmentedChords">https://github.com/kevinlinxc/AugmentedChords</a>。
将其整合起来,我的TypeScript服务在请求时本地提供这些位图。我搭建了一个用户界面,可以通过语音命令导航菜单和乐谱(例如:显示目录、下一页、选择、开始、退出、暂停),然后我将脚踏板连接到我的笔记本电脑。由于位图发送延迟(目前约为3秒,但未来的眼镜会更好),在演奏时使用脚踏板翻页并不可行,因此我让一个踏板切换自动滚动,另外两个踏板则加速/暂时暂停滚动。
经过多次调整,我终于能够仅用眼镜演奏完整的歌曲!这花了很多次尝试,确实还有很多改进的空间。例如:- 位图发送速度较慢,这就是为什么使用脚踏板翻页不可行的原因;- 分辨率较小,我希望能一次显示更多的小节,以便减少翻页频率;- 由于脚踏板不便携,能够有一种模式让音频决定乐谱的变化会很酷。我尝试用FFT实现这一点,但经常出错,需要更多的努力。头部倾斜控制也很酷,因为完全手动控制是练习的硬性要求。
所有这些痛点都在Mentra和其他竞争公司中得到解决,因此我非常期待下一代产品的到来!如果你有任何问题,请随时问我!
嗨,HN!我们是 Vaibhav 和 Marcello。我们正在构建 Plexe(<a href="https://github.com/plexe-ai/plexe">https://github.com/plexe-ai/plexe</a>),这是一个开源代理,可以将自然语言任务描述转换为训练好的机器学习模型。这里有一个视频演示:<a href="https://www.youtube.com/watch?v=bUwCSglhcXY" rel="nofollow">https://www.youtube.com/watch?v=bUwCSglhcXY</a>。
机器学习模型有很多种用途,但由于制作过程复杂且混乱,许多潜在应用从未实现。你可能花费数月时间寻找数据、清理数据、实验模型并部署到生产环境,结果发现项目因为耗时过长而被搁置。虽然有许多“自动化”机器学习的工具,但实际上仍然需要机器学习专家团队来将有价值的东西投入生产。而且,我们不能对每个机器学习问题都使用大型语言模型。如果基于你的数据训练的逻辑回归模型能更好地完成任务,为什么还要使用通用的100亿参数语言模型呢?
我们的灵感来源于,我们可以利用大型语言模型生成特定任务的机器学习模型,并在个人数据上进行训练。得益于大型语言模型的推理能力,现在可以创建一个代理系统,自动化大部分机器学习生命周期。
几个月前,我们开始开发一个Python库,允许你使用预期行为的描述在结构化数据上定义机器学习模型。我们最初的实现将潜在解决方案组织成一个图,利用大型语言模型编写计划,将其实现为代码,并运行生成的训练脚本。通过简单的搜索算法,系统遍历解决方案空间,以识别和打包最佳模型。
然而,我们遇到了几个限制,因为算法在边缘情况下表现脆弱,我们不得不为训练过程中的每一个小问题打补丁。于是我们决定重新思考这个方法,抛弃一切,使用一种优先考虑通用性和灵活性的代理方法重建工具。最初的单一机器学习工程代理变成了一个代理机器学习“团队”,所有实验都通过MLFlow进行跟踪和记录。
我们当前的实现使用smolagents库来定义代理层次结构。我们将之前实现的功能映射到一组专门的代理,例如提出解决方案计划的“机器学习科学家”等。每个代理都有专门的工具、指令和提示模板。为了促进跨代理的通信,我们实现了一个共享内存,使得对象(数据集、代码片段等)可以通过引用注册表中的键间接传递给其他代理。你可以在这里找到详细的工作原理介绍:<a href="https://github.com/plexe-ai/plexe/blob/main/docs/architecture/multi-agent-system.md">https://github.com/plexe-ai/plexe/blob/main/docs/architecture/multi-agent-system.md</a>。
Plexe的早期版本专注于结构化数据上的预测问题,可以用于构建模型,例如预测高强度运动中的运动员受伤风险、电子商务市场的产品推荐,或预测算法交易的技术指标。这里有一些示例供你参考:<a href="https://github.com/plexe-ai/plexe/tree/main/examples">https://github.com/plexe-ai/plexe/tree/main/examples</a>。
要在你的数据上运行它,你可以导入任何CSV、parquet等格式的文件,Plexe会从你的数据集中提取所需的内容,以确定应该使用哪些特征。在开源工具中,目前只支持添加文件,但在我们的平台版本中,我们将支持与Postgres集成,从中根据SQL查询提取所有可用数据,并将其导入parquet文件,以供代理构建模型。
接下来,我们将着手处理更多的机器学习项目生命周期:我们目前正在开发一个“特征工程代理”,专注于数据准备过程中通常需要的复杂数据转换。如果你感兴趣,可以了解一下Plexe,并告诉我们你的想法!