1作者: matt-cicero7 个月前原帖
如果你对人工智能代理感兴趣,可能会发现理解用户的表达是一项挑战。你基本上只能选择向像ChatGPT这样的语言模型发送请求,获取JSON对象,或者使用像NLTK、SpaCy、Rasa等复杂且庞大的Python实现。 最新版本的开源Sophia自然语言理解(NLU)引擎刚刚发布,详细信息包括在线演示,请访问: https://cicero.sh/sophia/ 该引擎使用Rust开发,最大的特点是其自给自足且轻量化的特性。没有外部依赖或API调用,处理速度约为每秒20,000个单词,提供两种不同的词汇数据存储——基础版本为79MB,包含145,000个单词,而完整词汇版本为177MB,包含914,000个单词。与那些需要多吉字节安装的Python系统相比,这是一项巨大的提升,后者的处理速度最多也只能达到每秒300个单词。 Sophia引擎内置了词性标注器、命名实体识别、短语解释器、指代消解、拼写错误自动更正、多层次分类系统,允许你轻松将词汇集映射到动作等。它还配备了一个友好的本地RPC服务器,方便你通过任何编程语言运行,具体实现页面提供了代码示例。 不幸的是,由于数据中名词偏重,词性标注器仍然存在一些小问题。该引擎在229百万个标记上进行训练,使用了4个词性标注器中的3个共识得分,但基于PyTorch的标注器表现不佳。不过,这些问题在一周内都可以轻松修复,感兴趣的话可以查看这里的问题和解决方案: https://cicero.sh/forums/thread/sophia-nlu-engine-v1-0-released-000005#p6 目前正在开发高级上下文感知升级,预计几周内发布,这将是一次巨大的提升,使其能够区分例如“访问google.com”、“访问马克的想法”、“访问商店”、“拜访我的父母”等指令。同时,还将推出更先进的混合短语解释器,以及将分类系统转换为向量评分,以便更好地聚类和细化词汇。 NLU引擎本身是免费的开源软件,Github和crates.io的链接可以在网站上找到。然而,不得不采用典型的双重许可模式,并提供高级许可证,因为生活总是喜欢和我开玩笑。目前资金紧张,不想多谈。如果感兴趣,可以听听这段6分钟的音频介绍: https://youtu.be/bkpuo1EtElw 我需要一些进展,因为目前只有RTX 3050用于计算,无法修复词性标注器。给你一个优惠。目前的高级价格约为未来上下文感知升级发布后价格的三分之一。 现在就获取副本,立即访问带有SDK的二进制应用程序,新的词汇数据存储将在一周内发布,修复后的词性标注器将开源,几周后将推出上下文感知升级,这将是一次巨大的改进,届时价格将上涨三倍。此外,我保证会尽一切努力确保Sophia成为全球领先的NLU引擎。 如果你对部署任何类型的人工智能代理感兴趣,这将是你工具箱中的一款优秀工具。与其向ChatGPT请求JSON对象并得到不可预测的结果,不如使用这个自给自足的小工具,它驻留在你的服务器上,速度极快,每次都能产生相同可靠且可预测的结果,所有数据都保留在本地并对你保密,没有每月的API费用。这是一个不错的交易。 此外,这也是为了一个优秀的事业。你可以在“起源与最终目标”帖子中阅读Cicero项目的完整宣言: https://cicero.sh/forums/thread/cicero-origins-and-end-goals-000004 如果你能看到这里,感谢你的倾听。如有需要,请随时通过matt@cicero.sh直接联系我,我很乐意与你交流,必要时可以通话等。 有关Sophia的完整信息,包括开源下载,请访问:https://cicero.sh/sophia/
4作者: Dheerajiitr7 个月前原帖
大家好, 市面上有很多人工智能代理构建工具。但说实话,对于大多数人来说,它们仍然难以使用。每天,我都看到有人在使用这些代理创建工作流程时遇到困难,并在Upwork上发布他们的需求。 因此,我们开发了Nutix。只需上传您的屏幕录制,便可以完成。 Nutix会观察您的操作,理解您的工作流程,并立即用人工智能代理构建它。您需要授权访问底层应用程序,以便代理能够运行。 访问超过2500个应用程序,并在此基础上构建您的自动化流程。 无需提示,无需编码。只需展示一次,您就完成了。