小天管理 发表于 周日 11:57 Share 发表于 周日 11:57 原理很简单,用 CLIP 模型计算图片的 embedding ,然后和搜索语句的 embedding 进行比较。因为用的是 MLX 来推理模型,所以只有 M 芯片的 mac 能用 GPU 加速,其他平台会很慢。代码全部由 Node.js 实现,embedding 计算用的是自己写的 node-mlx ,没有用第三方的推理引擎和数据库。本来是处于学习目的写的程序,但实用性非常强,过来分享一下。https://github.com/frost-beta/sisi 引用 意见的链接 分享到其他网站 More sharing options...
已推荐帖子
加入讨论
您现在可以发表并稍后注册. 如果您是会员,请现在登录来参与讨论.