向量检索服务体验-阿里云开发者社区

向量检索服务体验

2024-01-17 265

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 根据阿里云发布的阿里云自研的向量引擎 Proxima 内核，进行综合体验。

（1）服务开通：非常方便，按操作步骤，在控制台安装步骤开通即可：1-创建API-KEY；2-创建试用Cluster；3-Collection；
（2）服务使用：目前向量检索服务还不支持页面操作，比如向量插入，向量检索，向量删除，均通过API方式进行调用。
（3）使用Python SDK进行向量的Collection创建和插入时，需要有3个前置条件：1-已创建Cluster；2-已获得API-KEY；3-已安装最新版DashVector SDK；在此处需要额外注意，操作文档中没有说明，目前的DashVector SDK仅支持MAC OS和Liunx环境下的安装，暂不支持Windows环境下的安装，建议在文档中补全。在Windows环境下的安装DashVector SDK会出现grpcio包的编译（构建轮子）阶段失败。在grpcio的github上issue中也有该类似的错误，目前还未解决。大概原因是部分代码在Windows环境下编译器存在一定问题。
（4）在使用向量检索服务常规情况下还需要有Text2Vector模型前置，负责文本到向量的转换，另外还需要对文本块的分割、转换等功能，目前从案例中查看，是计划通过DashScope灵积模型服务实现，后续还需要进一步学习DashScope灵积模型的相关功能。
（5）在github上text2vec模型中，向量转换默认是726维的稠密向量数据，这种转换其中1个结果就是会导致转换后的数据量（内存占用），比较大，如果在现有向量检索服务增加不同维度的向量数据转换比预估，会更好一点。
总之，阿里云的向量检索服务还有很大提升空间，加油ヾ(◍°∇°◍)ﾉﾞ，希望未来阿里云能打造出优秀的向量检索服务，引领技术潮流！

向量检索服务体验

千问大模型

热门文章

最新文章

相关电子书