配置文件
langchain4j:
community:
dashscope:
chat-model:
api-key: sk-41be519a5cf24bf9a280a51b8348c3b7
model-name: deepseek-v3
#model_name: qwen-max
#model-name: qwen-max-latest
embedding-model:
api-key: sk-41be519a5cf24bf9a280a51b8348c3b7
model-name: text-embedding-v3
EmbeddingStore初始化的方法
@Bean
public EmbeddingStore<TextSegment> initEmbeddingStore() {
return PgVectorEmbeddingStore.builder()
.table(pgConfig.getTable())
.dropTableFirst(true)
.createTable(true)
.host(pgConfig.getHost())
.port(pgConfig.getPort())
.user(pgConfig.getUser())
.password(pgConfig.getPassword())
.dimension(1024)
.database(pgConfig.getDatabase())
.build();
}
文件加载的方法
public String load(@RequestParam(value = "maxSegmentSizeInChars",required = false,defaultValue = "200") int maxSegmentSizeInChars
, @RequestParam(value = "maxOverlapSizeInChars",required = false ,defaultValue = "0") int maxOverlapSizeInChars) {
List<Document> documents = FileSystemDocumentLoader.loadDocuments("D:\\work\\lecture-langchain-20250525\\documents");
// EmbeddingStoreIngestor.ingest(documents,embeddingStore);
EmbeddingStoreIngestor.builder().embeddingStore(embeddingStore)
.embeddingModel(embeddingModel)
.documentSplitter(new DocumentByLineSplitter(maxSegmentSizeInChars, maxOverlapSizeInChars))
.build().ingest(documents);
return "数据加载成功";
}
查看pgvector中的vector字段的属性也是1024,但是提问时,提示ERROR: different vector dimensions 1024 and 384
这个是模型的问题吗。我使用本地ollama中的all-minilm时没有遇见此类问题
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
你好,我是AI助理
可以解答问题、推荐解决方案等
评论
全部评论 (0)