我在Java里使用langchain4j,搭建本地的RAG。

配置文件

langchain4j:
  community:
    dashscope:
      chat-model:
        api-key: sk-41be519a5cf24bf9a280a51b8348c3b7
        model-name: deepseek-v3
        #model_name: qwen-max
        #model-name: qwen-max-latest
      embedding-model:
        api-key: sk-41be519a5cf24bf9a280a51b8348c3b7
        model-name: text-embedding-v3

EmbeddingStore初始化的方法

@Bean
    public EmbeddingStore<TextSegment> initEmbeddingStore() {

        return PgVectorEmbeddingStore.builder()
            .table(pgConfig.getTable())
            .dropTableFirst(true)
            .createTable(true)
            .host(pgConfig.getHost())
            .port(pgConfig.getPort())
            .user(pgConfig.getUser())
            .password(pgConfig.getPassword())
            .dimension(1024)
            .database(pgConfig.getDatabase())
            .build();

    }

文件加载的方法

    public String load(@RequestParam(value = "maxSegmentSizeInChars",required = false,defaultValue = "200") int maxSegmentSizeInChars
            , @RequestParam(value = "maxOverlapSizeInChars",required = false ,defaultValue = "0") int maxOverlapSizeInChars) {

        List<Document> documents = FileSystemDocumentLoader.loadDocuments("D:\\work\\lecture-langchain-20250525\\documents");
        // EmbeddingStoreIngestor.ingest(documents,embeddingStore);
        EmbeddingStoreIngestor.builder().embeddingStore(embeddingStore)
                .embeddingModel(embeddingModel)
                .documentSplitter(new DocumentByLineSplitter(maxSegmentSizeInChars, maxOverlapSizeInChars))
                .build().ingest(documents);
        return "数据加载成功";
    }

查看pgvector中的vector字段的属性也是1024,但是提问时,提示ERROR: different vector dimensions 1024 and 384
这个是模型的问题吗。我使用本地ollama中的all-minilm时没有遇见此类问题

展开
收起
游客3hmdfuhkyqlwe 2025-03-31 13:49:13 291 发布于上海 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • 您好,辛苦您加入“阿里云百炼使用体验2群”群的钉钉群号: 77600022533,在钉钉群内反馈您的问题。

    2025-04-10 14:52:29 举报
    赞同 138 评论

    评论

    全部评论 (0)

    登录后可评论

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

还有其他疑问?
咨询AI助理
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等