文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr热词激励的模型训练阶段的任务会不会导致语音字数预测受到影响？

modelscope-funasr热词激励的模型训练阶段的任务会不会导致语音字数预测受到影响？ def calc_predictor(self, encoder_out, encoder_out_lens):
encoder_out_mask = (
~make_pad_mask(encoder_out_lens, maxlen=encoder_out.size(1))[:, None, :]
).to(encoder_out.device)
predictor_outs = self.predictor(
encoder_out, None, encoder_out_mask, ignore_id=self.ignore_id
)
return predictor_outs[:4]

def _calc_seaco_loss(
    self,
    encoder_out: torch.Tensor,
    encoder_out_lens: torch.Tensor,
    ys_pad: torch.Tensor,
    ys_lengths: torch.Tensor,
    hotword_pad: torch.Tensor,
    hotword_lengths: torch.Tensor,
    seaco_label_pad: torch.Tensor,
):
    # predictor forward
    encoder_out_mask = (
        ~make_pad_mask(encoder_out_lens, maxlen=encoder_out.size(1))[:, None, :]
    ).to(encoder_out.device)
    pre_acoustic_embeds = self.predictor(
        encoder_out, ys_pad, encoder_out_mask, ignore_id=self.ignore_id
    )[0]
    # decoder forward
    decoder_out, _ = self.decoder(
        encoder_out, encoder_out_lens, pre_acoustic_embeds, ys_lengths, return_hidden=True
    )
    selected = self._hotword_representation(hotword_pad, hotword_lengths)
    contextual_info = (
        selected.squeeze(0).repeat(encoder_out.shape[0], 1, 1).to(encoder_out.device)
    )
    num_hot_word = contextual_info.shape[1]
    _contextual_length = (
        torch.Tensor([num_hot_word]).int().repeat(encoder_out.shape[0]).to(encoder_out.device)
    )
    # dha core
    cif_attended, _ = self.seaco_decoder(
        contextual_info, _contextual_length, pre_acoustic_embeds, ys_lengths
    )
    dec_attended, _ = self.seaco_decoder(
        contextual_info, _contextual_length, decoder_out, ys_lengths
    )
    merged = self._merge(cif_attended, dec_attended)
    dha_output = self.hotword_output_layer(
        merged[:, :-1]
    )  # remove the last token in loss

展开

收起

三分钟热度的鱼 2024-07-31 21:37:41 188 版权

0 条回答

写回答

取消提交回答

相关问答

modelscope PAI-DSW环境notebook如何选择conda管理的python？

707

0

0

modelscope-funasr的seaco模型，热词有优先级吗？

318

0

0

modelscope-funasr的热词方案对热词的数量有要求吗，如果有上万个热词，这个方案还行吗？

421

1

0

在modelscope-funasr换了带时间戳的模型但是语音转出来的结果为什么没有时间戳呢？

332

0

0

modelscope-funasr的语音情感识别，如何离线部署？

189

0

0

modelscope-funasr有语音对话分离demo吗？

239

0

0

modelscope-funasr微调的时候。热词如何添加呢？

398

1

0

modelscope-funasr的热词是只在推理阶段做吗？

201

0

0

modelscope 现在已知的json结构化数据，可以用模型推理出其他图片的json结构么？

132

1

0

modelscope 的实时语音通话案例，有类似的方案吗？

154

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

最佳实践丨让苏东坡“复活”！我用Qwen3-8B实现了与千古文豪的跨时空对话

全来店×蚂蚁百宝箱：智能体开启连锁餐饮智慧化服务新时代

贝聿铭的 “数字续作”：蚂蚁百宝箱 × 苏州博物馆，用 AI 重构文化地标

一年输送旅客数千万次，浦东国际机场的效率秘密藏在这个智能体里

宝塔部署AstrBot及Napcat防踩坑教程

热门讨论

热门文章

modelscope-funasr实时ASR的微调该怎么操作？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

modelscope-funasr的paraformer模型从0训练可以用来做音频识别音素模型吗？

在modelscope-funasr同样的文件，文本强制对齐，有时运行成功，有时运行爆显存，为什么？

modelscope-funasr能推理网络地址的音频文件么？

vllm部署模型，参数如何指定

modelscope-funasr的paraformer热词版本配置是不是不支持添加权重？

modelscope-funasr中8k模型与16k的区别有文档介绍或者说明吗？一直没找到在哪里？

modelscope-funasr 热词如何设置？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

展开全部

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

FastExcel：开源的 JAVA 解析 Excel 工具，集成 AI 通过自然语言处理 Excel 文件，完全兼容 EasyExcel

宝塔部署AstrBot及Napcat防踩坑教程

展开全部

还有其他疑问?