modelscope-funasr用了带时间戳的模型,解码出来文本有符号,数字和百分号,怎么能和时间戳对齐呢?
对于带时间戳的模型,解码出来的文本中会包含符号、数字和百分号等特殊字符。为了将这些文本与时间戳对齐,您需要将它们转换为相应的格式。
具体来说,您可以使用Python中的字符串处理函数来提取出文本中的时间戳信息,并将其转换为所需的格式。例如,如果您的时间戳格式为“HH:MM:SS.ss”,则可以使用正则表达式来匹配并提取出这些信息。然后,您可以使用Python中的datetime模块来将这些时间戳转换为日期和时间对象,以便进行进一步的处理和分析。
另外,您还可以考虑使用其他工具或库来帮助您完成这个任务。例如,您可以使用自然语言处理(NLP)工具包来识别和提取文本中的时间信息,并将其转换为所需的格式。或者,您也可以使用专门的数据清洗和转换工具来帮助您完成这个任务。
当前版本过了ITN之后会有时间戳无法对齐的问题,下个版本已支持时间戳平滑,docker近期会更新。此回答整理自钉群“modelscope-funasr社区交流”
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352