modelscope-返回的spk值是numpy.int64格式，帮忙看看？

modelscope-funasr在带spk的模型中，返回的spk值是numpy.int64格式，这个格式无法JSON serializable，对后续处理流程有点小影响。同样在这个字段下的start和end是int？

展开

收起

真的很搞笑 2024-02-08 11:52:19 133 版权

阿里云 AI 助理回答

在使用 modelscope-funasr 的带 SPK（说话人）功能的模型时，返回结果中的 spk 值为 numpy.int64 格式，这确实会导致 JSON 序列化失败的问题，因为 numpy.int64 并不是 Python 内置的可序列化类型。此外，您提到的 start 和 end 字段是 int 类型，这通常是标准的整数格式，不会引发序列化问题。

以下是针对该问题的详细分析和解决方案：

1. 问题分析

spk 值为 numpy.int64 的原因
在语音处理任务中，modelscope-funasr 使用了 NumPy 库进行数据处理，因此某些字段（如 spk）可能直接以 NumPy 数据类型返回。然而，JSON 序列化仅支持 Python 内置的数据类型（如 int, float, str, list, dict 等），无法直接处理 numpy.int64 类型。
start 和 end 字段为 int 的确认
根据您的描述以及常见的语音处理模型输出格式，start 和 end 字段通常表示时间戳或帧索引，这些字段一般以 Python 内置的 int 类型返回，因此可以直接被 JSON 序列化。

2. 解决方案

为了确保返回结果能够顺利进行 JSON 序列化，可以对 spk 字段进行类型转换。以下是具体的解决方法：

方法一：手动转换 `numpy.int64` 为 Python 内置类型

在获取模型输出后，可以通过以下代码将 spk 转换为 Python 的 int 类型：

import numpy as np
import json

# 示例模型输出
output = {
    "spk": np.int64(1),  # 模拟返回的 numpy.int64 类型
    "start": 0,          # int 类型
    "end": 10            # int 类型
}

# 将 spk 转换为 Python 内置 int 类型
output["spk"] = int(output["spk"])

# 验证 JSON 序列化
json_output = json.dumps(output)
print(json_output)  # 输出: {"spk": 1, "start": 0, "end": 10}

方法二：自定义 JSON 编码器

如果需要处理更复杂的场景（例如多个字段包含 NumPy 数据类型），可以定义一个自定义的 JSON 编码器：

import numpy as np
import json

class NumpyEncoder(json.JSONEncoder):
    def default(self, obj):
        if isinstance(obj, np.integer):  # 处理 numpy.int64 等整数类型
            return int(obj)
        elif isinstance(obj, np.floating):  # 处理 numpy.float64 等浮点类型
            return float(obj)
        elif isinstance(obj, np.ndarray):  # 处理 numpy 数组
            return obj.tolist()
        return super(NumpyEncoder, self).default(obj)

# 示例模型输出
output = {
    "spk": np.int64(1),
    "start": 0,
    "end": 10
}

# 使用自定义编码器进行 JSON 序列化
json_output = json.dumps(output, cls=NumpyEncoder)
print(json_output)  # 输出: {"spk": 1, "start": 0, "end": 10}