开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI我现在有一批报文,每条报文有10几个和设备相关的特征,需要将这批报文根据特征分类归一?

问题1:机器学习PAI我现在有一批报文,每条报文有10几个和设备相关的特征,需要将这批报文根据特征分类归一到一个设备上,有模型推荐下么?
问题2:那像这种情况,有点类似指纹识别的那种。我应该用什么模型 我大概看了下,好像不太适用,他更多的是处理文本,而我这边的输入特征基本上都是强特征,没办法做word2evc这种

展开
收起
真的很搞笑 2023-08-08 19:44:20 59 0
2 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    对于问题1,你可以考虑使用聚类算法来将报文根据特征分类归一到一个设备上。聚类算法可以根据数据的相似性将其分组成不同的簇,每个簇代表一个设备。常用的聚类算法包括K-means、层次聚类、DBSCAN等。在使用聚类算法时,你需要将报文的特征作为输入数据,然后根据特征的相似性将其分配到相应的设备簇中。

    对于问题2,如果你的输入特征主要是强特征而不是文本数据,那么确实不适合直接使用基于文本的模型如word2vec。相反,你可以考虑使用其他机器学习算法来处理你的输入特征。以下是一些可能适用的机器学习模型:

    支持向量机(Support Vector Machines, SVM):SVM是一种有监督学习模型,可以用于分类和回归任务。它可以处理具有高维特征空间的数据,并且可以通过核函数来学习非线性关系。

    随机森林(Random Forest):随机森林是一种集成学习算法,由多个决策树组成。它可以应用于分类和回归任务,并且对于处理强特征的数据集通常表现良好。

    XGBoost或LightGBM:这些是梯度提升树算法的变种,也是常用的机器学习模型。它们在处理强特征的数据集时表现出色,能够处理高维数据和非线性关系。

    K近邻算法(K-nearest neighbors, KNN):KNN是一种基于实例的学习方法,可以用于分类和回归。它根据输入样本的最近邻来进行分类,对于特征之间的相似性较为敏感。

    2023-08-13 21:17:56
    赞同 展开评论 打赏
  • 回答1:分类模型,目标一般可数
    回答2:dssm不一定是文本,这边也用dssm做召回,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2023-08-09 11:56:23
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    阿里巴巴机器学习平台AI 立即下载
    基于Spark的面向十亿级别特征的 大规模机器学习 立即下载
    基于Spark的大规模机器学习在微博的应用 立即下载