文档备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

机器学习PAI我现在有一批报文，每条报文有10几个和设备相关的特征，需要将这批报文根据特征分类归一？

问题1：机器学习PAI我现在有一批报文，每条报文有10几个和设备相关的特征，需要将这批报文根据特征分类归一到一个设备上，有模型推荐下么？
问题2：那像这种情况，有点类似指纹识别的那种。我应该用什么模型我大概看了下，好像不太适用，他更多的是处理文本，而我这边的输入特征基本上都是强特征，没办法做word2evc这种

展开

收起

真的很搞笑 2023-08-08 19:44:20 241 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

对于问题1，你可以考虑使用聚类算法来将报文根据特征分类归一到一个设备上。聚类算法可以根据数据的相似性将其分组成不同的簇，每个簇代表一个设备。常用的聚类算法包括K-means、层次聚类、DBSCAN等。在使用聚类算法时，你需要将报文的特征作为输入数据，然后根据特征的相似性将其分配到相应的设备簇中。

对于问题2，如果你的输入特征主要是强特征而不是文本数据，那么确实不适合直接使用基于文本的模型如word2vec。相反，你可以考虑使用其他机器学习算法来处理你的输入特征。以下是一些可能适用的机器学习模型：

支持向量机（Support Vector Machines, SVM）：SVM是一种有监督学习模型，可以用于分类和回归任务。它可以处理具有高维特征空间的数据，并且可以通过核函数来学习非线性关系。

随机森林（Random Forest）：随机森林是一种集成学习算法，由多个决策树组成。它可以应用于分类和回归任务，并且对于处理强特征的数据集通常表现良好。

XGBoost或LightGBM：这些是梯度提升树算法的变种，也是常用的机器学习模型。它们在处理强特征的数据集时表现出色，能够处理高维数据和非线性关系。

K近邻算法（K-nearest neighbors, KNN）：KNN是一种基于实例的学习方法，可以用于分类和回归。它根据输入样本的最近邻来进行分类，对于特征之间的相似性较为敏感。

2023-08-13 21:17:56

赞同展开评论
芯在这

回答1：分类模型，目标一般可数
回答2：dssm不一定是文本，这边也用dssm做召回，此回答整理自钉群“【EasyRec】推荐算法交流群”

2023-08-09 11:56:23

赞同展开评论

问答分类：

机器学习/深度学习生物认证人工智能平台 PAI

问答标签：

人工智能平台 PAI分类人工智能平台 PAI特征人工智能平台 PAI设备机器学习人工智能平台 PAI 人工智能平台 PAI pai

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

人工智能平台PAI

机器学习PAI这种lookup特征错误，这种有问题吗？

225

1

0

机器学习PAI特征生产的几个函数,详细接口定义在哪里可以看到？

184

1

0

机器学习PAI跑feature_selection，为什么只有'user' group的特征drop

220

1

0

机器学习PAI中lookup特征也还得存成字符串？

225

1

0

机器学习PAI模型特征的配置，这个信息是怎么传给线上的呢？

232

1

0

机器学习PAI的特征实体特征视图等里面的参数，提交后不支持修改吗？

237

2

0

机器学习PAI如果只是设置取什么特征，是不是只需要特征视图就可以，为啥要有个特征entity的概念？

231

1

0

机器学习PAI的Alink加载onnx模型和engine那个效率高呢

608

3

0

机器学习PAI分布式训练有最佳实践吗，如同步/异步模式，optimizer怎么选择等？

353

3

0

机器学习PAI可以检查图片是否被p过的么?

217

0

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关文章

规则引擎+NLU混合架构 vs 纯大模型方案：单次对话成本差42%，你选哪个？

FlashAttention、PagedAttention两代注意力算法，改写大模型推理生态详解.186

DeepSeek V4 Flash 对标 Gemini 3.6，AI 大跑毒时代

2026最新测试岗薪资曝光：会训练AI的拿80万，只会写用例的在投简历

我用Python + SMTP搭建了一套自动化量化监控系统

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

阿里云百炼大模型怎么收费？要钱吗？

机器学习PAI中代码集管理代码配置这里的 git地址有啥要求吗 ?

机器学习PAI的Alink加载onnx模型和engine那个效率高呢

返回代码RISK.RISK_CONTROL_REJECTION

请问机器学习PAI的Alink可以加载预训练好的pytorch模型嘛？

AGENT平台工作流上传pdf通过图片内容理解识别不了

训练的时候是没问题的，所以为什么机器学习PAI会报错？

自定义机器人消息，curl: (35) TCP connection reset by peer

AI生成海报or人工手绘，哪个更戳你？

展开全部

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

【玩转数据系列六】文本分析算法实现新闻自动分类

阿里巴巴机器学习系列课程

【玩转数据系列三】利用图算法实现金融行业风控

机器学习PAI全新功效——实时新闻热点Online Learning实践

【玩转数据系列五】农业贷款发放预测

FM算法介绍

【上报纸啦】95后大学生用机器学习PAI大战老年痴呆

【图算法】金融风控实验

【通知】阿里云机器学习PAI即将商业化

展开全部

还有其他疑问?