备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

机器学习PAI中我这里是将用户对这个物品的情感评分作为label 好差评相差大，为什么呢？

机器学习PAI中我这里是将用户对这个物品的情感评分作为label 好评的话就分数接近1 差评分数接近0，小于0.5的只有8千多条大于0.5的有近4万条，为什么这样？

展开

收起

冰激凌甜筒 2023-04-25 17:11:39 305 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

微笑向日葵

看起来数据集中正负样本的数量不太均衡，可能会对模型的训练产生影响。建议正负样本数量尽量平衡，比如过采样、欠采样这些操作试一下效果。也可以试下F1_REWEIGHTED_LOSS，可以调整二分类召回率和准确率相对权重的损失函数，可有效对抗正负样本不平衡问题，此回答整理自钉群“【EasyRec】推荐算法交流群”

2023-04-25 19:30:41

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

在机器学习中，将用户对物品的情感评分作为标签是一种常见的监督学习方式。如果好评和差评之间相差过大，这可能会对模型的训练产生负面影响，导致模型难以准确地预测某些评分。要解决这个问题，可以考虑对评分进行归一化或调整。例如，可以使用数据标准化方法，将评分值缩放到统一的范围内，或者通过训练模型来学习不同评分级别之间的关系。另外，还需注意选择合适的特征和算法，并进行合适的超参数调整，以提高模型的准确性和稳定性。

2023-04-25 17:23:46

赞同展开评论

问答分类：

机器学习/深度学习人工智能平台 PAI

问答标签：

机器学习人工智能平台 PAI 人工智能平台 PAI label 人工智能平台 PAI pai 人工智能平台 PAI机器学习人工智能平台 PAI评分

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

人工智能平台PAI

机器学习PAI把物品序列和物品side info序列放在一个group里面和拆成3个group？

178

2

0

有个机器学习PAI问题想请教一下，1e-12在tf 中默认float32 ?

222

1

0

机器学习PAI可以检查图片是否被p过的么?

85

0

0

机器学习PAI easyrec中只有一个eval_path 评估数据的路径吗？

139

3

0

机器学习PAI easyrec做RawFeature这种连续值特征输入时，直接将特征原值作为输入？

124

3

0

机器学习PAI负采样的时候，有必要加上用户明确dislike的item吗？

136

3

0

机器学习PAI目前我们的click里没有包含jump。这样的特征可以用吗？

92

2

0

想问下机器学习PAI，这里有2.8吗？

107

2

0

机器学习PAI只能用再建一个 done分区的方式吗？instance.status 这种方式可行吗？

96

2

0

请问机器学习PAI 在线性回归组件的参数设置中，左边的栏目无法勾选是什么原因呢？

113

0

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关文章

阿里云GPU云服务器解析：性能优势、应用场景与收费价格参考

智能体会是泡沫吗？AI七十年进化告诉你，2025年才是真正的拐点

AI驱动的测试：用Dify工作流实现智能缺陷分析与分类

官宣：Ray 正式加入 PyTorch 基金会

基于python大数据的图书推荐和分析系统

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

PAI做了线性回归的模型，预测结果后，回归模型评估的节点，结果R2的值是负的，我理解R2的取值范围?

机器学习PAI测试集跟验证集怎么划分的？

灵积平台上，用通义千问的开源大模型接口响应非常慢

在api调用夸克搜索时，遇到权限不足问题

为什么我的天池notebook中，无法创建notebook文件，也无法显示我的天池文档等内容。

阿里AI克隆人声模型

在海量用户中，将如何快速定位到目标人群进行个性化营销？

阿里云的镜像上搜不到机器学习PAI的input用的common_io为什么？

iTAG阿里的数据标注任务怎么对接呀？

展开全部

【上报纸啦】95后大学生用机器学习PAI大战老年痴呆

推荐系统之业务架构总览

人民的名义分析

ALS算法实现用户音乐打分预测

心脏病预测案例_1480

DistilQwen2：通义千问大模型的知识蒸馏实践

PAI-TurboX：面向自动驾驶的训练推理加速框架

人工智能（AI）技术的发展史

阿里云PAI-部署Qwen2-VL-72B

【新手必看】PyCharm2025 免费下载安装配置教程+Python环境搭建、图文并茂全副武装学起来才嗖嗖的快,绝对最详细!

展开全部

还有其他疑问?