游客vwqy2pyoay2os_个人页

个人头像照片 游客vwqy2pyoay2os
个人头像照片
0
99
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息
暂无更多信息
正在加载, 请稍后...
暂无更多信息
  • 回答了问题 2022-03-14

    推荐系统是什么?

    推荐系统是信息过滤系统的一个子类,用于预测用户对产品的偏好或评价。推荐系统广泛应用于电影、新闻、研究文章、产品、音乐等领域。
    踩0 评论0
  • 回答了问题 2022-03-14

    线性回归和逻辑回归有什么区别?

    线性回归是一种将一条直线(或多元线性回归中的n维平面)拟合到数据上的统计技术。它用于回归,也就是说,当目标值在一个连续的尺度上时。Logistic回归是通过sigmoid函数对线性回归的一种变换,给出了一组输入在分类0或分类1中的概率。
    踩0 评论0
  • 回答了问题 2022-03-14

    怎么应用Box-Cox变换来帮助模型性能?

    Box-Cox转换包括将数据提升到某个幂,例如将其平方、立方或平方(提升到1/2幂)。由于第0次幂的值总是1,所以Box-Cox变换中的“第0次幂”被认为是对数变换。 对数函数特别能提高模型的性能,因为它把指数函数放在线性尺度上。这意味着线性回归等线性模型可以更好地处理数据。 对函数进行平方和立方化也可以理顺数据或强调数据中某些重要部分。
    踩0 评论0
  • 回答了问题 2022-03-14

    维度的诅咒是什么?

    维度诅咒 Curse of Dimensionality 是指在分析具有许多特征(高维数据)的数据时出现的某些现象,这些特征不是在普通的二维或三维空间中出现的。一个共同的主题是,随着维数的增加,稀疏性增加得如此之快,以至于对于机器学习模型这样的模型,有意义地计算所有的值在计算上是不可行的。需要注意的一点是,在非常高维的空间中,任意两个样本之间的欧几里德距离太小,不可能使用任何需要计算两点之间距离的统计或机器学习方法。(这也是为什么卷积神经网络在高维图像识别中更受欢迎的原因。)
    踩0 评论0
  • 回答了问题 2022-03-14

    深度学习技术如何赋能新媒体?

    深度学习技术目前在媒体范围的应用主要集中在内容生产和内容分发两大块,其中内容分发已经实现并发展出较成熟的技术架构和商业体系。作为第四范式资深科学家,王嘉磊在主题分享《如何通过AutoML实现智能推荐系统的自动上线和运维》中介绍了AutoML技术如何使AI具备自我完善和演化的能力。 目前通过NLP技术感知文本内容(word2vec, doc2vec, BERT, etc.),通过CV技术感知图像、视频,使用机器学习分析用户画像并预测点击率和内容阅读时长,和使用机器学习评估内容质量并促进优质内容的传播是AI技术在推荐系统中的主要应用方向。而目前在技术上其实面临着两大挑战:一是在机器学习模型的构建流程中,每个环节都需要建模专家根据经验做出选择和优化;二是系统上线后为保证效果,还存在一定数量的系统参数需要人来持续监控和优化。如果需要解决这两大难题,则需要将AutoML运用与推荐系统的搭建,即用AI来训练AI模型,通过进化算法、贪心法、贝叶斯优化、强化学习四大AutoML搜索策略,实现自动特征工程、模型超参数优化、神经网络结构搜索以及在线调优。 “训练神经网络本身是一件比较困难的事情,往往生成出的网络结构数据在具体场景不一定适用。”王嘉磊表示,“我们希望能够做自主的神经网络结构搜索,希望效果会比一些从学界直接拿来的现成网络有所提升。” 随着人工智能技术的升级发展,AI将不断从媒体的内容生产、分发与消费模式等环节实现智能突破,从而帮助媒体进行内容升级和用户体验升级。作为一家技术与服务提供商,第四范式很早就看到了人工智能给媒体带来的“智能化”意义,其推出的AI产品“先荐”以智能推荐为核心切入点,集内容上传、内容管理、内容分发、推荐干预、前端渲染于一体,可以帮助媒体从0到1搭建推荐系统。据悉,目前先荐已与人民日报、环球网、CSDN、花瓣网、段友、36氪、简书等三百余家内容平台展开合作,多次成功助力媒体实现智能转型。
    踩0 评论0
  • 回答了问题 2022-03-14

    在时间序列建模中,怎么处理不同形式的季节性?

    通常在现实世界的时间序列数据中(比如说,在玩具厂购买的泰迪熊),会有不同形式的季节性因素相互干扰。每年的季节性,如圣诞节前后的高峰和夏季的低谷,可能与每月、每周甚至每天的季节性重叠。这使得时间序列非平稳,因为变量的平均值在不同的时间段是不同的。 对时间序列进行差分是消除其季节性的最好方法。这是将时间x和x中的一个日期减去季节性周期(可能是一年、一个月或其他时间)之间的差额的过程。这意味着一个季节性周期值的原始数据丢失,因为在前几个样本中x减去季节性周期是不可访问的。
    踩0 评论0
  • 回答了问题 2022-03-14

    测试集和验证集有什么区别?

    测试集用于评估模型经过训练后的性能。在训练期间使用验证集进行参数选择并防止训练集上的过度拟合。
    踩0 评论0
  • 回答了问题 2022-03-14

    贝叶斯估计和最大似然估计有什么区别?

    在贝叶斯估计中,模型对数据(先验)有一定的了解。可能有几个参数值可以解释数据,因此,我们可以查找多个参数,如5个gammas和5个lambdas。作为贝叶斯估计的结果,有多个模型用于进行多个预测(每对参数一个,但具有相同的先验)。因此,如果需要预测一个新的例子,那么计算这些预测的加权和就可以了。 最大似然不考虑先验,因此它类似于使用某种平坦先验的贝叶斯模型。
    踩0 评论0
  • 回答了问题 2022-03-14

    关于数据,P值意味着什么?

    在统计学中,P值用于确定假设检验后结果的显著性。P值有助于分析人员得出结论,并且总是在0到1的范围内。 P值大于0.05表示对无效假设的证据不足,这意味着无效假设不能被拒绝。 小于0.05的P值表示有有力的证据反对零假设,这意味着可以拒绝零假设。 P值为0.05是边际值,这表明这两种情况都有可能发生。
    踩0 评论0
  • 回答了问题 2022-03-14

    人工智能PCA能有什么帮助?

    主成分分析(PCA)是一种降维方法,它通过寻找n个正交向量来表示数据中的最大方差,其中n是用户希望数据降维到的维数。n个向量用作新数据的维度。PCA可以帮助加快机器学习算法的速度,也可以用来可视化高维数据。
    踩0 评论0
  • 回答了问题 2022-03-14

    TF/IDF矢量化是什么?

    TF-IDF是短期频率逆文档频率的缩写。这是一个数字统计,旨在反映一个词对语料库中的文档有多重要。在信息检索和文本挖掘中,它常被用作一个权重因子。TF–IDF值随单词出现在文档中的次数成比例增加,但随单词在语料库中的频率成比例减少,这有助于调整某些单词出现的频率
    踩0 评论0
  • 回答了问题 2022-03-14

    偏倚(bias)、方差(variable)均衡是什么?

    偏倚:指的是模型预测值与真实值的差异,是由使用的学习算法的某些错误或过于简单的假设造成的误差。它会导致模型欠拟合,很难有高的预测准确率。 方差:指的是不同训练数据训练的模型的预测值之间的差异,它是由于使用的算法模型过于复杂,导致对训练数据的变化十分敏感,这样会导致模型过拟合,使得模型带入了过多的噪音。 任何算法的学习误差都可以分解成偏倚、方差和噪音导致的固定误差。模型越复杂,会降低偏倚增加方差。为了降低整体的误差,我们需要对偏倚方差均衡,使得模型中不会由高偏倚或高方差。
    踩0 评论0
  • 回答了问题 2022-03-14

    核技巧的用处是什么?

    核技巧使用核函数,确保在高维空间不需要明确计算点的坐标,而是计算数据的特征空间中的内积。这使其具有一个很有用的属性:更容易的计算高维空间中点的坐标。许多算法都可以表示称这样的内积形式,使用核技巧可以保证低维数据在高维空间中运用算法进行计算。
    踩0 评论0
  • 回答了问题 2022-03-14

    TensorFlow中常见的核函数都有哪些?

    SVM高斯核函数,应为如果想要分割非线性数据集,改变线性分类器隐射到数据集,就要改变SVM损失函数中的核函数; 线性核函数;多项式核函数;
    踩0 评论0
  • 回答了问题 2022-03-14

    TensorFlow中交叉熵 常用的有哪些?

    tf.nn.weighted_cross_entropy_with_logits; tf.nn.sigmoid_cross_entropy_with_logits; tf.nn.softmax_cross_entropy_with_logits; tf.nn.sparse_softmax_cross_entropy_with_logits;
    踩0 评论0
  • 回答了问题 2022-03-14

    归一化和标准化的区别是什么?

    标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,将样本的特征值转换到同一量纲下。归一化是依照特征矩阵的行处理数据,其目的在于样本向量在点乘运算或其他核函数计算相似性时,拥有统一的标准,也就是说都转化为“单位向量”。 对于深度网络而言,归一化的目的是方便比较,可以加快网络的收敛速度;标准化是将数据利用z-score(均值、方差)的方法转化为符合特定分布的数据,方便进行下一步处理,不为比较。
    踩0 评论0
  • 回答了问题 2022-03-14

    AdaBoost的基本原理是什么?

    AdaBoost是一个广泛使用的BOOSTING算法,其中训练集上依次训练弱分类器,每次下一个弱分类器是在训练样本的不同权重集合上训练。权重是由每个样本分类的难度确定的。分类的难度是通过分类器的输出估计的。
    踩0 评论0
  • 回答了问题 2022-03-14

    AL人工智能LR与线性回归的对比是什么?

    LR的优化函数为似然函数,经典线性回归的优化函数为最小二乘。 LR将预测范围缩小到了[0,1],而经典线性回归的预测范围为整个实数。
    踩0 评论0
  • 回答了问题 2022-03-14

    AI人工智能常用的分类器有哪些?

    线性分类器:Logistic归回 y=sigmoid(wx+b) 传统方式:特征描述和检测 KNN、k最邻近,判断图像与各个类别的距离 SVM、选项定特征、SVM算法输出一个最优化的分隔超平面(分类面)。 BPNN,全连接网络,计算量巨大 CNN,卷积神经网络
    踩0 评论0
  • 回答了问题 2022-03-14

    新媒体运营的工作内容是什么?

    为了更好地去理解这个岗位,我附上一份相关的工作内容要求。岗位职责负责城市形象【IP】的日常运营和年度策划执行,提升【IP】内容影响力;负责商业合作项目,提出创意执行方案,完成具体运营工作,包括但不限于图文、海报、短视频、【H5】、专题、新闻稿等内容;负责行业微博账号运营工作,根据热点策划选题,并进行社群运营等;把控商业项目与账号运营各执行环节,并做好效果反馈;积极拓展相关资源,拓宽内容运营渠道;完成部门领导安排的其他相关工作。任职要求本科或以上学历,新闻学、传播学、汉语言文学等相关专业;三年以上传统媒体或新媒体从业经验,优秀应届生亦可考虑;对互联网内容运营有浓厚兴趣,有一定的策划能力,思维活跃,创意能力佳,执行力强 ;热爱新闻、关心时事、对政务领域有深刻的见解,善于捕捉新闻热点,具备一定的新闻素养和新闻判断力,有与政府合作经验者优先; 知识面广、喜好阅读,具有较强的文字表达、写作能力,较强的创新思维和专题策划能力;
    踩0 评论0
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息