壹佰、_社区达人页

个人头像照片
壹佰、
已加入开发者社区1472

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
初入江湖
初入江湖

成就

已发布754篇文章
195条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
  • Python
  • 大数据
  • 目标检测
  • 推荐系统
  • TensorFlow
擅长领域
技术认证

暂时未有相关云产品技术能力~

暂无个人介绍

暂无精选文章
暂无更多信息

2022年08月

  • 08.03 20:51:01
    发表了文章 2022-08-03 20:51:01

    TensorFlow训练网络两种方式

    TensorFlow训练网络有两种方式,一种是基于tensor(array),另外一种是迭代器 两种方式区别是: 第一种是要加载全部数据形成一个tensor,然后调用model.fit()然后指定参数batch_size进行将所有数据进行分批训练 第二种是自己先将数据分批形成一个迭代器,然后遍历这个迭代器,分别训练每个批次的数据
  • 08.03 20:50:16
    发表了文章 2022-08-03 20:50:16

    TensorFlow中Embedding和One-Hot的区别

    在推荐系统或者一些大型文本分类数据任务上,对于一些数据的维度非常高,而且因为稀疏型(分类)特征不能直接喂给模型,我们需要将其映射成稠密连续特征(数值型)。
  • 08.03 20:49:37
    发表了文章 2022-08-03 20:49:37

    TensorFlow实现多输入源多输出

    有时我们的输入数据不只一个,会存在多个输入源,多个输出源,对于这种情况我们使用Sequential显然是不行的,因为Sequential只能够搭建线性拓扑模型,对于那种流水线型的模型较为适合,如果是非线性拓扑,复杂的拓扑使用Sequential是不能够实现的,这是我们就需要使用Function API,它会使我们处理多输入多输出变得简单。
  • 08.03 20:48:56
    发表了文章 2022-08-03 20:48:56

    TensorFlow利用函数式API实现共享层

    有些时候我们需要对一些输入层进行权值共享,这个目的就是有些输入源的数据是非常类似的,我们可以使用同一个层来进行捕捉特征,比如左右眼图片识别等,左右眼的结构较为类似,所以我们可以使用一个共享卷积核进行操作,而不需要两个卷积分别作用于两个眼部输入源。
  • 08.03 20:48:21
    发表了文章 2022-08-03 20:48:21

    TensorFlow提取和重用层计算图中的节点

    由于要处理的层计算图是静态数据结构,可以对其进行访问和检查。而这就是将函数式模型绘制为图像的方式。
  • 08.03 20:47:47
    发表了文章 2022-08-03 20:47:47

    TensorFlow利用函数API实现简易自编码器

    TensorFlow利用函数API实现简易自编码器
  • 08.03 20:47:08
    发表了文章 2022-08-03 20:47:08

    TensorFlow自定义损失函数

    在TensorFlow中已经内置了很多常用的损失函数,可以满足我们的模型训练要求,但是有的时候我们自己特定的任务会有自己的损失函数,这样TensorFlow库中的函数就不会满足我们,我们就需要自己定义计算损失的方法。
  • 08.03 20:46:32
    发表了文章 2022-08-03 20:46:32

    TensorFlow自定义评估指标

    有些时候我们的指标不止这些,需要根据我们自己特定的任务指定自己的评估指标,这时就需要自定义Metric,需要子类化Metric,也就是继承keras.metrics.Metric,然后实现它的方法
  • 08.03 20:45:54
    发表了文章 2022-08-03 20:45:54

    TensorFlow使用DataSets加载数据

    在TensorFlow中fit()函数可以接收numpy类型数据,前提数据量不大可以全部加载到内存中,但是如果数据量过大我们就需要将其按批次读取,转化成迭代器的形式,也就是DataSets
  • 08.03 20:45:07
    发表了文章 2022-08-03 20:45:07

    TensorFlow实现学习率衰减

    训练深度学习模型的常见模式是随着训练的进行逐渐减少学习。这通常称为“学习率衰减”。
  • 08.03 20:44:28
    发表了文章 2022-08-03 20:44:28

    TensorFlow中常见内置回调Callback

    计算每个epoch周期的平均指标,这个回调已经被自动应用在每个Keras模型,所以不需要手动设置
  • 08.03 20:43:49
    发表了文章 2022-08-03 20:43:49

    TensorFlow实现GAN生成对抗网络生成MNIST图像

    生成对抗网络 (GAN)。通过学习图像训练数据集的隐分布(图像的“隐空间”),GAN 可以生成看起来极为真实的新图像。
  • 08.03 20:43:04
    发表了文章 2022-08-03 20:43:04

    TensorFlow自定义回调函数【全局回调、批次、epoch】

    由于TensorFlow已经将整个模型的训练阶段进行了封装,所以我们无法在训练期间或者预测评估期间定义自己的行为,例如打印训练进度、保存损失精度等,这是我们就可以利用回调函数
  • 08.03 20:42:22
    发表了文章 2022-08-03 20:42:22

    TensorFlow自己定义EarlyStop回调函数通过监测loss指标

    TensorFlow训练模型需要经过多个epoch,但是并不是epoch越多越好,很有可能训练一半的epoch时,模型的效果开始下降,这是我们需要停止训练,及时的保存模型,为了完成这种需求我们可以自定义回调函数,自动检测模型的损失,只要达到一定阈值我们手动让模型停止训练
  • 08.03 20:41:46
    发表了文章 2022-08-03 20:41:46

    TensorFlow进行不同模型和数据集之间的迁移学习和模型微调

    迁移学习包括获取从一个问题中学习到的特征,然后将这些特征用于新的类似问题。例如,来自已学会识别浣熊的模型的特征可能对建立旨在识别狸猫的模型十分有用。
  • 08.03 20:41:04
    发表了文章 2022-08-03 20:41:04

    【图像分类】TensorFlow2.7版本搭建NIN网络

    注解:这里为了简单起见,只是模拟NIN网络结构,本代码只是采用3个mlpconv层和最终的全局平均池化输出层,每个mlpconv层中包含了3个1*1卷积层
  • 08.03 20:40:20
    发表了文章 2022-08-03 20:40:20

    解决ERROR: Cannot uninstall ‘PyYAML‘. It is a distutils installed project and thus we cannot accuratel

    解决ERROR: Cannot uninstall ‘PyYAML‘. It is a distutils installed project and thus we cannot accuratel
  • 08.03 20:39:39
    发表了文章 2022-08-03 20:39:39

    微软亚洲研究院开源热门AutoML工具NNI2.5最新版本

    NNI是微软亚洲研究院为研究人员和算法工程师量身定制的自动机器学习(AutoML)工具。过去的几年中,NNI不断迭代更新,持续将最前沿的算法加入其中,加强对各种分布式训练环境的支持,目前NNI已在Github上获得了10.8k星,成为最热门的自动机器学习开源项目之一。
  • 08.03 20:38:58
    发表了文章 2022-08-03 20:38:58

    【自然语言NLP】TensorFlow使用LSTM实现情感分析任务

    众所周知,人类自然语言中包含了丰富的情感色彩:表达人的情绪(如悲伤、快乐)、表达人的心情(如倦怠、忧郁)、表达人的喜好(如喜欢、讨厌)。利用机器自动分析这些情感倾向,不但有助于帮助企业了解消费者对其产品的感受,为产品改进提供依据;同时还有助于企业分析商业伙伴们的态度,一遍更好地进行商业决策。
  • 08.03 20:38:17
    发表了文章 2022-08-03 20:38:17

    解决AttributeError: module ‘tensorflow‘ has no attribute ‘div‘

    解决AttributeError: module ‘tensorflow‘ has no attribute ‘div‘
  • 08.03 20:37:38
    发表了文章 2022-08-03 20:37:38

    【自然语言NLP】TensorFlow使用LSTM实现文本匹配任务

    在NLP自然语言处理领域,有时我们需要计算不同文本之间的相似度,将不同文本进行编码,然后处理成Embedding定长表示向量,然后使用LSTM进行输出文本表示,定义多个多输入源数据进行计算。
  • 08.03 20:37:00
    发表了文章 2022-08-03 20:37:00

    解决ERROR: Cannot uninstall ‘llvmlite‘. It is a distutils installed project and thus we cannot accurat

    解决ERROR: Cannot uninstall ‘llvmlite‘. It is a distutils installed project and thus we cannot accurat
  • 08.03 20:36:19
    发表了文章 2022-08-03 20:36:19

    UMAP:强大的可视化&异常检测工具

    数据降维最为重要的是降低数据的维度的同时尽可能保有大量的原始信息,而其中最为大家熟知的是PCA和tSNE,但是这二者都存在一些问题
  • 08.03 20:32:59
    发表了文章 2022-08-03 20:32:59

    【推荐系统】推荐系统中分解共现矩阵的优点与局限性

    由于使用协同过滤,单纯考虑user或item之间的正反馈交互以及相似度量,这不能很好的利用全局信息,如果两个用户没有相同的历史行为,或者两个物品没有相同的用户购买,那么对于这两个物品或者用户来说,它们之间的相似度为0,这就会导致使用协同过滤不具备泛化利用全局信息的能力。
  • 08.03 20:32:21
    发表了文章 2022-08-03 20:32:21

    【推荐系统】推荐场景为什么不可以使用SVD分解共现矩阵

    在推荐领域,我们为了捕捉更多隐含特征,需要对用户-物品共现矩阵进行分解,对矩阵分解的方法主要有三种
  • 08.03 20:31:46
    发表了文章 2022-08-03 20:31:46

    【机器学习】GBM和随机森林都是基于树的算法,它们有什么区别?

    GBM和随机森林都是基于树的算法,它们有什么区别?
  • 08.03 20:30:59
    发表了文章 2022-08-03 20:30:59

    【推荐系统论文精读系列】(五)--Neural Collaborative Filtering

    近年来,深度神经网络在语音识别、计算机视觉和自然语言处理方面取得了巨大的成功。然而,深度神经网络在推荐系统上的探索相对较少受到关注。在这项工作中,我们致力于开发基于神经网络的技术来解决推荐中的关键问题——基于隐式反馈的协同过滤。
  • 08.03 20:30:21
    发表了文章 2022-08-03 20:30:21

    【推荐系统】Facebook经典模型GBDT+LR代码实践

    在CRT预估中,工业界一般是会采用逻辑回归进行处理,对用户特征画像进行建模,然后计算点击概率,评估用户是否会有点击的行为。
  • 08.03 20:29:34
    发表了文章 2022-08-03 20:29:34

    【推荐系统论文精读系列】(四)--Practical Lessons from Predicting Clicks on Ads at Facebook

    点击预测系统大多是以在线广告系统维中心,每天7亿的日常活跃用户和超过1百万的活跃广告,因此预测FaceBook上的广告点击率是一项具有挑战的机器学习任务。本片论文中我们介绍了一个模型采用决策树和逻辑回归结合的模式,融合模型的表现胜过它们自己单独建模的效果3%,这个一个重大的影响对于整个系统的表现。
  • 08.03 20:28:56
    发表了文章 2022-08-03 20:28:56

    【推荐系统】GBDT为什么可以进行特征选择

    在CRT预估中,工业界一般是会采用逻辑回归进行处理,对用户特征画像进行建模,然后计算点击概率,评估用户是否会有点击的行为。
  • 08.03 20:28:18
    发表了文章 2022-08-03 20:28:18

    【推荐系统】TensorFlow实现FM特征分解机

    TensorFlow实现FM特征分解机
  • 08.03 20:27:35
    发表了文章 2022-08-03 20:27:35

    【推荐系统】利用FM模型进行分类回归任务

    DictVectorizer:它是可以将非结构化的数据转成array格式,这里将字典数据转成数组,一般情况下使用字典是因为在推荐系统中的矩阵一般是稀疏的,所以采用字典存储数据高效,可以不用存储大量无用的0
  • 08.03 20:26:49
    发表了文章 2022-08-03 20:26:49

    【推荐系统论文精读系列】(一)--Amazon.com Recommendations

    推荐系统算法在电商网站现在已经被广泛使用,特们会使用关于用户兴趣的数据作为输入然后去产生一系列的推荐列表。一些应用只使用顾客购买的物品或者显示他们兴趣的数据,而且他们还会使用用户的其它属性,包括用户浏览过的物品,人口特征画像,感兴趣的话题和最喜爱的艺术家等。
  • 08.03 20:26:10
    发表了文章 2022-08-03 20:26:10

    【推荐系统论文精读系列】(二)--Factorization Machines

    本篇论文中,作者介绍了一个新的分解模型Fatorization Machines(FM),它结合了支持向量机的一些优点。与SVM一样,FM模型是一个通用的预测分类器适用于任何真实值的向量。但是与SVM不同的是,FM通过使用分解参数的方式在不同变量之间进行建模。
  • 08.03 20:25:18
    发表了文章 2022-08-03 20:25:18

    【推荐系统论文精读系列】(三)--Matrix Factorization Techniques For Recommender Systems

    现在推荐系统一般是基于两种策略,一种是基于文本过滤的方式,另外一种是协同过滤,而基于文本过滤的方法是创造画像为用户或者物品,说白了就是用一些描述性的特征去描述它们,例如对于一部电影来说,可以为其创造画像电影类型、导演、演员、电影市场、票房等来进行描述,对于用户来说,可以用一些人口统计特征来进行描述。
  • 08.03 20:24:32
    发表了文章 2022-08-03 20:24:32

    【推荐系统】矩阵分解MF利用BASIC-SVD分解

    那么到底如何才能将评分矩阵进行分解呢? 主成分分析利用到了奇异值分解(SVD)进行分解特征矩阵,那么这里我们可不可以使用SVD进行分解呢?
  • 08.03 20:23:16
    发表了文章 2022-08-03 20:23:16

    【推荐系统】隐语义模型(LFD)与矩阵分解(Matrix Factorization)

    对于推荐系统来说,如果使用协同过滤算法的话,一般是两种方式:UserCF、ItemCF,两种方式都是基于用户物品评分表(用户与物品之间的交互情况)的相似性进行计算。
  • 08.03 20:22:03
    发表了文章 2022-08-03 20:22:03

    【推荐系统】UserCF(基于用户的协同过滤)(理论+图解+代码实践)

    所谓协同过滤就是,根据用户的喜好或者近期的行为以及志趣相同的用户的爱好来给用户进行推荐物品,目前应用比较广泛的协同过滤算法有两种模式,一种是基于邻域(neighborhood methods),另外一种就是隐语义模型(latent factor models),对于邻域这种方法主要为以下两种方法:
  • 08.03 20:19:55
    发表了文章 2022-08-03 20:19:55

    【推荐系统】传统推荐模型的特点总结

    传统推荐模型的特点总结
  • 08.03 20:19:18
    发表了文章 2022-08-03 20:19:18

    【推荐系统】POLY2、FM、FFM模型的进化之路

    逻辑回归模型是CTR预测领域较为广泛使用的模型,原因有模型具备可解释性,良好的数学解释性,可以实现并行化提高效率,但是它有个缺点就是不能够捕捉数据的非线性关系,如果非要这样,一般情况下需要人工进行特征交叉,但是这样的成本较大,而且需要有经验的算法专家才能够交叉出好的特征,所以如果可以使用算法进行交叉,那么整个系统的工作效率将大大提高。
  • 08.03 20:18:01
    发表了文章 2022-08-03 20:18:01

    【推荐系统论文精读系列】(六)--Field-aware Factorization Machines for CTR Prediction

    点击率预测发挥了很大的作用在计算广告领域。针对这个任务,POLY2和FMs被广泛的应用。最近一个FMs的变体FFM,它的表现已经超过了现有的一些模型。基于我们赢得了两次比赛的胜利,本篇论文我们已经建立了一个有效的方式对于阐述现有的大型稀疏矩阵。首先,我们提出一些FFMs的训练实现方式。然后我们深刻分析了FFMs并且对比了这个方法与其它模型。经验表明FFMs是非常有用的对于某些分类问题,最后,我们已经发布了开源的FFMs供大家使用。
  • 08.03 20:17:18
    发表了文章 2022-08-03 20:17:18

    【推荐系统】TensorFlow手动实现AutoRec基于协同过滤

    TensorFlow手动实现AutoRec基于协同过滤
  • 08.03 20:16:31
    发表了文章 2022-08-03 20:16:31

    【推荐系统论文精读系列】(七)--AutoRec Autoencoders Meet Collaborative Filtering

    本文提出了AutoRec,一个用于协同过滤的新型自动编码器框架。根据经验,AutoRec对于模型的影响和训练效率已经超过了现在基于协同过滤技术的大多数先进模型。
  • 08.03 20:15:49
    发表了文章 2022-08-03 20:15:49

    【推荐系统】TensorFlow复现论文DeepCrossing特征交叉网络结构

    TensorFlow复现论文DeepCrossing特征交叉网络结构
  • 08.03 20:15:02
    发表了文章 2022-08-03 20:15:02

    【推荐系统论文精读系列】(八)--Deep Crossing:Web-Scale Modeling without Manually Crafted Combinatorial Features

    人工制作的组合特征是许多成功模型背后的 "秘诀"。然而,对于网络规模的应用来说,特征的种类和数量使得这些手工制作的特征在创建、维护和部署时成本高昂。本文提出了Deep Crossing模型,它是一个深度神经网络,可以自动结合特征来产生卓越的模型。Deep Crossing的输入是一组单独的特征,可以是密集的也可以是稀疏的。重要的交叉特征是由网络隐含地发现的,网络由嵌入和堆叠层以及残余单元的级联组成。
  • 08.03 20:14:11
    发表了文章 2022-08-03 20:14:11

    【推荐系统】TensorFlow复现论文NeuralCF网络结构

    下图为NeutralCF的模型结构图,总共两个分支,第一个分支为GML,第二个为MLP,GML通路将两个特征的Embedding向量进行内积操作,MLP将两个特征的Embedding的向量进行拼接,然后使用多层感知机进行传播,然后将两个通路输出的向量进行拼接,导入全连接层(输出层),输出Score。
  • 08.03 20:13:25
    发表了文章 2022-08-03 20:13:25

    【推荐系统】TensorFlow复现论文PNN网络结构

    下图为PNN的模型结构图,首先将Sparse特征进行Embedding嵌入,然后将其流入Product,分别进行捕捉线性关系lz和特征交叉lp,然后拼接,流到MLP全连接层,最终输出CTR概率值。
  • 08.03 20:12:05
    发表了文章 2022-08-03 20:12:05

    【推荐系统】TensorFlow复现论文Wide&Deep网络结构

    下图为Wide&Deep的模型结构图,该模型结合了线性模型的Memorization和神经网络的捕捉深层特征的Generation,将特征分为两个输入源分别输入Wide和Deep部分,最终将两个模型的logits进行融合激活得到最终输出。
  • 08.03 20:11:18
    发表了文章 2022-08-03 20:11:18

    【推荐系统论文精读系列】(十)--Wide&Deep Learning for Recommender Systems

    具有非线性特征转化能力的广义线性模型被广泛用于大规模的分类和回归问题,对于那些输入数据是极度稀疏的情况下。通过使用交叉积获得的记忆交互特征是有效的而且具有可解释性,然后这种的泛化能力需要更多的特征工程努力。在进行少量的特征工程的情况下,深度神经网络可以泛化更多隐式的特征组合,通过从Sparse特征中学得低维的Embedding向量。可是,深度神经网络有个问题就是由于网络过深,会导致过度泛化数据。
  • 发表了文章 2023-01-20

    使用LSTM预测结果为一条直线原因总结

  • 发表了文章 2023-01-20

    【技术er圣诞创意大赏】基于Flink的实时数据平台

  • 发表了文章 2023-01-20

    【大数据系列之JDBC】(八):使用PreparedStatement获取结果集对象

  • 发表了文章 2023-01-20

    【大数据系列之JDBC】(七):JDBC解决字段名和Java中对象名不一致

  • 发表了文章 2023-01-20

    【大数据系列之JDBC】(六):使用PreparedStatement实现通用的增删改查操作

  • 发表了文章 2023-01-20

    【大数据系列之JDBC】(五):使用PrepareStatement防止SQL注入

  • 发表了文章 2023-01-20

    【大数据系列之JDBC】(四):Statement存在SQL注入问题

  • 发表了文章 2023-01-20

    【大数据系列之JDBC】(三):Java获取数据库连接的5种方式

  • 发表了文章 2023-01-20

    【大数据系列之JDBC】(二):IDEA添加MySQL驱动jar包

  • 发表了文章 2023-01-20

    【大数据系列之JDBC】(一):MySQL5.1驱动下载

  • 发表了文章 2023-01-20

    【大数据系列之MySQL】(三十五):MySQL中的流程控制

  • 发表了文章 2023-01-20

    【大数据系列之MySQL】(三十四):存储过程的介绍

  • 发表了文章 2023-01-20

    【大数据系列之MySQL】(三十三):MySQL中的变量

  • 发表了文章 2023-01-20

    【大数据系列之MySQL】(三十二):MySQL中的视图

  • 发表了文章 2023-01-20

    【大数据系列之MySQL】(三十一):MySQL中的事务TCL

  • 发表了文章 2023-01-20

    【大数据系列之MySQL】(三十):MySQL中的DDL语言

  • 发表了文章 2023-01-20

    【大数据系列之MySQL】(二十九):MySQL中的DML语言

  • 发表了文章 2023-01-20

    【大数据系列之MySQL】(二十八):MySQL中的联合查询

  • 发表了文章 2023-01-20

    【大数据系列之MySQL】(二十七):子查询的经典使用案例

  • 发表了文章 2023-01-20

    【大数据系列之MySQL】(二十六):MySQL中的分页查询

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息