山顶夕景_社区达人页

个人头像照片
山顶夕景
已加入开发者社区1240

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
初入江湖
初入江湖

成就

已发布593篇文章
4条评论
已回答0个问题
0条评论
已发布0个视频
github地址

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

CSDN博客专家,华为云云享专家,阿里云专家博主,51CTO专家博主,现为推荐算法工程师,研究领域为AI推荐算法、NLP、图神经网络等,发表EI会议论文一篇,CSDN博客访问量破100万。 CSDN博客id:山顶夕景 微信公众号:古道西风瘦码 知识星球:AI算法乐园

暂无精选文章
暂无更多信息

2022年04月

  • 04.25 18:48:51
    发表了文章 2022-04-25 18:48:51

    【教奶奶学SQL】(task2)基础查询与排序

    从表中选取数据时需要使用SELECT语句,也就是只从表中选出(SELECT)必要数据的意思。通过SELECT语句查询并选取出必要数据的过程称为匹配查询或查询(query)。
  • 04.25 18:00:10
    发表了文章 2022-04-25 18:00:10

    【教奶奶学SQL】(task1)初识数据库

    数据库是将大量数据保存起来,通过计算机加工而成的可以进行高效访问的数据集合。该数据集合称为数据库(Database,DB)。用来管理数据库的计算机系统称为数据库管理系统(Database Management System,DBMS)。
  • 04.25 17:37:22
    发表了文章 2022-04-25 17:37:22

    【教奶奶学SQL】(task4)集合运算

    集合在数学领域表示“各种各样的事物的总和”, 在数据库领域表示记录的集合. 具体来说,表、视图和查询的执行结果都是记录的集合, 其中的元素为表或者查询结果中的每一行。
  • 04.25 15:40:02
    发表了文章 2022-04-25 15:40:02

    【MySQL实战45讲基础篇】(task5)深入浅出索引(下)

    【栗子引入】 在下面这个表 T 中,如果执行 select * from T where k between 3 and 5,需要执行几次树的搜索操作,会扫描多少行?
  • 04.25 15:35:24
    发表了文章 2022-04-25 15:35:24

    VR、AR、MR

    Virtual Reality 虚拟现实 VR = 双目渲染 + 硬件显示设备
  • 04.25 15:34:34
    发表了文章 2022-04-25 15:34:34

    【王喆-推荐系统】评估篇-(task2)推荐模型评估指标

    准确率 (Accuracy) 是指分类正确的样本占总样本个数的比例。
  • 04.25 15:30:09
    发表了文章 2022-04-25 15:30:09

    【MySQL实战45讲基础篇】(task4)深入浅出索引(上)

    分析了数据库引擎可用的数据结构,介绍了 InnoDB 采用的 B+ 树结构,以及为什么 InnoDB 要这么选择。B+ 树能够很好地配合磁盘的读写特性,减少单次查询的磁盘访问次数。
  • 04.25 15:25:19
    发表了文章 2022-04-25 15:25:19

    【新闻文本分类】(task4)使用gensim训练word2vec

    Word2vec即“word to vector”,是一个生成对“词”的向量表达的模型。 想要训练 Word2vec 模型,我们需要准备由一组句子组成的语料库。假设其中一个长度为 T 的句子包含的词有 w1,w2……wt,并且我们假定每个词都跟其相邻词的关系最密切。
  • 04.25 15:20:17
    发表了文章 2022-04-25 15:20:17

    【MySQL实战45讲基础篇】(task3)事务隔离

    ACID(Atomicity、Consistency、Isolation、Durability,即原子性、一致性、隔离性、持久性)。当数据库上有多个事务同时执行的时候,就可能出现脏读(dirty read)、不可重复读(non-repeatable read)、幻读(phantom read)的问题,为了解决这些问题,就有了“隔离级别”的概念。
  • 04.25 15:17:35
    发表了文章 2022-04-25 15:17:35

    【王喆-推荐系统】复习篇-Sparrow的个性化推荐功能

    为了训练推荐模型,需要准备好模型所需的样本和特征。在进行模型线上推断的时候,推荐服务器也需要线上实时拼装好包含了用户特征、物品特征、场景特征的特征向量,发送给推荐模型进行实时推断。
  • 04.25 14:59:25
    发表了文章 2022-04-25 14:59:25

    【树模型与集成学习】(task8)阶段性总结(更新ing)

    决策树常用于分类,目标就是将具有 P PP 维特征的 n nn 个样本分到 C CC 个类别中,相当于做一个映射 C = f ( n ) C = f(n)C=f(n) ,将样本经过一种变换赋予一个 l a b e l labellabel。可以把分类的过程表示成一棵树
  • 04.25 14:54:51
    发表了文章 2022-04-25 14:54:51

    【MySQL实战45讲基础篇】(task2)日志系统

    1)先从一个update栗子开始,首先创建一个表,这个表有一个主键 ID 和一个整型字段 c。如果要将 ID=2 这一行的值加 1,SQL 语句如下::
  • 04.25 14:49:52
    发表了文章 2022-04-25 14:49:52

    【LeetCode415】字符串相加(简单双指针)

    简单题。不能用函数,就用小学数学相加的方法(从右至左),存储进位carry值。 双指针分别从右到左遍历两个字符串
  • 04.25 14:48:38
    发表了文章 2022-04-25 14:48:38

    【LeetCode33】搜索旋转排序数组(二分查找变种)

    对于有序数组或者部分有序数组,并且注意题目的时间复杂度要求为O ( l o g n ) O(logn)O(logn),一般使用二分搜索及其变种。 既然数组会经过旋转,则我们不能只是用常规的二分查找,而是需要进行判断,基于先对有序段判断的二分查找。比如当在左边(nums[left]和nums[mid])这段有序时,要进行分类讨论:
  • 04.25 14:44:58
    发表了文章 2022-04-25 14:44:58

    【新闻文本分类】(task3)文本表示(fastText)

    One-hot、Bag of Words、N-gram、TF-IDF等方法都存在一定问题:转换得到的向量维度很高,需要较长的训练实践;没有考虑单词与单词之间的关系,只是进行了统计。
  • 04.25 14:40:48
    发表了文章 2022-04-25 14:40:48

    【新闻文本分类】(task2)文本表示(CBOW和TF-IDF)

    Bag of words词袋表示,又称为CountVectors或者CBOW,用它表示成对应的文本向量时,每个向量的元素对应该该维对应的词在文本中出现的次数。显然这种表示方法木有考虑词的顺序信息,没有融入上下文的信息。 下面来看下它的实现吧:
  • 04.25 14:32:25
    发表了文章 2022-04-25 14:32:25

    【王喆-推荐系统】模型篇-(task5)wide&deep模型

    Wide&Deep是工业界中有巨大影响力的模型,如果直接翻译成中文是宽和深的模型,其模型结构如下所示:wide和deep让模型兼具逻辑回归和深度神经网络的特点。
  • 04.25 14:29:01
    发表了文章 2022-04-25 14:29:01

    【树模型与集成学习】(task6)梯度提升树GBDT+LR

    协同过滤和矩阵分解存在的劣势就是仅利用了用户与物品相互行为信息进行推荐, 忽视了用户自身特征, 物品自身特征以及上下文信息等,导致生成的结果往往会比较片面。
  • 04.24 20:34:35
    发表了文章 2022-04-24 20:34:35

    【新闻文本分类】(task1)赛题数据分析

    赛题介绍:https://tianchi.aliyun.com/competition/entrance/531810/introduction 赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出 14 个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。 赛题数据由以下几个部分构成:
  • 04.24 20:29:00
    发表了文章 2022-04-24 20:29:00

    【linux】ssh使用和linux目录相关命令

    打开ssh工具putty(免费的!)后,登录发现报错Couldn't agree a key exchange algorithm,查了下说可能是putty版本太老了,就到官网上重新下载一个了——https://www.putty.org/,神奇地好了(不过一开始以为账号是ubuntu上面的那个账号,一直没登上hhh,后来试了下才发现是
  • 04.24 20:16:25
    发表了文章 2022-04-24 20:16:25

    【Recsys2021】推荐系统论文整理和导读

    召回的目的是根据用户部分特征,从海
  • 04.24 20:12:32
    发表了文章 2022-04-24 20:12:32

    【树模型与集成学习】(task5)自适应提升法AdaBoost(更新ing)

    自适应提升算法Adaboost,Adaptive Boosting。 自适应是指Adaboost会根据本轮样本的误差结果来分配下一轮模型训练时样本在模型中的相对权重,即对错误的或偏差大的样本适度“重视”,对正确的或偏差小的样本适度“放松”,这里的“重视”和“放松”具体体现在了Adaboost的损失函数设计以及样本权重的更新策略。
  • 04.24 19:41:19
    发表了文章 2022-04-24 19:41:19

    【王喆-推荐系统】线上服务篇-(task5)部署离线模型

    (1)业界主流的模型服务方法有 4 种,分别是预存推荐结果或 Embeding 结果、预训练 Embeding+ 轻量级线上模型、利用 PMML 转换和部署模型以及 TensorFlow Serving。
  • 04.24 19:34:02
    发表了文章 2022-04-24 19:34:02

    解决:VMware Workstation 与 Device/Credential Guard 不兼容

    因为在官网下载了win版的docker,而会自带下载虚拟机Hyper-V,这个和我之前下载的vmware虚拟机造成冲突了,导致后者不能使用,所以打开vmware报错如下:
  • 04.24 19:23:36
    发表了文章 2022-04-24 19:23:36

    【PyTorch基础教程17】损失函数详解

    功能:计算二分类任务时的交叉熵(Cross Entropy)函数。在二分类中,label是{0,1}。对于进入交叉熵函数的input为概率分布的形式。一般来说,input为sigmoid激活层的输出,或者softmax的输出。
  • 04.24 13:10:33
    发表了文章 2022-04-24 13:10:33

    【PyTorch基础教程16】可视化宝藏visdom

    isdom是Facebook专门为Pytorch开发的一款可视化工具,通过官网介绍(http://github.com/facebookresearch/visdom)介绍它能搞定大多数科学运算(处理数值、图像、文本甚至是视频)的可视化任务。visdom支持pytorch、Torch和Numpy。 (1)通过pip install visdom即可完成visdom的安装。
  • 04.24 13:08:00
    发表了文章 2022-04-24 13:08:00

    【树模型与集成学习】(task4)两种并行集成的树模型

    随机森林是以决策树(常用CART树)为基学习器的bagging算法。 (1)随机森林当处理回归问题时,输出值为各学习器的均值; (2)随机森林当处理分类问题时有两种策略:
  • 04.24 13:03:20
    发表了文章 2022-04-24 13:03:20

    【PyTorch基础教程15】循环神经网络RNN

    全连接被称为Dense层或者Deep层。输入数据样本的不同特征。 CNN用了权重共享的概念,而全连接层的参数量是巨大的。我们可以使用RNN解决如下图(天气预报预测)这种带有序列模式的数据(如NLP、天气、股市金融数据等),并且使用权重共享的概念来减少参数量。
  • 04.24 12:55:05
    发表了文章 2022-04-24 12:55:05

    【PyTorch基础教程14】FashionMNIST时装分类

    务的目标: 是对10个类别的“时装”图像进行分类,使用FashionMNIST数据集(https://github.com/zalandoresearch/fashion-mnist )。上图给出了FashionMNIST中数据的若干样例图,其中每个小图对应一个样本。
  • 04.24 12:24:31
    发表了文章 2022-04-24 12:24:31

    【PyTorch基础教程25】用Pytorch训练快速神经网络的9个技巧

    这份指南的介绍从简单到复杂,一直介绍到你可以完成的大多数PITA修改,以充分利用你的网络。例子中会包括一些Pytorch代码和相关标记,可以在 Pytorch-Lightning训练器中用,以防大家不想自己敲码!
  • 04.24 11:36:28
    发表了文章 2022-04-24 11:36:28

    【PyTorch基础教程13】GoogleNet和ResNet

    上节课主要讲了CNN的架构(如下图的LetNet5), 定义一个卷积层:输入通道数、输出通道数、卷积核的大小(长和宽)。卷积层要求输入输出是四维张量(B,C,W,H),全连接层的输入与输出都是二维张量(B,Input_feature)。
  • 04.24 02:39:18
    发表了文章 2022-04-24 02:39:18

    【树模型与集成学习】(task3)集成模式

    我们在有限数据上训练模型,再用模型去预测新的数据,并期望在新数据上得到较低的预测损失,这里的预测损失可以指分类问题的错判率或回归问题的均方误差等各类评价指标。 对于实际问题中的数据,可以认为它总是由某一个分布p pp生成得到的,不妨设训练集合上有限的n nn个样本满足:
  • 发表了文章 2022-04-28

    【推荐算法课程】CS246 大数据挖掘

  • 发表了文章 2022-04-28

    年轻人创业最关心的13个问题

  • 发表了文章 2022-04-28

    【AI基础】AUC/ROC指标

  • 发表了文章 2022-04-28

    【LeetCode剑指offer65】不用加减乘除做加法(位运算)

  • 发表了文章 2022-04-28

    【LeetCode168】Excel表列名称(从1开始的进制转换)

  • 发表了文章 2022-04-28

    【LeetCode剑指offer】二叉搜索树的最近公共祖先(迭代or递归)

  • 发表了文章 2022-04-28

    【LeetCode24】两两交换链表中的节点(递归)

  • 发表了文章 2022-04-28

    【LeetCode剑指offer12】矩阵中的路径(dfs回溯)

  • 发表了文章 2022-04-28

    【LeetCode剑指offer47】礼物的最大价值(简单dp)

  • 发表了文章 2022-04-28

    【kaggle】特征工程 trick

  • 发表了文章 2022-04-28

    【Spark】(task4)SparkML基础(数据编码)

  • 发表了文章 2022-04-28

    【LeetCode剑指offer34】二叉树中和为某一值的路径(dfs回溯)

  • 发表了文章 2022-04-28

    【Pytorch基础教程27】DeepFM推荐算法

  • 发表了文章 2022-04-28

    【LeetCode163】缺失的区间(to_string)

  • 发表了文章 2022-04-28

    【LeetCode剑指offer57 II】和为s的连续正数序列(用vector模拟滑动窗口)

  • 发表了文章 2022-04-28

    【Airflow】工作流自动化和调度系统

  • 发表了文章 2022-04-28

    【LeetCode剑指offer26】树的子结构(递归)

  • 发表了文章 2022-04-28

    【PyTorch基础教程23】可视化网络和训练过程

  • 发表了文章 2022-04-28

    【AI基础】bias和variance的奇妙关系

  • 发表了文章 2022-04-28

    【LeetCode剑指offer04】二维数组中的查找(简单数学)

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息