算法码上来_社区达人页

个人头像照片
算法码上来
已加入开发者社区682
勋章 更多
个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
江湖侠士
江湖侠士
成就
已发布366篇文章
6条评论
已回答0个问题
0条评论
已发布0个视频
github地址
我关注的人 更多
技术能力
兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

暂无个人介绍
暂无精选文章
暂无更多信息

2023年05月

2022年06月

  • 06.26 08:11:42
    发表了文章 2022-06-26 08:11:42

    论文赏析[EMNLP19]如何在Transformer中融入句法树信息?这里给出了一种解决方案(二)

    之前其实有很多工作将句法信息融入到了RNN中,例如ON-LSTM和PRPN,用来隐式建模句法结构信息,同时提升语言模型的准确率。本文尝试将句法信息融入到Transformer中,用来赋予attention更好的解释性。同时可以无监督的预测出句子的句法树,并且相比于一般的Transformer,语言模型的性能有所提高。
  • 06.26 08:10:09
    发表了文章 2022-06-26 08:10:09

    论文赏析[EMNLP19]如何在Transformer中融入句法树信息?这里给出了一种解决方案(一)

    之前其实有很多工作将句法信息融入到了RNN中,例如ON-LSTM和PRPN,用来隐式建模句法结构信息,同时提升语言模型的准确率。本文尝试将句法信息融入到Transformer中,用来赋予attention更好的解释性。同时可以无监督的预测出句子的句法树,并且相比于一般的Transformer,语言模型的性能有所提高。
  • 06.26 08:00:44
    发表了文章 2022-06-26 08:00:44
  • 06.26 07:46:40
    发表了文章 2022-06-26 07:46:40

    手推公式之“层归一化”梯度

    昨天推导了一下交叉熵的反向传播梯度,今天再来推导一下层归一化(LayerNorm),这是一种常见的归一化方法
  • 06.26 07:43:38
    发表了文章 2022-06-26 07:43:38

    “交叉熵”反向传播推导

    交叉熵(CrossEntropy)是常见的损失函数,本文详细推导一下它的梯度,面试大厂或者工程实践中都可能会用到。
  • 06.26 07:35:42
    发表了文章 2022-06-26 07:35:42
  • 06.26 07:29:45
    发表了文章 2022-06-26 07:29:45

    最全攻略:利用LightSeq加速你的深度学习模型

    利用LightSeq加速你的深度学习模型
  • 06.26 07:27:06
    发表了文章 2022-06-26 07:27:06

    超简单:mac导出微信聊天记录(附上粉丝群全部聊天记录)

    今天再给大家讲解一下如何直导出mac版本微信的聊天记录,当然如果你没有mac,那可以直接关闭这篇文章了。
  • 06.26 07:22:33
    发表了文章 2022-06-26 07:22:33

    cuBLAS矩阵乘法性能分析(附代码示例)

    矩阵乘法是神经网络中最基础、最重要的一个运算。在用CUDA实现矩阵乘法时,不需要我们手动写,cuBLAS库提供了现成的矩阵乘法算子,例如cublasGemmEx和cublasLtMatmul。其中后者是轻量级版本,API调用更灵活。例如对于整数乘法,cublasLtMatmul支持int8的输入输出,而cublasGemmEx只支持int8输入,int32输出
  • 06.25 22:43:26
    发表了文章 2022-06-25 22:43:26

    如何花式计算20的阶乘?

    如何花式计算20的阶乘?
  • 06.25 22:39:57
    发表了文章 2022-06-25 22:39:57

    我写了14篇文章,总结了《具体数学》常用知识点

    我写了14篇文章,总结了《具体数学》常用知识点
  • 06.25 22:37:13
    发表了文章 2022-06-25 22:37:13

    养成女友?我训练出了一个“杨超越”聊天机器人

    在上一期教程中,我演示了如何从零开始训练一个比较智障的聊天机器人。 从零开始训练一个人工智障女友 但是当时数据量太少,模型简单,完全没法用,只能回复训练集中出现过的句子。 而现在,完全体的聊天机器人终于诞生了,我把它命名为“杨超越”。这次可以随你提问什么了,她都能对答如流!
  • 06.25 22:34:33
    发表了文章 2022-06-25 22:34:33

    从零开始训练一个人工智障女友

    很多人工智能小白可能不知道那些高大上的语音助理、机器翻译或者聊天机器人都是怎么被创造出来的,也不知道一个深度学习模型是怎么从零开始搭建并运行起来的。 今天我就简单教大家如何从零开始搭建一个Transformer模型,并在自己的数据上训练起来。这个教程非常基础,所以训练出来的模型也很傻瓜,适合零基础小白长知识用。
  • 06.25 22:32:01
    发表了文章 2022-06-25 22:32:01

    训练BERT,我只花了一半的时间

    相信很多人都知道Hugging Face,也都用过它的Transformers预训练语言模型,但你们有没有觉得它训练的有点太慢了呢? 这时候,字节第二快的男人要站出来了(第一快是我mentor),手把手教你怎么让训练时间缩短一半。
  • 06.25 22:29:16
    发表了文章 2022-06-25 22:29:16

    恕我直言,你们的模型训练都还不够快

    「任意」PyTorch模型中,都可以用上面的参数连续化技术大大加快训练速度。
  • 06.25 22:25:47
    发表了文章 2022-06-25 22:25:47

    只用几行代码,我让模型『训练』加速了3倍以上!

    只用几行代码,我让模型『训练』加速了3倍以上!
  • 06.25 22:21:37
    发表了文章 2022-06-25 22:21:37

    只用两行代码,我让Transformer推理加速了50倍

    只用两行代码,我让Transformer推理加速了50倍
  • 06.25 22:18:55
    发表了文章 2022-06-25 22:18:55

    熬了几个通宵,我写了份CUDA新手入门代码

    熬了几个通宵,我写了份CUDA新手入门代码
  • 06.25 22:17:05
    发表了文章 2022-06-25 22:17:05

    三分钟教你如何PyTorch自定义反向传播

    三分钟教你如何PyTorch自定义反向传播
  • 06.25 22:15:21
    发表了文章 2022-06-25 22:15:21

    详解PyTorch编译并调用自定义CUDA算子的三种方式

    在上一篇教程中,我们实现了一个自定义的CUDA算子add2,用来实现两个Tensor的相加。然后用PyTorch调用这个算子,分析对比了一下和PyTorch原生加法的速度差异,并且详细解释了线程同步给统计时间带来的影响。
  • 06.25 22:13:17
    发表了文章 2022-06-25 22:13:17

    PyTorch自定义CUDA算子教程与运行时间分析(二)

    最近因为工作需要,学习了一波CUDA。这里简单记录一下PyTorch自定义CUDA算子的方法,写了一个非常简单的example,再介绍一下正确的PyTorch中CUDA运行时间分析方法。
  • 06.25 22:10:04
    发表了文章 2022-06-25 22:10:04

    PyTorch自定义CUDA算子教程与运行时间分析(一)

    最近因为工作需要,学习了一波CUDA。这里简单记录一下PyTorch自定义CUDA算子的方法,写了一个非常简单的example,再介绍一下正确的PyTorch中CUDA运行时间分析方法。
  • 06.25 22:06:40
    发表了文章 2022-06-25 22:06:40

    教你如何用代码自动群发邮件(邮件轰炸机)

    教你如何用代码自动群发邮件(邮件轰炸机)
  • 06.25 22:04:01
    发表了文章 2022-06-25 22:04:01

    推荐几个不错的CUDA入门教程(非广告)

    最近因为项目需要,入坑了CUDA,又要开始写很久没碰的C++了。对于CUDA编程以及它所需要的GPU、计算机组成、操作系统等基础知识,我基本上都忘光了,因此也翻了不少教程。这里简单整理一下,给同样有入门需求的同学们参考一下
  • 06.25 22:02:03
    发表了文章 2022-06-25 22:02:03

    Python常用画图代码(折线图、柱状图、饼图)

    Python常用画图代码(折线图、柱状图、饼图)
  • 06.25 21:57:52
    发表了文章 2022-06-25 21:57:52

    如何自动搜出更好、更小、更快的NLP模型?(二)

    最近读了不少神经架构搜索(NAS)的论文,把NAS的整体脉络大致摸清了。 但是也发现了NAS目前还是用在CV领域居多,NLP领域和移动端优化寥寥无几。因此这里分享几篇NLP或者移动端上的NAS论文。
  • 06.25 21:55:53
    发表了文章 2022-06-25 21:55:53

    如何自动搜出更好、更小、更快的NLP模型?(一)

    最近读了不少神经架构搜索(NAS)的论文,把NAS的整体脉络大致摸清了。 但是也发现了NAS目前还是用在CV领域居多,NLP领域和移动端优化寥寥无几。因此这里分享几篇NLP或者移动端上的NAS论文。
  • 06.25 21:49:54
    发表了文章 2022-06-25 21:49:54

    一文看懂AutoML(三)

    首先这篇综述是讲AutoML的,不单单是NAS,但是因为NAS是AutoML中最最重要的一部分,所以主要篇章还是用来讲NAS了。据作者所说,应该是第一篇完整讲述AutoML整个流程的综述。
  • 06.25 21:45:03
    发表了文章 2022-06-25 21:45:03

    一文看懂AutoML(二)

    首先这篇综述是讲AutoML的,不单单是NAS,但是因为NAS是AutoML中最最重要的一部分,所以主要篇章还是用来讲NAS了。据作者所说,应该是第一篇完整讲述AutoML整个流程的综述。
  • 06.25 21:41:15
    发表了文章 2022-06-25 21:41:15

    一文看懂AutoML(一)

    首先这篇综述是讲AutoML的,不单单是NAS,但是因为NAS是AutoML中最最重要的一部分,所以主要篇章还是用来讲NAS了。据作者所说,应该是第一篇完整讲述AutoML整个流程的综述。
  • 06.25 21:32:19
    发表了文章 2022-06-25 21:32:19

    一文速览EMNLP 2020中的Transformer量化论文

    一文速览EMNLP 2020中的Transformer量化论文
  • 06.25 21:26:19
    发表了文章 2022-06-25 21:26:19

    【LeetCode 327】区间和的个数

    【LeetCode 327】区间和的个数
  • 06.25 21:23:17
    发表了文章 2022-06-25 21:23:17

    【ACL2020】一种新颖的成分句法树序列化方法(二)

    不知不觉在字节跳动实习也快四个月了,在这高强度快节奏的工作生活中,也是收获颇多。然而博客也很久很久没更新过了,论文阅读了那么多,却一直没空写写自己中的这篇。今天趁周末分享一下自己发在今年ACL上的这篇工作,主要贡献就是提出了一种新颖的成分句法树的序列表示方法。建议配合我的PPT阅读,里面有很多例子
  • 06.25 21:20:47
    发表了文章 2022-06-25 21:20:47

    【ACL2020】一种新颖的成分句法树序列化方法(一)

    不知不觉在字节跳动实习也快四个月了,在这高强度快节奏的工作生活中,也是收获颇多。然而博客也很久很久没更新过了,论文阅读了那么多,却一直没空写写自己中的这篇。今天趁周末分享一下自己发在今年ACL上的这篇工作,主要贡献就是提出了一种新颖的成分句法树的序列表示方法。建议配合我的PPT阅读,里面有很多例子。
  • 06.25 21:13:22
    发表了文章 2022-06-25 21:13:22

    【分类汇总】110 天以来的题解分类汇总

    110 天以来的题解分类汇总
  • 06.25 21:10:53
    发表了文章 2022-06-25 21:10:53

    【每日算法Day 109】五大解法,带你深入了解完全背包方案数

    给定数量不限的硬币,币值为 25 分、10 分、5 分和 1 分,编写代码计算 n 分有几种表示法。(结果可能会很大,你需要将结果模上 1000000007)
  • 06.25 21:04:08
    发表了文章 2022-06-25 21:04:08

    【每日算法Day 108】一道简单的二叉树题目,写法还是挺多的。

    给定一棵二叉树,想象自己站在它的右侧,按照从顶部到底部的顺序,返回从右侧所能看到的节点值。
  • 发表了文章 2023-05-30

    三年前写的文章,阅读量暴涨了6.8万。。。

  • 发表了文章 2023-05-30

    只需三分钟,让大家都能体验到AI写文章的乐趣!

  • 发表了文章 2023-05-30

    用了这个技术,我让模型训练和推理快了好几倍

  • 发表了文章 2023-05-30

    手推公式之“层归一化”梯度

  • 发表了文章 2023-05-30

    “交叉熵”反向传播推导

  • 发表了文章 2023-05-30

    当年如果有这个,语文就不会不及格了

  • 发表了文章 2023-05-30

    如何优雅的抢占别人的显卡?

  • 发表了文章 2023-05-30

    这道小学六年级的数学题,恕我直言没几个人会做

  • 发表了文章 2023-05-30

    【白话模型量化系列一】矩阵乘法量化

  • 发表了文章 2023-05-30

    这篇文章是我用AI生成出来的

  • 发表了文章 2023-05-30

    最全攻略:利用LightSeq加速你的深度学习模型

  • 发表了文章 2023-05-30

    昨晚学妹参加了B站秋招笔试,还想考考我?

  • 发表了文章 2023-05-30

    cuBLAS矩阵乘法性能分析(附代码示例)

  • 发表了文章 2023-05-30

    如何花式计算20的阶乘?

  • 发表了文章 2023-05-30

    什么是机器翻译?(科普向)

  • 发表了文章 2023-05-30

    养成女友?我训练出了一个“杨超越”聊天机器人

  • 发表了文章 2023-05-30

    从零开始训练一个人工智障女友

  • 发表了文章 2023-05-30

    如何更好地刷题?谈谈我的一点看法

  • 发表了文章 2023-05-30

    训练BERT,我只花了一半的时间

  • 发表了文章 2023-05-30

    恕我直言,你们的模型训练都还不够快

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息