小窗幽记机器学习_社区达人页
产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
备案
控制台
开发者社区
首页
探索云世界
探索云世界
云上快速入门,热门云上应用快速查找
了解更多
问产品
动手实践
考认证
TIANCHI大赛
活动广场
活动广场
丰富的线上&线下活动,深入探索云世界
任务中心
做任务,得社区积分和周边
高校计划
让每位学生受益于普惠算力
训练营
资深技术专家手把手带教
话题
畅聊无限,分享你的技术见解
开发者评测
最真实的开发者用云体验
乘风者计划
让创作激发创新
阿里云MVP
遇见技术追梦人
直播
技术交流,直击现场
下载
下载
海量开发者使用工具、手册,免费下载
镜像站
极速、全面、稳定、安全的开源镜像
技术资料
开发手册、白皮书、案例集等实战精华
插件
为开发者定制的Chrome浏览器插件
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
Modelscope模型即服务
弹性计算
云原生
数据库
物联网
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
小窗幽记机器学习
已加入开发者社区
1794
天
勋章
更多
专家博主
专家博主
星级博主
星级博主
技术博主
技术博主
江湖新秀
江湖新秀
成就
已发布68篇文章
5条评论
已回答0个问题
0条评论
已发布0个视频
github地址
我关注的人
更多
开发者社区
开发者社区
小窗幽记机器学习
小窗幽记机器学习
阿里云大数据Al技术
阿里云大数据Al技术
天烬
天烬
爪哇缪斯
爪哇缪斯
飞天战略营
飞天战略营
我是管理员
我是管理员
智能引擎技术
智能引擎技术
PolarDB-Learning-helper
PolarDB-Learning-helper
技术小达人
技术小达人
技术小能手
技术小能手
云栖小秘书
云栖小秘书
粉丝
更多
gwsa4liuffryy
gwsa4liuffryy
bwarzq3et4kgc
bwarzq3et4kgc
修陈
修陈
游客trpuk64ftxpoi
游客trpuk64ftxpoi
1445594435564102
1445594435564102
mocoti
mocoti
游客khjc2hezyrpim
游客khjc2hezyrpim
牛牧之
牛牧之
游客hzmz5556bnkvc
游客hzmz5556bnkvc
游客mtjxeni2b4mxm
游客mtjxeni2b4mxm
lj4pyrbfxe2vs
lj4pyrbfxe2vs
技术能力
兴趣领域
擅长领域
技术认证
暂时未有相关云产品技术能力~
小伙伴们好,我是微信公众号《小窗幽记机器学习》的作者,我也会在阿里云开发者社区记录机器学习过程中的点点滴滴和坑坑洼洼。后续会持续整理模型加速、模型部署、模型压缩、LLM、AI艺术等系列专题,敬请关注。
精选
高分内容
最新动态
文章
问答
视频
暂无精选文章
暂无更多信息
2023年07月
07.15
13:57:10
发表了文章
2023-07-15 13:57:10
LLM系列 | 20:Claude2剑指ChatGPT,长文档问答,真香!
亲测Claude2的效果,长文档问答效果惊艳!
07.09
11:06:41
发表了文章
2023-07-09 11:06:41
LLM系列 | 19: ChatGPT应用框架LangChain实践速成
本文以实践的方式将OpenAI接口、ChatOpenAI接口、Prompt模板、Chain、Agent、Memory这几个LangChain核心模块串起来,从而希望能够让小伙伴们快速地了解LangChain的使用。
07.05
23:05:04
发表了文章
2023-07-05 23:05:04
LLM 系列 | 18:如何基于LangChain打造联网版ChatGPT?
今天这篇小作文是LangChain实践专题的第2篇,简单介绍LangChain的用途及如何利用LangChain将ChatGPT和搜索引擎(Google)结合起来,从而实现一个极简的联网版ChatGPT。
2023年06月
06.29
22:53:28
发表了文章
2023-06-29 22:53:28
LLM 系列 | 17:如何用LangChain做长文档问答?
本文作为LangChain专题的开篇,以长文档问答为例介绍如何使用LangChain。
06.29
22:51:59
发表了文章
2023-06-29 22:51:59
LLM系列 | 16: 构建端到端智能客服
本文将综合之前多篇文章搭建一个带评估功能的**端到端智能客服系统**。整体流程大致如下: 检查输入,看看用户输入的query是否能够通过审核API;抽取出商品和对应的类别;抽取出商品信息;模型根据商品信息回答用户问题;将模型的回复输入审核API对回复进行审核。
06.29
22:46:19
发表了文章
2023-06-29 22:46:19
LLM系列 | 15: 如何链接多个Prompt处理复杂任务?以智能客服为例
今天这篇小作文以智能客服场景为例,介绍如何通过将复杂任务拆分为一系列简单的子任务来链接多个Prompts
06.24
09:15:36
发表了文章
2023-06-24 09:15:36
LLM系列 | 14: 实测OpenAI函数调用功能:以数据库问答为例
今天这篇小作文以数据库问答(Text2SQL)为例进一步介绍ChatGPT的函数调用。本文将介绍如何将模型生成的结果输入到自定义的函数中,并利用该功能实现数据库问答功能。
06.23
15:00:23
发表了文章
2023-06-23 15:00:23
模型部署专题 | 02 :BERT-Tensorflow模型部署(CPU版和GPU版)
介绍如何用Tensorflow部署BERT模型,包括CPU版和GPU版
06.23
14:55:22
发表了文章
2023-06-23 14:55:22
机器学习系列 | 04: 知识图谱发展历程及其分类
本文简要梳理知识图谱的前世今生及其分类
06.23
14:50:29
发表了文章
2023-06-23 14:50:29
机器学习系列 | 03:从朴素贝叶斯和HMM说起
本系列博文尝试系统化地梳理概率图模型。本文以朴素贝叶斯和HMM为切入点尝试窥探概率图模型一二。
06.23
14:36:18
发表了文章
2023-06-23 14:36:18
使用BERT对句子进行向量化(TensorFlow版和Pytorch版)
本文分别以TensorFlow版和Pytorch版对BERT的句子进行向量化
06.23
14:29:55
发表了文章
2023-06-23 14:29:55
Python应用专题 | 23:Pandas中两个dataframe的交集和差集
如何求Pandas中两个dataframe的交集和差集?
06.23
14:25:28
发表了文章
2023-06-23 14:25:28
Python应用专题 | 22:pandas 两列数据合并
如何合并 pandas 两列数据?
06.23
14:23:56
发表了文章
2023-06-23 14:23:56
Python应用专题 | 21 :按照len长度过滤pandas中值为list类型的数据
pandas中对于值为list的数据,如果想要根据list的长度进行过滤,如何操作?
06.23
14:21:47
发表了文章
2023-06-23 14:21:47
Python应用专题 | 20:pandas列值根据字典批量替换
当DataFrame数据中一列的值需要根据某个字典批量映射为字典中的value,该如何操作?
06.23
14:15:04
发表了文章
2023-06-23 14:15:04
Python应用专题 | 19:获取list中Top K个值对应的索引
如何获取list中Top K个值对应的索引?
06.23
14:02:54
发表了文章
2023-06-23 14:02:54
Python应用专题 | 18:过滤掉list中被其他元素所包含的元素
介绍如何过滤掉list中被其他元素所包含的元素
06.23
13:58:46
发表了文章
2023-06-23 13:58:46
Python应用专题 | 17:根据子字符列表过滤掉给定列表
根据子字符列表过滤掉给定列表,从而实现数据的筛查或者去除
06.23
13:55:50
发表了文章
2023-06-23 13:55:50
Python应用专题 | 16: pandas中2个nan值为何不同
主要介绍 pandas中2个nan值为何不同?
06.23
13:54:01
发表了文章
2023-06-23 13:54:01
Python应用专题 | 15:获取list中出现频数最多的元素
给定一个列表,找到其中最高频的元素?本文以代码的角度进行介绍。
06.23
13:51:44
发表了文章
2023-06-23 13:51:44
Python应用专题 | 14:pandas分组之后对相同group内的字段进行合并
本文主要介绍在pandas中对数据进行分组后,如何对相同组的数据进行其他字段的合并。类似场景:有2个字段,分别是文本内容和标签值。先根据文本内容进行分组,再对同一个组内的标签值进行合并,从而得到多标签值。
06.23
13:49:14
发表了文章
2023-06-23 13:49:14
Python应用专题 | 13:将标签转为onehot形式
在做文本分类的时候,常常需要将标签转为one-hot的数值形式,本文主要从代码的角度介绍该操作。
06.23
13:46:36
发表了文章
2023-06-23 13:46:36
Pytorch使用专题 | 2 :Pytorch中数据读取-Dataset、Dataloader 、TensorDataset 和 Sampler 的使用
介绍Pytorch中数据读取-Dataset、Dataloader 、TensorDataset 和 Sampler 的使用
06.23
13:43:29
发表了文章
2023-06-23 13:43:29
Python应用专题 | 12:用 multiprocessing 处理海量任务
面对海量任务需要高效对其进行消费,而任务之间不存在处理结果的相互依赖,这时可以尝试使用multiprocessing。
06.23
13:40:40
发表了文章
2023-06-23 13:40:40
Python应用专题 | 11:如何释放字典的内存占用?
构建一个大字典,并往其中增减元素,但是发现整体的内存消耗并没有因此而维持稳定状态,而是不断增加。本文尝试定位该问题,并解决。
06.23
13:37:35
发表了文章
2023-06-23 13:37:35
Pytorch使用专题 | 1:torch.nn.functional.cosine_similarity使用详解
介绍torch.nn.functional.cosine_similarity的使用
06.23
11:58:44
发表了文章
2023-06-23 11:58:44
机器学习系列 | 02:聚类算法指标整理
本文主要整理记录聚类算法指标,以供参考
06.23
11:51:46
发表了文章
2023-06-23 11:51:46
Python应用专题 | 10:pandas中分隔符由多个字符组成
在使用pandas过程由于文本中存在形如`,` 、`|` 等常规字符,所以需要自定义分隔符,特别是自定义由多个字符组成的分隔符。那么此时在使用 pandas.read_csv()的时候要如何设置?
06.23
11:49:18
发表了文章
2023-06-23 11:49:18
Python应用专题 | 9:Pandas中数据去重
在数据处理过程中常常会遇到重复的问题,这里简要介绍遇到过的数据重复问题及其如何根据具体的需求进行处理。
06.23
11:46:54
发表了文章
2023-06-23 11:46:54
Python应用专题 | 8:字典内存释放及其浅拷贝和深拷贝之间的区别
本文主要介绍字典内存释放及其浅拷贝和深拷贝之间的区别
06.23
11:43:39
发表了文章
2023-06-23 11:43:39
Python应用专题 | 7:pandas中列方向字符统计及其合并
主要介绍如何统计pandas中列方向字符及其合并
06.23
11:41:59
发表了文章
2023-06-23 11:41:59
Python应用专题 | 6:基于pandas统计某一列字符串中各个word出现的频率
如果pandas中某一列是字符串,想要统计该列字符串分词结果后各词出现的词频。
06.23
11:38:41
发表了文章
2023-06-23 11:38:41
模型部署专题 | 01:基于Triton Server部署BERT模型
本文简要介绍如何使用 Triton 部署 BERT模型
06.23
11:32:08
发表了文章
2023-06-23 11:32:08
开发专题 | 2:如何在 docker 容器内部运行 docker命令
有些场景在容器内部需要调用 `docker` 命令。为此,本文梳理2种可以在容器内部执行`docker`命令的方法。
06.23
11:24:17
发表了文章
2023-06-23 11:24:17
Python应用专题 | 5:Python多进程处理数据
本文介绍如何使用多进程的方式高效处理海量任务数据
06.23
11:21:25
发表了文章
2023-06-23 11:21:25
Python应用专题 | 4:python3中如何对二维数组求最大值
python3中如何对二维数组求最大值
06.23
11:16:00
发表了文章
2023-06-23 11:16:00
开发专题 | 1 :下载 huggingface 上模型的正确姿势
本文主要介绍如何以正确的方式下载 huggingface 上的模型
06.23
11:09:55
发表了文章
2023-06-23 11:09:55
Python应用专题 | 3:python读取文件由于编码问题失败汇总
汇总Python读取文件过程中常见的一些问题及其解决方法
06.22
22:54:55
发表了文章
2023-06-22 22:54:55
机器学习系列 | 01:多类别分类任务(multi-class)中为何precision,recall和F1相等?
在 multi-class 分类任务中,如果使用 micro 类指标,那么 micro-precision, micro-recall和micro-F1值都是相等的。本文主要针对这个现象进行解释。
06.22
22:48:44
发表了文章
2023-06-22 22:48:44
论文解读系列| 06:【NER】LatticeLSTM模型详解
Lattice LSTM模型是基于词汇增强方法的中文NER的开篇之作。在该模型中,使用了字符信息和所有词序列信息,具体地,当我们通过词汇信息(词典)匹配一个句子时,可以获得一个类似Lattice的结构。这种方式可以避免因分词错误导致实体识别错误,在中文NER任务上有显著效果。
06.22
22:43:02
发表了文章
2023-06-22 22:43:02
论文解读系列| 05:【NER】SoftLexicon模型详解
SoftLexicon是一种简单而有效的将词汇信息纳入字符表示的方法。这种方法避免设计复杂的序列建模结构,并且对于任何NER模型,它只需要细微地调整字符表示层来引入词典信息。在4个中文NER基准数据集上的实验结果表明,该方法的推理速度比现有SOTA方法快6.15倍,性能更好。
06.22
22:38:07
发表了文章
2023-06-22 22:38:07
论文解读系列| 04:【NER】FLAT模型详解
FLAT也是一种将词汇信息融入character-based模型的解决方案。有2个创新点(1)将lattice结构转为由spans组成的平铺结构,每个span可以是字符或者词及其在原始lattice结构中的位置;(2)基于Transformer设计了一种巧妙position encoding来充分利用lattice结构信息,从而无损地引入词汇信息。
06.22
22:31:09
发表了文章
2023-06-22 22:31:09
论文解读系列| 03:【NER】FGN模型详解
汉字作为象形文字有其潜在的特殊字形信息,而这一点经常被忽视。FGN是一种将字形信息融入网络结构的中文NER方法。除了用一个新型CNN对字形信息进行编码外,该方法可以通过融合机制提取字符分布式表示和字形表示之间的交互信息。
06.22
22:23:04
发表了文章
2023-06-22 22:23:04
论文解读系列| 02:【NER】MarkBERT
MarkBERT 是一种考虑如何将词信息引入到模型的NER方案。MarkBERT基于字的模型,但巧妙地将词的边界信息融入模型,具体操作是将词之间插入边界marker。出现边界marker意味着前一个字符是词的尾部字符,而紧接着的字符是另一个词的起始字符。如此可以统一处理所有词,不存在词的OOV问题。
06.22
22:17:55
发表了文章
2023-06-22 22:17:55
论文解读系列 | 01:【NER】W2NER (AAAI 2022)
2022 AAAI论文《Unified Named Entity Recognition as Word-Word Relation Classification》介绍了一个统一NER的SOTA模型W2NER,该模型在14个包含**扁平实体、重叠实体和非连续**实体的数据集(8个英文 + 6个中文)上,均取得了**SOTA**的结果(F1指标)。W2NER将NER问题视为词词关系分类,为此引入两种词词关系:NNW(Next-Neighboring-Word)和 THW-\*(Tail-Head-Word-\*)。具体而言,构造一个 2D 的词词关系网格。
06.22
22:07:03
发表了文章
2023-06-22 22:07:03
模型推理加速系列 | 01:如何用ONNX加速BERT特征抽取(附代码)
本次实验目的在于介绍如何使用ONNXRuntime加速BERT模型推理。实验中的任务是利用BERT抽取输入文本特征,至于BERT在下游任务(如文本分类、问答等)上如何加速推理,后续再介绍。
06.22
22:01:56
发表了文章
2023-06-22 22:01:56
模型推理加速系列 | 02:如何用ONNX加速BERT特征抽取-part2(附代码)
本文紧接之前的一篇文章如何用ONNX加速BERT特征抽取,继续介绍如何用ONNX+ONNXRuntime来加速BERT模型推理。
06.22
11:44:28
发表了文章
2023-06-22 11:44:28
模型推理加速系列 | 03:Pytorch模型量化实践并以ResNet18模型量化为例(附代码)
本文主要简要介绍Pytorch模型量化相关,并以ResNet18模型为例进行量化实践。
06.22
11:25:31
发表了文章
2023-06-22 11:25:31
模型推理加速系列 | 04:BERT加速方案对比 TorchScript vs. ONNX
本文以 BERT-base 的为例,介绍2种常用的推理加速方案:ONNX 和 TorchScript,并实测对比这两种加速方案与原始Pytorch模型格式的inference性能。
1
2
跳转至:
发表了文章
2023-07-15
LLM系列 | 20:Claude2剑指ChatGPT,长文档问答,真香!
发表了文章
2023-07-09
LLM系列 | 19: ChatGPT应用框架LangChain实践速成
发表了文章
2023-07-05
LLM 系列 | 18:如何基于LangChain打造联网版ChatGPT?
发表了文章
2023-06-29
LLM 系列 | 17:如何用LangChain做长文档问答?
发表了文章
2023-06-29
LLM系列 | 16: 构建端到端智能客服
发表了文章
2023-06-29
LLM系列 | 15: 如何链接多个Prompt处理复杂任务?以智能客服为例
发表了文章
2023-06-24
LLM系列 | 14: 实测OpenAI函数调用功能:以数据库问答为例
发表了文章
2023-06-23
模型部署专题 | 02 :BERT-Tensorflow模型部署(CPU版和GPU版)
发表了文章
2023-06-23
机器学习系列 | 04: 知识图谱发展历程及其分类
发表了文章
2023-06-23
机器学习系列 | 03:从朴素贝叶斯和HMM说起
发表了文章
2023-06-23
使用BERT对句子进行向量化(TensorFlow版和Pytorch版)
发表了文章
2023-06-23
Python应用专题 | 23:Pandas中两个dataframe的交集和差集
发表了文章
2023-06-23
Python应用专题 | 22:pandas 两列数据合并
发表了文章
2023-06-23
Python应用专题 | 21 :按照len长度过滤pandas中值为list类型的数据
发表了文章
2023-06-23
Python应用专题 | 20:pandas列值根据字典批量替换
发表了文章
2023-06-23
Python应用专题 | 19:获取list中Top K个值对应的索引
发表了文章
2023-06-23
Python应用专题 | 18:过滤掉list中被其他元素所包含的元素
发表了文章
2023-06-23
Python应用专题 | 17:根据子字符列表过滤掉给定列表
发表了文章
2023-06-23
Python应用专题 | 16: pandas中2个nan值为何不同
发表了文章
2023-06-23
Python应用专题 | 15:获取list中出现频数最多的元素
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息
勋章
关注
粉丝