吃果冻不吐果冻皮_社区达人页

个人头像照片
吃果冻不吐果冻皮
已加入开发者社区765

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
初入江湖
初入江湖

成就

已发布259篇文章
5条评论
已回答0个问题
0条评论
已发布0个视频

我关注的人 更多

技术能力

兴趣领域
  • LLM
擅长领域
技术认证

暂时未有相关云产品技术能力~

LLM/LLMOps,公众号:吃果冻不吐果冻皮,LLM教程:https://github.com/liguodongiot/llm-action

暂无精选文章
暂无更多信息

2022年11月

  • 11.01 21:12:52
    发表了文章 2022-11-01 21:12:52

    浅析MySQL索引

    简述MySQL索引 索引是一个单独的、存储在磁盘上的数据库结构,它们包含着对数据表里所有记录的引用指针。使用索引用于快速找出在某个或多个列中有一特定值的行,所有MySQL列类型都可以被索引,对相关列使用索引是提高查询操作速度的最佳途径。
  • 11.01 21:11:58
    发表了文章 2022-11-01 21:11:58

    浅析MD5及其用途

    简介 MD5(Message-Digest Algorithm,对应的中文名为消息摘要算法)是计算机安全领域广泛使用的散列函数(又称哈希算法、摘要算法),可以产生出一个128位(16字节)的散列值(hash value),主要用来确保信息(message)传输完整和一致。常见的应用场景有密码保护、下载文件校验等。
  • 11.01 21:11:18
    发表了文章 2022-11-01 21:11:18

    Maven常用命令小结

    简述 Maven 是一个项目管理工具,可以对 Java 项目进行构建、依赖管理。Maven 也可被用于构建和管理其它各种项目,例如:C#,Ruby,Scala和其它语言编写的项目。
  • 11.01 21:10:36
    发表了文章 2022-11-01 21:10:36

    聊聊MLOps是什么,它对算法工程师带来了什么

    数据科学(和机器学习)所面临的挑战 毫无疑问,这个时代属于人工智能(AI),这导致机器学习在几乎每个领域的使用,试图解决医疗保健、商业领域和技术领域的不同类型的问题,可以说机器学习无处不在。 同时,开源软件(OSS)和基于云的分布式计算也促使了许多工具、技术和算法的出现,而开发机器学习模型来解决问题并不是挑战,真正的挑战在于如何管理这些模型及大规模数据。
  • 11.01 21:09:40
    发表了文章 2022-11-01 21:09:40

    如何将模型可视化工具Netron改造为通用的WEB服务(Flask)?

    很多时候,我们需要复现人家的工程。因此,需要了解人家的网络结构。但不同框架之间可视化网络层方法不一样,这样给研究人员造成了很大的困扰。模型可视化工具Netron很好的解决了上述问题。Netron是微软小哥lutzroeder的一个广受好评的开源项目。目前,Netron支持各种主流机器学习、深度学习框架的模型结构可视化工作。
  • 11.01 21:08:49
    发表了文章 2022-11-01 21:08:49

    修改Git提交历史中的author,email和name等信息

    在我们日常工作中,通常由于某种原因,需要更新历史提交的commit信息。一般会有如下几种场景: 修改当前分支最新 commit 的提交信息 修改当前分支某历史commit的提交信息 修改当前分支所有提交的commit信息
  • 11.01 21:05:40
    发表了文章 2022-11-01 21:05:40

    MySQL数据库SQL使用规范

    DML语句规范 【推荐】写完SQL先explain查看执行计划 日常开发写 SQL 的时候,尽量养成这个好习惯呀:写完 SQL 后,用 explain 分析一下,尤其注意走不走索引。
  • 11.01 21:05:08
    发表了文章 2022-11-01 21:05:08

    sklearn中分类模型评估指标(四):Jaccard相似系数、铰链损失、对数损失

    Jaccard相似系数 jaccard_score函数计算标签集对之间的 Jaccard 相似系数的平均值,也称为 Jaccard 指数。 第 i 个样本的 Jaccard 相似系数,具有真实标签集yiy_iyi​和预测标签集y^i\hat{y}_iy^​i​,其公式定义为:
  • 11.01 21:04:35
    发表了文章 2022-11-01 21:04:35

    如何制作一个Python SDK并实现私服上传下载

    在我们日常工作中,经常需要与上下游交互,特别是当我们做一些基础服务时,需要提供个其他部门使用,因此,需要编写相应的SDK上传至公司私服,供其他部门使用。今天,果冻就来和大家一起实现一个简单的Python SDK,并进行私服的上传和下载。
  • 11.01 21:03:50
    发表了文章 2022-11-01 21:03:50

    快速入门Pandas(一):简述、创建对象及查看数据

    Pandas简介 Pandas是基于NumPy的一个数据处理工具,该工具是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
  • 11.01 21:02:02
    发表了文章 2022-11-01 21:02:02

    sklearn中分类模型评估指标(二):Kappa系数、混淆矩阵、分类指标报告、汉明损失

    混淆矩阵 confusion_matrix函数通过计算每一行对应于真实类别的混淆矩阵来评估分类准确率。 根据定义,混淆矩阵中的条目[i,j]是实际上在类 i 中,但预测在类 j 中的数量。
  • 11.01 21:01:12
    发表了文章 2022-11-01 21:01:12

    人工智能系统(二):技术栈

    人工智能系统的目的 提供更加高效的编程语言、框架和工具。 更具表达能力和简洁的神经网络计算原语和编程语言 更直观的编辑、调试和实验工具
  • 11.01 21:00:32
    发表了文章 2022-11-01 21:00:32

    人工智能系统(一):概述(下)

    什么人工智能和人工智能系统 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。1956年由约翰.麦卡锡首次提出,当时的定义为“制造智能机器的科学与工程”。人工智能的目的就是让机器能够像人一样思考,让机器拥有智能。 人工智能是计算机科学的一个分支。时至今日,人工智能已经扩展为一门交叉学科。
  • 11.01 21:00:25
    发表了文章 2022-11-01 21:00:25

    人工智能系统(一):概述(上)

    什么人工智能和人工智能系统 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。1956年由约翰.麦卡锡首次提出,当时的定义为“制造智能机器的科学与工程”。人工智能的目的就是让机器能够像人一样思考,让机器拥有智能。 人工智能是计算机科学的一个分支。时至今日,人工智能已经扩展为一门交叉学科。
  • 11.01 20:57:18
    发表了文章 2022-11-01 20:57:18

    MySQL调优指南(持续更新)

    MySQL数据库优化通常有如下四个维度:硬件、系统配置、数据库表结构、SQL及索引。
  • 11.01 20:52:24
    发表了文章 2022-11-01 20:52:24

    解决在Docker或者Kubernetes中使用PyTorch训练深度学习模型共享内存不足的问题

    异常信息 ERROR: Unexpected bus error encountered in worker. This might be caused by insufficient shared memory (shm) 问题原因
  • 11.01 20:51:34
    发表了文章 2022-11-01 20:51:34

    Kubernetes常用命令大全(持续更新)(下)

    create 根据文件或标准输入(stdin)创建资源。
  • 11.01 20:51:08
    发表了文章 2022-11-01 20:51:08

    Kubernetes常用命令大全(持续更新)(上)

    create 根据文件或标准输入(stdin)创建资源。
  • 11.01 20:49:47
    发表了文章 2022-11-01 20:49:47

    浅析特征数据离散化的几种方法(下)

    什么是离散化? 离散化就是把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。例如:
  • 11.01 20:49:41
    发表了文章 2022-11-01 20:49:41

    浅析特征数据离散化的几种方法(上)

    什么是离散化? 离散化就是把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。例如:
  • 11.01 20:47:35
    发表了文章 2022-11-01 20:47:35

    sklearn中针对不同分类场景模型评估指标函数概述

    在sklearn中,sklearn.metrics 模块下实现了一些损失、评分和实用函数来衡量分类性能。某些指标可能需要正类(positive class)、置信度值(confidence values)或二元决策值(binary decisions values)的概率估计。并且大多数函数都实现了允许每个样本通过 sample_weight 参数提供对总分的加权贡献。 下面我们就来简单介绍下sklearn针对不同分类场景实现的模型评估指标函数。
  • 11.01 20:46:43
    发表了文章 2022-11-01 20:46:43

    对离散特征进行数据预处理:独热编码、标签编码及二值化

    使用机器学习时,会存在不同的特征类型:连续型特征和离散型特征。 针对连续性特征,我们通常将其线性缩放到[-1, 1]区间或者缩放到均值为0,方差为1的范围。 但是,特征并不总是连续值,而有可能是分类值、离散值。因此,我们也需要对离散值进行特征编码数据预处理。
  • 11.01 20:45:29
    发表了文章 2022-11-01 20:45:29

    浅述Elasticsearch开发规范指南(持续更新)(下)

    Elasticsearch 是一款流行的分布式开源搜索和数据分析引擎,具备高性能、易扩展、容错性强等特点。它强化了 Apache Lucene 的搜索能力,把掌控海量数据索引和查询的方式提升到一个新的层次。 本文将根据ElasticSearch的特点和日常开发中的经验,整理了在日常使用ElasticSearch进行开发的一些最佳实践。
  • 11.01 20:45:23
    发表了文章 2022-11-01 20:45:23

    浅述Elasticsearch开发规范指南(持续更新)(上)

    Elasticsearch 是一款流行的分布式开源搜索和数据分析引擎,具备高性能、易扩展、容错性强等特点。它强化了 Apache Lucene 的搜索能力,把掌控海量数据索引和查询的方式提升到一个新的层次。 本文将根据ElasticSearch的特点和日常开发中的经验,整理了在日常使用ElasticSearch进行开发的一些最佳实践。
  • 11.01 20:43:30
    发表了文章 2022-11-01 20:43:30

    浅析sklearn中的Pipeline

    为什么需要Pipeline? 在日常机器学习项目开发中,可能会经过数据缩放、特征组合以及模型学习拟合等过程;并且,当问题更为复杂时,所应用到的算法以及模型则较为繁杂。
  • 11.01 20:42:34
    发表了文章 2022-11-01 20:42:34

    图解缓存击穿、缓存穿透、缓存雪崩的区别

    在实际开发中会面临的缓存异常可能会出现三个问题,分别是缓存雪崩、缓存击穿和缓存穿透。这三个问题会导致大量请求从缓存转移到数据库,如果请求的并发量很大的话,就会导致数据库崩溃。那么,我们应该如何来应对呢? 下面就针对每种情况,提供相应的解决方案
  • 11.01 20:41:45
    发表了文章 2022-11-01 20:41:45

    浅述解决数据不平衡的几种方案

    数据处理 过采样 由于样本比例不均衡,在条件允许的情况下,可以尝试主动获取占比少的类型的样本数据。 也可以通过使用重复、自举或合成少数类]等方法(SMOTE)来生成新的稀有样品。
  • 11.01 20:41:19
    发表了文章 2022-11-01 20:41:19

    一文读懂Python进程间通信的几种方式

    为什么进程之间需要通信? 1.数据传输 一个进程需要将它的数据发送给另一个进程; 2.资源共享 多个进程之间共享同样的资源;
  • 11.01 20:39:51
    发表了文章 2022-11-01 20:39:51

    浅析Python的进程、线程与协程(下)

    进程 进程是指在系统中正在运行的一个应用程序,是CPU的最小工作单元。 进程有就绪、运行、阻塞、创建和退出五种状态。其中,运行中的三种状态:就绪、运行、阻塞。创建和退出是描述产生和释放的状态。
  • 11.01 20:39:37
    发表了文章 2022-11-01 20:39:37

    浅析Python的进程、线程与协程(上)

    进程 进程是指在系统中正在运行的一个应用程序,是CPU的最小工作单元。 进程有就绪、运行、阻塞、创建和退出五种状态。其中,运行中的三种状态:就绪、运行、阻塞。创建和退出是描述产生和释放的状态。
  • 11.01 20:38:02
    发表了文章 2022-11-01 20:38:02

    一分钟明白IO密集型与CPU密集型的区别

    CPU密集型 CPU密集型也叫计算密集型,指的是系统的硬盘、内存性能相对CPU要好很多,此时,系统运作CPU读写IO(硬盘/内存)时,IO可以在很短的时间内完成,而CPU还有许多运算要处理,因此,CPU负载很高。
  • 11.01 20:37:33
    发表了文章 2022-11-01 20:37:33

    浅述几种文本和图像数据增强的方法

    在现实场景中,我们往往收集不到太多的数据,那么为了扩大数据集,可以采用数据增强手段来增加样本,那么平常我们应该怎么做数据增强的呢? 什么是数据增强 数据增强也叫数据扩增,意思是在不实质性的增加数据的情况下,让有限的数据产生等价于更多数据的价值。
  • 11.01 20:37:01
    发表了文章 2022-11-01 20:37:01

    浅述Hadoop YARN

    MRv1 存在的缺点 JobTracker容易存在单点故障 JobTracker负担重,既要负责资源管理,又要进行作业调度;当需处理太多任务时,会造成过多的资源消耗。
  • 11.01 20:36:17
    发表了文章 2022-11-01 20:36:17

    HDFS的副本放置策略及机架感知

    副本放置策略的基本思想是: 第一个block副本放在和client所在的node里(如果client不在集群范围内,则这第一个node是随机选取的,当然系统会尝试不选择哪些太满或者太忙的node)。 第二个副本放置在与第一个节点不同的机架中的node中(随机选择)。 第三个副本和第二个在同一个机架,随机放在不同的node中。
  • 11.01 20:34:29
    发表了文章 2022-11-01 20:34:29

    浅析分布式服务架构-CAP理论

    基本概念 一致性(C,Consistency) :在分布式系统中的所有数据备份,在同一时刻,是否同样的值。 可用性(A,Availability) :在集群中,一部分节点故障后,集群整体是否还能响应客户端的读写请求。(对数据更新具备高可用性) 分区容忍性(P,Partition tolerance) :在遇到任何网络分区故障的时候,仍然能够保证对外提供满足一致性和可用性的服务,除非是整个网络环境都发生了故障。(即在节点间通信失败时,保证系统不受影响)
  • 11.01 20:33:59
    发表了文章 2022-11-01 20:33:59

    三分钟搞定如何使用Java创建可靠的线程池

    JDK1.5以前,创建线程是通过继承Thread,但是继承Thread存在如下弊端: 每次new Thread的时候都需要新建一个线程,性能差 线程缺乏统一管理,可能无限制的新建线程,相互竞争,有可能占用过多系统资源导致死机或者OOM Thread类缺少更多功能,比如更多的执行、定期执行、线程中断。
  • 11.01 20:31:53
    发表了文章 2022-11-01 20:31:53

    多标签分类场景下的模型评估指标

    指标在机器学习或深度学习领域扮演着相当重要的角色。我们从根据问题选择指标开始,以了解特定模型的基线分数。 在本博客中,我们研究了多标签分类的最佳和最常用的指标,以及它们的不同之处。 接下来,让我们深入了解什么是多标签分类,以防万一您需要它。 如果我们有关于狗的特征的数据,我们可以预测它属于哪个品种和宠物类别。 在物体检测的情况下,多标签分类为我们提供了图像中所有对象的列表,如下图所示。我们可以看到,分类器检测到图像中的 3 个对象。 如果训练对象的总数为 4 个,则可以将其表示成如下列表[1 0 1 1](对应的对象为[狗、人、自行车、卡车])。这种分类被称为多标签分类。
  • 11.01 20:30:47
    发表了文章 2022-11-01 20:30:47

    纯干货!Docker Dockerfile指令大全(下)

    什么是 Dockerfile? Dockerfile 是一个用来构建镜像的文本文件,文本内容包含了一条条构建镜像所需的指令和说明。使用docker build命令,用户可以创建基于基础镜像的自定义镜像。
  • 11.01 20:30:35
    发表了文章 2022-11-01 20:30:35

    纯干货!Docker Dockerfile指令大全(上)

    什么是 Dockerfile? Dockerfile 是一个用来构建镜像的文本文件,文本内容包含了一条条构建镜像所需的指令和说明。使用docker build命令,用户可以创建基于基础镜像的自定义镜像。
  • 11.01 20:27:59
    发表了文章 2022-11-01 20:27:59

    Docker常用命令大全(持续更新)(上)

    run 创建一个新的容器。
  • 11.01 20:26:00
    发表了文章 2022-11-01 20:26:00

    代理模式和装饰器模式的区别

    让别人帮助你做你并不关心的事情,叫代理模式,样例:透过Spring AOP来深入理解代理模式 为让自己的能力增强,使得增强后的自己能够使用更多的方法,拓展在自己基础之上的功能的,叫装饰器模式,样例:装饰器模式(Java)
  • 11.01 20:25:30
    发表了文章 2022-11-01 20:25:30

    状态模式和策略模式的区别与联系

    UML 状态模式是策略模式的孪生兄弟,是因为它们的UML图是一样的。但意图却完全不一样,策略模式是让用户指定更换的策略算法,而状态模式是状态在满足一定条件下的自动更换,用户无法指定状态,最多只能设置初始状态。
  • 11.01 20:24:51
    发表了文章 2022-11-01 20:24:51

    通过ECK在Kubernetes上部署ElasticSearch如何添加自定义用户名和密码?

    由于需要通过自动化脚本在k8s上面部署eck和es。由于部署es的时候会对elastic用户随机生成密码,无法提前知道密码。因此,通过bin/elasticsearch-setup-passwords更改密码,在k8s pod显然不太适用,我们需要提前内置自己的用户和密码。 部署ECK

2022年10月

  • 10.31 14:05:02
    发表了文章 2022-10-31 14:05:02

    纯干货!构建Dockfile镜像的十三个最佳实践点

    编写.dockerignore文件 构建镜像时,Docker需要先准备上下文 ,将所有需要的文件收集到进程中。默认的上下文包含Dockerfile目录中的所有文件,但是,实际上我们并不需要.git目录,.vscode目录、.idea目录等内容。 .dockerignore 的作用和语法类似于 .gitignore,可以忽略一些不需要的文件,这样可以有效加快镜像构建时间,同时减少Docker镜像的大小。
  • 10.31 14:04:09
    发表了文章 2022-10-31 14:04:09

    设计模式概述

    什么是设计模式 设计模式是人们在面对同类型软件工程设计问题所总结出的一些有用经验。 模式不是代码,而是某类问题的通用设计解决方案。他的本质目的是使软件工程在维护性、 扩展性、 变化性、 复杂度方面成O(N)。OO(面向对象)是原则,设计模式是具体方法和工具。
  • 10.31 14:03:02
    发表了文章 2022-10-31 14:03:02

    浅析磁盘常见的性能指标及观测IO性能指标的命令(下)

    磁盘性能指标说明 衡量磁盘性能常见的指标有: 使用率、饱和度、IOPS、吞吐量以及响应时间,具体说明如下: 使用率,是指磁盘处理 I/O 的时间百分比。过高的使用率(比如超过 80%),通常意味着磁盘 I/O 存
  • 10.31 14:02:54
    发表了文章 2022-10-31 14:02:54

    浅析磁盘常见的性能指标及观测IO性能指标的命令(上)

    磁盘性能指标说明 衡量磁盘性能常见的指标有: 使用率、饱和度、IOPS、吞吐量以及响应时间,具体说明如下: 使用率,是指磁盘处理 I/O 的时间百分比。过高的使用率(比如超过 80%),通常意味着磁盘 I/O 存
  • 10.31 14:01:26
    发表了文章 2022-10-31 14:01:26

    一文读懂计算机系统中常见的带宽

    什么是带宽 带宽应用的领域非常多,可以用来标识信号传输的数据传输能力、标识单位时间内通过链路的数据量、标识显示器的显示能力。
  • 发表了文章 2022-11-02

    一个开源模型服务(model serving)指南

  • 发表了文章 2022-11-02

    使用 Seldon Alibi 进行模型监控

  • 发表了文章 2022-11-02

    使用 Seldon Core 服务模型

  • 发表了文章 2022-11-02

    数据漂移检测(二):NLP 和 CV 中的非结构化数据(Arthur)

  • 发表了文章 2022-11-02

    数据漂移检测(一):使用表格数据的多变量漂移(Arthur)

  • 发表了文章 2022-11-02

    使用 Arize 监控非结构化数据(Arize)

  • 发表了文章 2022-11-02

    如何检测文本(NLP)和图像(计算机视觉)数据漂移

  • 发表了文章 2022-11-02

    在 CIFAR-10 数据集上使用最大均值差异(MMD)漂移检测器(Seldon Alibi Detect)(下)

  • 发表了文章 2022-11-02

    在 CIFAR-10 数据集上使用最大均值差异(MMD)漂移检测器(Seldon Alibi Detect)(上)

  • 发表了文章 2022-11-02

    在 IMDB 电影评论数据集上进行文本数据漂移检测(Seldon Alibi Detect)(4)

  • 发表了文章 2022-11-02

    在 IMDB 电影评论数据集上进行文本数据漂移检测(Seldon Alibi Detect)(3)

  • 发表了文章 2022-11-02

    在 IMDB 电影评论数据集上进行文本数据漂移检测(Seldon Alibi Detect)(2)

  • 发表了文章 2022-11-02

    在 IMDB 电影评论数据集上进行文本数据漂移检测(Seldon Alibi Detect)(1)

  • 发表了文章 2022-11-02

    机器学习模型监控工具:Evidently 与 Seldon Alibi 对比

  • 发表了文章 2022-11-02

    DLOps:用于深度学习的 MLOps(Valohai)

  • 发表了文章 2022-11-02

    监控生产中的ML系统,您应该跟踪哪些指标?(下)

  • 发表了文章 2022-11-02

    监控生产中的ML系统,您应该跟踪哪些指标?(中)

  • 发表了文章 2022-11-02

    监控生产中的ML系统,您应该跟踪哪些指标?(上)

  • 发表了文章 2022-11-02

    你的模型隐藏了什么? 一个评估 ML 模型的教程(Evidently)(下)

  • 发表了文章 2022-11-02

    你的模型隐藏了什么? 一个评估 ML 模型的教程(Evidently)(上)

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息