备案控制台

开发者社区云计算文章正文

ChatGLM2 源码解析：`MLP`

2024-01-25 67

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云解析 DNS，旗舰版 1个月

公共DNS（含HTTPDNS解析），每月1000万次HTTP解析

全局流量管理 GTM，标准版 1个月

简介： ChatGLM2 源码解析：`MLP`

class MLP(torch.nn.Module):
    """MLP.
    MLP will take the input with h hidden state, project it to 4*h
    hidden dimension, perform nonlinear transformation, and project the
    state back into h hidden dimension.
    """
    def __init__(self, config: ChatGLMConfig, device=None):
        super(MLP, self).__init__()
        self.add_bias = config.add_bias_linear
        # Project to 4h. If using swiglu double the output width, see https://arxiv.org/pdf/2002.05202.pdf
        # LL1，最后一维 ES => 4ES
        self.dense_h_to_4h = nn.Linear(
            config.hidden_size,
            config.ffn_hidden_size * 2,
            bias=self.add_bias,
            device=device,
            **_config_to_kwargs(config)
        )
        def swiglu(x):
            x = torch.chunk(x, 2, dim=-1)
            return F.silu(x[0]) * x[1]
        self.activation_func = swiglu
        # LL2，最后一维 4ES => ES
        self.dense_4h_to_h = nn.Linear(
            config.ffn_hidden_size,
            config.hidden_size,
            bias=self.add_bias,
            device=device,
            **_config_to_kwargs(config)
        )
    def forward(self, hidden_states):
        # 输入 -> LL1 -> swiglu -> LL2 -> 输出
        intermediate_parallel = self.dense_h_to_4h(hidden_states)
        intermediate_parallel = self.activation_func(intermediate_parallel)
        output = self.dense_4h_to_h(intermediate_parallel)
        return output

文章标签：

云解析DNS

关键词：

云解析DNS源码

源码云解析DNS

云解析DNS chatglm2

chatglm2源码云解析DNS

布客飞龙

目录

相关文章

喜欢猪猪

|

7天前

|

监控 Java 应用服务中间件

高级java面试---spring.factories文件的解析源码API机制

【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性，极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理，并通过Java代码手写模拟Spring Boot的启动过程，特别是spring.factories文件的解析源码API机制。

喜欢猪猪

23 2 2

小王老师呀

|

7天前

|

存储安全 Linux

Golang的GMP调度模型与源码解析

【11月更文挑战第11天】GMP 调度模型是 Go 语言运行时系统的核心部分，用于高效管理和调度大量协程（goroutine）。它通过少量的操作系统线程（M）和逻辑处理器（P）来调度大量的轻量级协程（G），从而实现高性能的并发处理。GMP 模型通过本地队列和全局队列来减少锁竞争，提高调度效率。在 Go 源码中，`runtime.h` 文件定义了关键数据结构，`schedule()` 和 `findrunnable()` 函数实现了核心调度逻辑。通过深入研究 GMP 模型，可以更好地理解 Go 语言的并发机制。

小王老师呀

23 1 1

喜欢猪猪

|

20天前

|

消息中间件缓存安全

Future与FutureTask源码解析，接口阻塞问题及解决方案

【11月更文挑战第5天】在Java开发中，多线程编程是提高系统并发性能和资源利用率的重要手段。然而，多线程编程也带来了诸如线程安全、死锁、接口阻塞等一系列复杂问题。本文将深度剖析多线程优化技巧、Future与FutureTask的源码、接口阻塞问题及解决方案，并通过具体业务场景和Java代码示例进行实战演示。

喜欢猪猪

39 3 3

Dylaniou

|

1月前

|

存储

让星星⭐月亮告诉你，HashMap的put方法源码解析及其中两种会触发扩容的场景(足够详尽，有问题欢迎指正~)

`HashMap`的`put`方法通过调用`putVal`实现，主要涉及两个场景下的扩容操作：1. 初始化时，链表数组的初始容量设为16，阈值设为12；2. 当存储的元素个数超过阈值时，链表数组的容量和阈值均翻倍。`putVal`方法处理键值对的插入，包括链表和红黑树的转换，确保高效的数据存取。

Dylaniou

56 5 5

dlwlrma-晴子

|

1月前

|

Java Spring

Spring底层架构源码解析（三）

Spring底层架构源码解析（三）

dlwlrma-晴子

111 5 5

dlwlrma-晴子

|

1月前

|

XML Java 数据格式

Spring底层架构源码解析（二）

Spring底层架构源码解析（二）

dlwlrma-晴子

68 4 4

Codelinghu

|

1月前

|

算法 Java 程序员

Map - TreeSet & TreeMap 源码解析

Map - TreeSet & TreeMap 源码解析

Codelinghu

34 0 0

Codelinghu

|

1月前

|

缓存 Java 程序员

Map - LinkedHashSet&Map源码解析

Map - LinkedHashSet&Map源码解析

Codelinghu

67 0 0

Codelinghu

|

1月前

|

算法 Java 容器

Map - HashSet & HashMap 源码解析

Map - HashSet & HashMap 源码解析

Codelinghu

54 0 0

Codelinghu

|

1月前

|

存储 Java C++

Collection-PriorityQueue源码解析

Collection-PriorityQueue源码解析

Codelinghu

60 0 0

热门文章

最新文章

【C++ 常见的异步机制】探索现代异步编程：从 ASIO 到协程的底层机制解析

Core Image 框架详细解析

DNS害我不能上网,找几个备用

《R语言数据挖掘：实用项目解析》——第2章，第2.9节无参数方法

信息安全之DNS欺骗详解

MySQL数据库管理深度解析：创建新数据库的完全指南

golang开发:类库篇(四)配置文件解析器goconfig的使用

ARP解析MAC地址的全过程（ARP的工作机制）

阿里云天池大赛赛题解析——机器学习篇-赛题一（2）

RAD技术解析：快速开发应用程序的秘诀

stdbuf命令在Linux中的深度解析

Linux命令ssltap的深入解析与应用实践

XML DOM 解析器

深入解析PHP框架：Symfony框架详解与应用

网络安全与信息安全：从漏洞到防护的全方位解析

Java并发编程之线程池深度解析

强化学习系列：A3C算法解析

`urllib.parse`模块是Python标准库`urllib`中的一个子模块，它提供了处理URL（统一资源定位符）的实用功能。这些功能包括解析URL、组合URL、转义URL中的特殊字符等。

`click`是一个用于构建命令行接口的Python包，它提供了简单、可组合的命令行解析器。

相关课程

更多

第八届大学生创新创业大赛阿里命题IoT赛题解析

云计算工程师解析与实战-网络专家篇（体验版）

深入解析Docker容器化技术

Java面试疑难点解析 - 面试技巧及语言基础

Java面试疑难点解析 - Java Web开发

Java面试疑难点解析 - 系统架构及项目设计

相关电子书

更多

神龙云服务器产品及技术深度解析

弹性创造价值：基于ECS的最佳性价比实践解析

又快又稳：阿里云下一代虚拟交换机解析

相关实验场景

更多

如何快速训练大模型

使用PAI+LLaMA Factory微调Qwen2-VL模型，搭建文旅领域知识问答机器人

【文生图】一键部署Stable Diffusion基于函数计算

使用PAI-快速开始，低代码实现大语言模型微调和部署

使用PAI-EAS一键部署ChatGLM及LangChain应用

热门Stable Diffusion模型库快速转存至个人NAS与加载训练

推荐镜像

更多

DNS

pytorch-wheels

NTP

下一篇

无影云桌面