C1000K - Erlang (第一弹)

简介: C1000K - Erlang

C1000K

阅读霸爷关于C1000K的slides后,收获颇丰,在这里摘录总结。

http://blog.yufeng.info/archives/tag/erts

内存

内存NUMA

tcmalloc
   cgroup
   cat /proc/123955/numa_maps

内存page

largepage
   HugeTLBfs
   oprofile

网卡负载均衡

网卡bonding

中断平衡

dstat

硬中断

cat /proc/interrupts
irqbalance 智能均衡硬件中断
echo ff > /proc/irq/19/smp_affinity

软中断

cat /proc/softirqs

SMP IRQ affinity

RPS: Receive Packet Steering 软件模拟的方式,实现了多队列网卡,分散多CPU上数据接收的负载。
RFS: Receive Flow Steering 把接收的数据包送达应用所在的CPU上,提高cache命中率。

TCP协议栈

微调

IPX, Appletalk
注意观察dmesg有关TCP的抱怨
net.ipv4.tcp_fin_timeout = 32
net.ipv4.keeplive_time = 1200
...

initcwnd调优(google)

提高初始拥塞窗口的大小(默认是3),大大减少短连接的响应时间。
TCP latency:
    3 -> 490ms
6 -> 475
10 -> 170
16 -> 465

IO

文件系统

磁盘的选择
文件系统
IO调度算法
pagecache的设置

FIO工具

异步IO

libaic: Linux native aio,用eventfd做事件通知

记住常用 的延迟数字

CPU L1 cache                        0.5 ns
   CPU Branch mispredict               5   ns
   CPU L2 cache                        7   ns
   Mutex lock/unlock                   25  ns
   Main memory reference               100 ns
   Send 2K bytes over 1Gbps            20,000 ns
   Read 1MB sequentially from memory   250,000 ns
   Round trip within same datacenter   500,000 ns
   Disk seek (7200rpm)                 10,000,000 ns
   Read 1MB sequentially from disk     20,000,000 ns
   Send packet US->NL->US              150,000,000 ns

多核心架构下性能问题

CPU空闲

limited by slow data accessess to memory and disks

Blocking technique

Intel Xeon 7400 CPU:
    96 KB L1 cache
16MB of L3
如何利用cache和空余的CPU计算力???
C = A <oper> B 实际上读取了一个block的A,一个block的B

数据压缩

主存的访问速度: 8G/s

L1的速度: 300G/s

Lzo 解压速度接近memcpy, 压缩率50%,压缩比解压慢2-3倍,适合读多于写(如squid)

Erlang的问题

单链表,只能表头访问,GC后中间的洞大,对cache不友好。

Erlang的IO支持iolist,底层用writev实现。

(splice), sendfile 减少内核和用户空间的数据拷贝。

readv/writev 尽量gather read, scatter write。

合并数据,批量读写,页面是4K单位,而IO操作的unit是页面。

目录
打赏
0
0
0
0
5
分享
相关文章
kde
|
3天前
|
Docker镜像加速指南:手把手教你配置国内镜像源
配置国内镜像源可大幅提升 Docker 拉取速度,解决访问 Docker Hub 缓慢问题。本文详解 Linux、Docker Desktop 配置方法,并提供测速对比与常见问题解答,附最新可用镜像源列表,助力高效开发部署。
kde
1562 4
2025年最新版最细致Maven安装与配置指南(任何版本都可以依据本文章配置)
本文详细介绍了Maven的项目管理工具特性、安装步骤和配置方法。主要内容包括: Maven概述:解释Maven作为基于POM的构建工具,具备依赖管理、构建生命周期和仓库管理等功能。 安装步骤: 从官网下载最新版本 解压到指定目录 创建本地仓库文件夹 关键配置: 修改settings.xml文件 配置阿里云和清华大学镜像仓库以加速依赖下载 设置本地仓库路径 附加说明:包含详细的配置示例和截图指导,适用于各种操作系统环境。 本文提供了完整的Maven安装和配置
2025年最新版最细致Maven安装与配置指南(任何版本都可以依据本文章配置)
Dify MCP 保姆级教程来了!
大语言模型,例如 DeepSeek,如果不能联网、不能操作外部工具,只能是聊天机器人。除了聊天没什么可做的。
449 5
Excel数据治理新思路:引入智能体实现自动纠错【Python+Agent】
本文介绍如何利用智能体与Python代码批量处理Excel中的脏数据,解决人工录入导致的格式混乱、逻辑错误等问题。通过构建具备数据校验、异常标记及自动修正功能的系统,将数小时的人工核查任务缩短至分钟级,大幅提升数据一致性和办公效率。
Go语言实战指南 —— Go中的反射机制:reflect 包使用
Go语言中的反射机制通过`reflect`包实现,允许程序在运行时动态检查变量类型、获取或设置值、调用方法等。它适用于初中级开发者深入理解Go的动态能力,帮助构建通用工具、中间件和ORM系统等。
143 63
让AI时代的卓越架构触手可及,阿里云技术解决方案开放免费试用
阿里云推出基于场景的解决方案免费试用活动,新老用户均可领取100点试用点,完成部署还可再领最高100点,相当于一年可获得最高200元云资源。覆盖AI、大数据、互联网应用开发等多个领域,支持热门场景如DeepSeek部署、模型微调等,助力企业和开发者快速验证方案并上云。
220 16
让AI时代的卓越架构触手可及,阿里云技术解决方案开放免费试用
国内如何安装和使用 Claude Code镜像教程 - Windows 用户篇
国内如何安装和使用 Claude Code镜像教程 - Windows 用户篇
281 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问