C1000K - Erlang (第一弹)

简介: C1000K - Erlang

C1000K

阅读霸爷关于C1000K的slides后,收获颇丰,在这里摘录总结。

http://blog.yufeng.info/archives/tag/erts

内存

内存NUMA

tcmalloc
   cgroup
   cat /proc/123955/numa_maps

内存page

largepage
   HugeTLBfs
   oprofile

网卡负载均衡

网卡bonding

中断平衡

dstat

硬中断

cat /proc/interrupts
irqbalance 智能均衡硬件中断
echo ff > /proc/irq/19/smp_affinity

软中断

cat /proc/softirqs

SMP IRQ affinity

RPS: Receive Packet Steering 软件模拟的方式,实现了多队列网卡,分散多CPU上数据接收的负载。
RFS: Receive Flow Steering 把接收的数据包送达应用所在的CPU上,提高cache命中率。

TCP协议栈

微调

IPX, Appletalk
注意观察dmesg有关TCP的抱怨
net.ipv4.tcp_fin_timeout = 32
net.ipv4.keeplive_time = 1200
...

initcwnd调优(google)

提高初始拥塞窗口的大小(默认是3),大大减少短连接的响应时间。
TCP latency:
    3 -> 490ms
6 -> 475
10 -> 170
16 -> 465

IO

文件系统

磁盘的选择
文件系统
IO调度算法
pagecache的设置

FIO工具

异步IO

libaic: Linux native aio,用eventfd做事件通知

记住常用 的延迟数字

CPU L1 cache                        0.5 ns
   CPU Branch mispredict               5   ns
   CPU L2 cache                        7   ns
   Mutex lock/unlock                   25  ns
   Main memory reference               100 ns
   Send 2K bytes over 1Gbps            20,000 ns
   Read 1MB sequentially from memory   250,000 ns
   Round trip within same datacenter   500,000 ns
   Disk seek (7200rpm)                 10,000,000 ns
   Read 1MB sequentially from disk     20,000,000 ns
   Send packet US->NL->US              150,000,000 ns

多核心架构下性能问题

CPU空闲

limited by slow data accessess to memory and disks

Blocking technique

Intel Xeon 7400 CPU:
    96 KB L1 cache
16MB of L3
如何利用cache和空余的CPU计算力???
C = A <oper> B 实际上读取了一个block的A,一个block的B

数据压缩

主存的访问速度: 8G/s

L1的速度: 300G/s

Lzo 解压速度接近memcpy, 压缩率50%,压缩比解压慢2-3倍,适合读多于写(如squid)

Erlang的问题

单链表,只能表头访问,GC后中间的洞大,对cache不友好。

Erlang的IO支持iolist,底层用writev实现。

(splice), sendfile 减少内核和用户空间的数据拷贝。

readv/writev 尽量gather read, scatter write。

合并数据,批量读写,页面是4K单位,而IO操作的unit是页面。

相关文章
查看 npm 包下载量(简单快捷,数据精确)
查看 npm 包下载量(简单快捷,数据精确)
1155 0
|
Oracle 关系型数据库 数据库
中国自研数据库登顶世界第一,只因10年前的这句话
阿里“去IOE”的十年长征路是一部数据库自研史。十年前阿里像依赖氧气一样依赖传统数据库,如今OceanBase、POLARDB 两大数据库已屹立在世界前列。
9446 0
|
SQL 关系型数据库 测试技术
|
1天前
|
云安全 人工智能 自然语言处理
|
6天前
|
搜索推荐 编译器 Linux
一个可用于企业开发及通用跨平台的Makefile文件
一款适用于企业级开发的通用跨平台Makefile,支持C/C++混合编译、多目标输出(可执行文件、静态/动态库)、Release/Debug版本管理。配置简洁,仅需修改带`MF_CONFIGURE_`前缀的变量,支持脚本化配置与子Makefile管理,具备完善日志、错误提示和跨平台兼容性,附详细文档与示例,便于学习与集成。
314 116
|
8天前
|
数据采集 人工智能 自然语言处理
Meta SAM3开源:让图像分割,听懂你的话
Meta发布并开源SAM 3,首个支持文本或视觉提示的统一图像视频分割模型,可精准分割“红色条纹伞”等开放词汇概念,覆盖400万独特概念,性能达人类水平75%–80%,推动视觉分割新突破。
610 53
Meta SAM3开源:让图像分割,听懂你的话
|
21天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
5天前
|
人工智能 Java API
Java 正式进入 Agentic AI 时代:Spring AI Alibaba 1.1 发布背后的技术演进
Spring AI Alibaba 1.1 正式发布,提供极简方式构建企业级AI智能体。基于ReactAgent核心,支持多智能体协作、上下文工程与生产级管控,助力开发者快速打造可靠、可扩展的智能应用。