remaper – 第 10 页 – 成功，源于对美学的执著追求

CPI2: CPU performance isolation for shared compute clusters

Posted on 2017年11月16日2020年7月28日 by remaper in 混部技术

这是google在13年发表的一片论文：https://dl.acm.org/doi/10.1145/2465351.2465388

这篇论文里，最有价值的地方在于建立了一个对业务透明，能够实时感知在线业务运行质量，并且能自动优化的机制

基本概念

CPI：uses cycles-per-instruction，平均每条指令消耗的时钟周期（时间），相当于指令执行的代价。

现代处理器均有多级缓存，类似下面这样的一条指令：“ mov 0x200160(%rip),%rax ”，其执行时间由缓存是否命中决定（L0/L1/L2）。

cpu iowait 到底算 busy 还是 idle？

Posted on 2017年9月22日2021年5月31日 by remaper in 进程调度

我们在追查线上问题的时候，经常会碰到 cpu iowait 很高的 case，并且通常这种机器伴随着难登录、操作卡顿等现象，一看 cpu idle 还非常低，以为机器 cpu 被打爆了

其实不然，真正的罪魁祸首是 io，而不是 cpu。你看到的 cpu idle 很低，其实是因为部分 idle 时间被算到了 iowait 里面，导致看起来 cpu idle 很低而已。而纯粹的 iowait 很高，并不会引起系统卡顿，如果你发现系统卡顿，大概率是因为 io 异常的磁盘正好是根分区而已，不过今天我们不讨论 io，只讨论 cpu

那么问题来了，cpu iowait 到底是算 busy 还是 idle？

如果 cpu iowait 不算 busy，那衡量一个 cpu 的繁忙程度的指标到底是什么？
如果 cpu iowait 算 busy，这和直觉又不符合啊？既然是 io wait，cpu 都被切换出去执行其他进程了，又何来 busy 一说
初次之外，内核是如何统计 cpu iowait 的？

文件系统隔离之 – 初识 prjquota，原理、实践

Posted on 2017年8月11日2024年12月22日 by remaper in 容器核心技术, 文件系统

prjquota 的前身其实是 subtreequota，最早由 openvz 提出，2010年之后好像就没有消息了，没有进入内核主干，有点遗憾。后来我们移植过一次，但是由于设计过于复杂，功能不稳定，并且缺少社区的技术支持，最终选择了放弃。

prjquota 是 xfs 文件系统的一个原生特性，其设计简单，功能健壮。并且有人尝试把他移植到了 ext4 文件系统上。4系内核已经进入主干

prjquota 功能和 subtreequota 一样，能够限制一组具有相同 prjid 属性的文件的总大小。这些具有相同属性的 prjid，可能散落在不同的目录下，但属于同一个项目的文件拥有一个想同的project id标示，正如同一个用户的文件，或者同一个用户组的文件有相同的UserID，或者GroupID

具体实现，可以参考内核 patch：https://lwn.net/Articles/671627/

1）使能 prjquota 特性

磁盘project quota初始化，如下任意一种方法都可以：

重新格式化一个磁盘来支持project quota： /root/ext4/e2fsprogs/misc/mke2fs /dev/hdb -O quota,project
或者在已有的磁盘上使能project quota：/root/ext4/e2fsprogs/misc/tune2fs /dev/hdb -O quota,project

mount设备支持project quota：

mount -t ext4 -o prjquota /dev/hdb xxxx/ 或者：
mount -t ext4 /dev/hdb xxxx/； /root/ext4/quota-tools/quotaon xxxx/，但是这个方法，需要在磁盘上没有任何文件被打开的时候才能执行

创建 project id和quota限制管理

设置一个目录属于一个project id：/root//ext4/e2fsprogs/misc/chattr -p 1001 xxxx/test1
使得这个目录下的文件默认继承这个project id：/root//ext4/e2fsprogs/misc/chattr +P xxxx/test1
设置project的配额：/root/ext4/quota-tools/setquota -P 1001 100 100 400 500 xxxx，可以重复设置，例如更新quota，立即生效

The Linux Scheduler: a Decade of Wasted Cores

Posted on 2017年8月2日2020年8月2日 by remaper in 进程调度

https://blog.acolyer.org/2016/04/26/the-linux-scheduler-a-decade-of-wasted-cores/

The Linux Scheduler: a Decade of Wasted Cores – Lozi et al. 2016

This is the first in a series of papers from EuroSys 2016. There are three strands here: first of all, there’s some great background into how scheduling works in the Linux kernel; secondly, there’s a story about Software Aging and how changing requirements and maintenance can cause decay; and finally, the authors expose four bugs in Linux scheduling that caused cores to remain idle even when there was pressing work waiting to be scheduled. Hence the paper title, “A Decade of Wasted Cores.”

In our experiments, these performance bugs caused many-fold performance degradation for synchronization-heavy scientific applications, 13% higher latency for kernel make, and a 14-23% decrease in TPC-H throughput for a widely used commercial database.

参数估计：从频率学派到贝叶斯学派

Posted on 2017年7月31日2020年8月2日 by remaper in 数学基础

很多时候我们有一堆数据，并且也知道数据的基本模型，但是不知道模型的参数是什么。这是基本的机器学习过程，这个过程就叫参数估计

比如我们现在就有一堆数据，模型是 $y = \beta_0 x + \beta_1 + \xi = \beta^T X + \xi$ ，我们要求 $\beta$

常见的计算 $\beta$ 的手段有：

最小二乘法
最大似然估计
最大后验估计
贝叶斯估计

但是这几种估算方法的背后，其实代表了两类学术派别，也就是大家学习贝叶斯的时候经常听到的，频率学派和贝叶斯学派

今天来捋捋这两种学派的区别和联系

二项分类逻辑回归

Posted on 2017年7月22日2020年8月2日 by remaper in 数学基础

线性回归产生的预测值 $y=\theta^T x$ 是实值，而逻辑回归通常是要解决分类问题。用线性回归来解决分类问题效果是很差的

分类问题在生活中是很常见的，二项逻辑回归模型有如下的条件概率分布

成功概率： $P(Y=1|X) = \frac {1}{1+e^{-\theta^T x}}$
失败概率： $P(Y=0|X) = 1- \frac {1}{1+e^{-\theta^T x}}$

最大似然估计求解线性回归

Posted on 2017年6月26日2020年7月26日 by remaper in 数学基础

之前我在讲理解最大似然估计 http://0fd.org/2017/06/10/understand-the-maximum-likelihood-estimation/ 的时候，讲了两个例子，不过都很简单，今天来讲讲怎么用最大似然估计来求解线性回归方程，不管是一元还是多元

线性回归方程如下：

y = \theta_1 x_1 + ... + \theta_n x_n = \sum_{i=1}^{n} \theta_i x_i

现在假设我们有 $m$ 组样本数据， $(y^1, x_{(1 \sim n)}^1), (y^2, x_{(1 \sim n)}^2), ..., (y^m, x_{(1 \sim n)}^m)$ ，我们怎么用最大似然估计来求解 $\theta$ 呢？

理解最大似然估计

Posted on 2017年6月10日2020年7月26日 by remaper in AI - 算法, 数学基础

最大似然估计是传统机器学习里最常见的一种估计，简单来说，就是利用已知的样本结果，在确定模型的基础上，反推模型的参数

前面我们讲过泊努力分布、二项分布、泊松分布，都是日常生活中常见的模型。这些分布的模型就是他的概率函数，比如泊努力分布是单次实验，所以模型就是概率 $p$ ，二项分布是 $P(X=i) = \binom{n}{i}P^i(1-P)^{n-1}$ ，泊松分布的模型就是 $P(X=k) = \frac {\lambda^k} {k!} e^{-\lambda}$

这里面有3个关键点：

样本已知
模型已知
每个样本都是一次完全独立事件的结果

监督学习、无监督学习、半监督学习、强化学习

Posted on 2016年11月21日2020年9月13日 by remaper in 机器学习

原文：https://cloud.tencent.com/developer/article/1099894

一般说来，训练深度学习网络的方式主要有四种：监督、无监督、半监督和强化学习。在接下来的文章中，计算机视觉战队将逐个解释这些方法背后所蕴含的理论知识。除此之外，计算机视觉战队将分享文献中经常碰到的术语，并提供与数学相关的更多资源。

1. 监督学习（Supervised Learning）

监督学习是使用已知正确答案的示例来训练网络的。想象一下，我们可以训练一个网络，让其从照片库中（其中包含你父母的照片）识别出你父母的照片。以下就是我们在这个假设场景中所要采取的步骤。

Mutilate: high-performance memcached load generator for tail latency analysis

Posted on 2016年11月4日2020年9月4日 by remaper in 性能分析, 混部技术

multilate 是 leverich 在14年的时候，为了分析数据中心高密度混部场景下延迟敏感问题而开发出来的一个 memcached 性能压测工具，原论文可以了解一下：

https://jacob.leverich.org/papers/2014.mutilate.eurosys.slides.pdf

和 mcperf & memslap 等其他压测工具不太一样的是，multilate 非常适合分析长尾延迟问题，比如，multilate 的输出里面，可以非常直观的看到所有请求的平均延迟、最小延迟、最大延迟、10分位、90分位、95分位、99分位，当然，如果你想要更精确的数据，也可以改改代码，支持到99.9分位等等

代码在这里：https://github.com/leverich/mutilate

2025 年 9 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30