En raison de mon intérêt pour le système d'exploitation Linux et de mon désir de connaissances de bas niveau, j'ai compilé cet article. Il sert à vérifier les connaissances de base et couvre tous les aspects du système. Les outils présentés dans la documentation ne peuvent être entièrement maîtrisés sans une connaissance complète des systèmes informatiques, des réseaux et des systèmes d'exploitation. De plus, l'analyse et l'optimisation des performances du système sont une série à long terme.
Ce document est principalement un article complet compilé en combinant le billet de blog mis à jour sur l'outil de réglage des performances Linux par le gourou Linux et architecte des performances senior de Netflix Brendan Gregg, et en collectant des articles liés à l'optimisation des performances du système Linux. Il explique principalement les principes et les outils de test de performances impliqués en conjonction avec l'article de blog.
Connaissances de base : lors de l'analyse des problèmes de performances, la compréhension des connaissances de base est nécessaire. Par exemple, le cache matériel ; un autre exemple est le noyau du système d’exploitation. Les détails du comportement de l'application sont souvent liés à ces éléments, et ces éléments de bas niveau peuvent affecter les performances de l'application de manière inattendue. Par exemple, certains programmes ne parviennent pas à utiliser pleinement le cache, ce qui entraîne de mauvaises performances. Par exemple, trop d'appels système sont appelés inutilement, provoquant des changements fréquents noyau/utilisateur, etc.
Tout d’abord, regardons une image :
L'image ci-dessus est une analyse des performances partagée par Brendan Gregg. Tous les outils ici peuvent obtenir leurs documents d'aide via man
Voici une brève introduction à l'utilisation générale :
vmstat (VirtualMeomoryStatistics, statistiques de mémoire virtuelle) est un outil courant pour surveiller la mémoire sous Linux. Il peut surveiller la situation globale de la mémoire virtuelle, des processus, du processeur, etc. Utilisation courante de vmstat : vmstat interval times
即每隔 interval
秒采样一次,共采样 times
次,如果省略 times
, les données seront collectées jusqu'à ce que l'utilisateur les arrête manuellement. Donnez juste un exemple simple :
Vous pouvez utiliser ctrl+c
停止 vmstat
pour collecter des données.
La première ligne montre la moyenne depuis le démarrage du système, la deuxième ligne commence à montrer ce qui se passe actuellement, les lignes suivantes montreront ce qui se passe dans chaque intervalle de 5 secondes, la signification de chaque colonne est dans l'en-tête, comme indiqué ci-dessous :
Symptômes de mémoire insuffisante : la mémoire libre diminue fortement, le recyclage du tampon et du cache n'aide pas, utilisation intensive des partitions de swap (swpd), échanges fréquents de pages (swap), augmentation du nombre de disques de lecture et d'écriture (io), et augmentation des interruptions de défaut de page (in), le nombre de commutateurs de contexte (cs) augmente, le nombre de processus en attente d'IO (b) augmente et beaucoup de temps CPU est passé à attendre IO (wa)
iostat est utilisé pour rapporter les statistiques de l'unité centrale (CPU) et les statistiques d'entrée/sortie pour l'ensemble du système, les adaptateurs, les périphériques tty, les disques et les CD-ROM. Par défaut, il affiche les mêmes informations d'utilisation du processeur que vmstat. commande pour afficher l'extension Statistiques de l'appareil :
La première ligne affiche la moyenne depuis le démarrage du système, puis la moyenne incrémentielle, une ligne par appareil.
Habitudes courantes d'abréviation de l'indicateur IO de disque Linux : rq est une demande, r est une lecture, w est une écriture, qu est une file d'attente, sz est une taille, a est une moyenne, tm est une heure et svc est un service.
dstat affiche l'utilisation du processeur, l'état des E/S du disque, l'état d'envoi des paquets réseau et l'état de la pagination. La sortie est colorée et hautement lisible. Par rapport à l'entrée de vmstat et iostat, elle est plus détaillée et intuitive. Lorsque vous l'utilisez, entrez simplement la commande directement, et bien sûr vous pouvez également utiliser des paramètres spécifiques.
Comme suit :dstat –cdlmnpsy
La commande iotop est une commande spécialement conçue pour afficher les E/S du disque dur. Le style d'interface est similaire à la commande top. Elle peut afficher quel processus génère spécifiquement la charge IO. Il s'agit d'un outil de pointe utilisé pour surveiller l'utilisation des E/S du disque. Il possède une interface utilisateur similaire à celle de top, comprenant le PID, l'utilisateur, les E/S, le processus et d'autres informations connexes.
Peut être utilisé de manière non interactive :
iotop –bod interval
Pour visualiser le I/O
de chaque processus, vous pouvez utiliser
pidstat,pidstat –d instat
pidstat est principalement utilisé pour surveiller l'utilisation des ressources système par tous les processus ou des processus spécifiés, tels que le processeur, la mémoire, les E/S du périphérique, la commutation de tâches, les threads, etc.
使用方法:
pidstat –d interval
pidstat 还可以用以统计CPU使用信息:
pidstat –u interval
统计内存信息:
pidstat –r interval
任务区域默认显示:进程 ID,有效用户,进程优先级,NICE 值,进程使用的虚拟内存,物理内存和共享内存,进程状态,CPU 占用率,内存占用率,累计 CPU 时间,进程命令行信息。
htop 是 Linux 系统中的一个互动的进程查看器,一个文本模式的应用程序(在控制台或者X终端中),需要 ncurses。
Htop 可让用户交互式操作,支持颜色主题,可横向或纵向滚动浏览进程列表,并支持鼠标操作。
与 top 相比,htop 有以下优点:
mpstat 是 Multiprocessor Statistics的缩写,是实时系统监控工具。其报告CPU的一些统计信息,这些信息存放在 /proc/stat
文件中。在多 CPUs 系统里,其不但能查看所有 CPU 的平均状况信息,而且能够查看特定 CPU 的信息。常见用法:
mpstat –P ALL interval times
netstat 用于显示与 IP、TCP、UDP和 ICMP 协议相关的统计数据,一般用于检验本机各端口的网络连接情况。
常见用法:
netstat –npl # 可以查看你要打开的端口是否已经打开。 netstat –rn # 打印路由表信息。 netstat –in # 提供系统上的接口信息,打印每个接口的MTU,输入分组数,输入错误,输出分组数,输出错误,冲突以及当前的输出队列的长度。
ps 参数太多,具体使用方法可以参考 man ps
常用的方法:
ps aux #hsserver ps –ef |grep #hundsun
杀掉某一程序的方法:
ps aux | grep mysqld | grep –v grep | awk ‘{print $2 }’ xargs kill -9
杀掉僵尸进程:
ps –eal | awk ‘{if ($2 == “Z”){print $4}}’ | xargs kill -9
跟踪程序执行过程中产生的系统调用及接收到的信号,帮助分析程序或命令执行中遇到的异常情况。
举例:查看 mysqld 在 linux 上加载哪种配置文件,可以通过运行下面的命令:
strace –e stat64 mysqld –print –defaults > /dev/null
能够打印系统总共运行了多长时间和系统的平均负载,uptime 命令最后输出的三个数字的含义分别是 1分钟,5分钟,15分钟内系统的平均负荷。
lsof(list open files)是一个列出当前系统打开文件的工具。通过 lsof 工具能够查看这个列表对系统检测及排错,常见的用法:
查看文件系统阻塞
lsof /boot
查看端口号被哪个进程占用
lsof -i : 3306
查看用户打开哪些文件
lsof –u username
查看进程打开哪些文件
lsof –p 4838
查看远程已打开的网络链接
lsof –i @192.168.34.128
perf 是 Linux kernel 自带的系统性能优化工具。优势在于与 Linux Kernel 的紧密结合,它可以最先应用到加入 Kernel 的new feature,用于查看热点函数,查看 cashe miss 的比率,从而帮助开发者来优化程序性能。
性能调优工具如 perf,Oprofile 等的基本原理都是对被监测对象进行采样,最简单的情形是根据 tick 中断进行采样,即在 tick 中断内触发采样点,在采样点里判断程序当时的上下文。
假如一个程序 90% 的时间都花费在函数 foo() 上,那么 90% 的采样点都应该落在函数 foo() 的上下文中。运气不可捉摸,但我想只要采样频率足够高,采样时间足够长,那么以上推论就比较可靠。因此,通过 tick 触发采样,我们便可以了解程序中哪些地方最耗时间,从而重点分析。
结合以上常用的性能测试命令并联系文初的性能分析工具的图,就可以初步了解到性能分析过程中哪个方面的性能使用哪方面的工具(命令)。
熟练并精通了第二部分的性能分析命令工具,引入几个性能测试的工具,介绍之前先简单了解几个性能测试工具:
github.com/brendangregg/flamegraph
中的开发源代码的程序生成。是一款性能测评工具,对于不同模块的性能测试可以使用相应的工具,想要深入了解,可以参考最下文的附件文档。
是一款性能调优工具,主要是从linux内核源码层进行的调优,想要深入了解,可以参考下文附件文档。
sar(System Activity Reporter系统活动情况报告)是目前LINUX上最为全面的系统性能分析工具之一,可以从多方面对系统的活动进行报告,包括:文件的读写情况、系统调用的使用情况、磁盘I/O、CPU效率、内存使用状况、进程活动及IPC 有关的活动等方面。sar 的常规使用方式:
sar [options] [-A] [-o file] t [n]
其中:t 为采样间隔,n 为采样次数,默认值是1;-o file 表示将命令结果以二进制格式存放在文件中,file 是文件名。options 为命令行选项
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!