嵌入式產品中,系統啟動速度是很關鍵的指標,對系統啟動速度的最佳化,通常我們稱之為「快啟
」。
要對系統啟動速度進行最佳化,首先要知道如何統計系統啟動的時間。
在下面介紹幾種統計核心啟動耗時的方法,以及對核心啟動速度最佳化的幾個方法。
kernel hacking ---> [*] Show timing information on printks
主要用來測量核心啟動過程各個階段的耗時
kernel啟動時會執行不同等級的
initcall,而每個
initcall的耗時也是可以統計的。
在kernel
的cmdline
中加入参数initcall_debug=1
:
initcall_debug=1 setargs_nand=setenv bootargs console=${console} earlyprintk=${earlyprintk} root=${nand_root} initcall_debug=${initcall_debug} init=${init}
开启后,就能打印每个initcall
函数调用及耗时。
内核自带了一个工具用于统计启动时间:scripts/bootgraph.pl
使用该工具需要打开内核配置CONFIG_PRINTK_TIME=y
,并且在cmdline
中加上"initcall_debug=1
"
系统启动之后,执行命令:
dmesg|perl $(kernel_dir)/script/bootgraph.pl > out.svg
用浏览器查看out.svg
文件,可以看到内核启动过程中各个阶段的耗时。
这个工具有点类似于perf
的火焰图,可以统计启动各阶段的耗时。
除了内核自带的工具,也有开源的工具可用:bootchart
。
bootchart是一個用於linux啟動過程效能分析的開源軟體工具,在系統啟動過程自動收集CPU佔用率、進程等信息,並以圖形方式顯示分析結果,可用作指導優化系統啟動過程。
kernel cmdline
。將其中的init
修改為「init=/sbin/bootchartd
」。 bootchartd
會從/proc/stat
,/proc/diskstat
,/proc/[pid]/stat
中擷取訊息,經過處理後儲存為bootchart.tgz
檔案pc
上透過pybootchartgui.py
工具將bootchart.tgz
轉換為bootchart.png
,方便分析#最後也會成圖片來做分析,例如:
bootchar
主要用來測量掛載檔案系統到主應用程式啟動過程中的耗時
可以找一個在系統啟動過程中空閒的GPIO
,在適當位置設定GPIO
電平。
透過示波器抓取波形可以得到各階段耗時。
通常該方法被用來測量整個啟動的耗時,或是各階段的耗時,該方法也是用的比較多的。
kernel
有不同的壓縮格式,常見的如gz
、xz
、lzma
等。
不同的壓縮格式,解壓縮速度就不同,透過比較不同壓縮方式的啟動時間和flash佔用情況,選擇符合實際情況的,以此進行最佳化。
核心映像可以由kernel
自解壓縮,也可以由uboot
進行解壓縮。
對於kernel
自解壓縮的情況,如果壓縮過的kernel
與解壓縮後的kernel
位址衝突,則會先把自己複製到安全的地方,然後再解壓,防止自我覆蓋。這就需要耗費複製的時間。
即把載入位址和運行位址設定為不同位址,可以減少耗時。
裁剪核心是必要的,如果核心鏡像太大,那麼解壓縮核心就需要很長時間,所以核心要盡量裁剪。
裁剪內核,可以減少解壓縮耗時。初始化內容少了,也會減少耗時。
因此裁剪核心時,要考慮將不需要的功能都去掉。
LPJ
也就是loops_per_jiffy
,每次啟動都會計算一次,但如果沒有做修改的話,這個值每次啟動算出來都是一樣的,可以直接提供數值跳過計算。
如下log
所示,有skipped
,lpj
由timer
计算得来,不需要再校准calibrate
了。
[ 0.019918] Calibrating delay loop (skipped), value calculated using timer frequency.. 48.00 BogoMIPS (lpj=240000)
如果没有skipped
,则可以在cmdline
中添加lpj=xxx
进行预设
如前面提到,initcall
耗时是可以打印出来的,在cmdline
中设置initcall_debug=1
,即可打印跟踪所有内核初始化过程中调用的顺序以及耗时。
[ 0.021772] initcall sunxi_pinctrl_init+0x0/0x44 returned 0 after 9765 usecs [ 0.067694] initcall param_sysfs_init+0x0/0x198 returned 0 after 29296 usecs [ 0.070240] initcall genhd_device_init+0x0/0x88 returned 0 after 9765 usecs [ 0.080405] initcall init_scsi+0x0/0x90 returned 0 after 9765 usecs [ 0.090384] initcall mmc_init+0x0/0x84 returned 0 after 9765 usecs
根据打印信息,可以对耗时较多的initcall
进行优化。
initcall
有很多等级,但比较耗时的是module
。
如果是多核,可以考虑将module_initcall
并行执行来节省时间。
目前内核do_initcalls
是一个一个按照顺序来执行,可以修改成新建内核线程来执行
加入initcall
打印之后,发现pty/tty init
耗时很多,可减少个数来缩短init
时间。
initcall pty_init+0x0/0x3c4 returned 0 after 239627 usecs initcall chr_dev_init+0x0/0xdc returned 0 after 36581 usecs
只把必须要加进内核的才编译进内核,其他的编译成模块。
例如将必要的clock
、tty
、pinctrl
等编译进内核
#如果是
RISC-V
架構,可以考慮去掉
xip
:eXecute In Place
。即晶片內執行,是指
直接從記憶體讀取程式碼執行,而不用再讀到記憶體。 一般我們的程式都是放到
flash
中,當系統啟動時,把程式從flash
拷貝到ddr
中執行,而xip
技術則不需要拷貝程式到
這項技術是必須要晶片支援才行,可以看看晶片手冊中對SPI
的描述是否支援XIP
功能。
#以上對系統啟動速度的最佳化,歸根究底是提供一些思路、一些方法。
要最佳化啟動速度,通常來說需要對整個系統的啟動有比較深入的了解。
優化無止境,需要根據目標來進行最佳化,綜合考慮啟動速度和效果。
以上是很有用的速度優化:讓系統啟動速度更快的詳細內容。更多資訊請關注PHP中文網其他相關文章!