概述
有時可能需要在系統中尋找具有某一特徵的文件(例如文件權限、文件屬主、文件長度、文件類型等等)。這樣做可能有很多原因。可能出於安全性的考慮,或是一般性的系統管理任務,或許只是為了找出一個不知保存在什麼地方的文件。 find一個非常有效的工具,它可以遍歷目前目錄甚至於整個檔案系統來尋找某些檔案或目錄。
由於find具有如此強大的功能,所以它的選項也很多,其中大部分選項都值得我們花時間來了解一下。即使系統中含有網路檔案系統(NFS),find指令在該檔案系統中同樣有效,只要你有對應的權限。
在運行一個非常消耗資源的find命令時,很多人都傾向於把它放在後台執行,因為遍歷一個大的文件系統可能會花費很長的時間(這裡是指30G字節以上的文件系統) .
find指令的使用
find pathname -options [-print -exec -ok]
find指令的一般格式為:
find [-H] [-L] [-P] [path...] [expression]
其中,'-H' '-L' '-P'三個選項主要是用來處理符號連接,'-H'表示只跟隨命令列中指定的符號連接,'-L'表示跟隨所有的符號連接,'-P'是預設的選項,表示不跟隨符號連接。
例如,在我的當前目錄下有一個符號連接e1000,現在我想查找文件名中最後一個字母是數字的源文件,那麼
$ find -H . -name "*[0-9].c" -print
./2234.c
像上面這樣寫只能查找出目前目錄下符合要求的文件,卻找不出e1000下的文件。因此可以這麼寫:
$ find -H e1000 . -name "*[0-9].c" -print
或使用'-L'選項
$ find -L . -name "*[0-9]. c" -print
格式中的[path...]部分錶示以此目錄為根目錄進行搜尋。
格式中的[expression]是一個表達式。最基本的表達式分為三類:設定項(option)、測試項目(test)、動作項(action),這三類又可以透過邏輯運算子(operator)組合在一起形成更大更複雜的表達式。設定項目(如-depth,-maxdepth等)針對這次查找任務,而不是僅僅針對某一個文件,設定項總是返回true;測試項(test)則不同,它針對具體的一個文件進行匹配測試,如-name,-num,-user等,傳回true或false;動作項(action)則是對某一個檔案進行某種動作(最常見的如-print),回傳true或false。
正是[expression]部分的豐富,才使得find如此強大。此部分較複雜,後面慢慢說明。
find指令選項
find指令有很多選項或表達式,每個選項前面跟著一個橫槓-。讓我們先來看一下該指令的主要選項,然後再給一些例子。
-name 依照檔案名稱尋找檔案。
-perm 依照檔案權限來尋找檔案。
-prune 使用此選項可以使find命令不在目前指定的目錄中查找,如果同時使用了-depth選項,那麼-prune選項將被find命令忽略。
-user 依照文件屬主來找出文件。
-group 依照文件所屬的群組來尋找文件。
-mtime -n or +n按照文件的更改時間來查找文件,-n表示文件更改時間距現在n天以內,+n表示文件更改時間距現在n天以前。 find指令還有-atime和-ctime選項,但它們都和-mtime選項相似,所以我們在這裡只介紹-mtime選項。
-nogroup 尋找無有效所屬群組的文件,即該文件所屬的群組在/etc/groups中不存在。
-nouser 尋找無有效屬主的文件,即該文件的屬主在/etc/password中不存在。
-newer file1 ! file2 尋找更改時間比檔案file1新但比檔案file2舊的檔案。
-type 尋找某一類型的文件,諸如:
b - 塊設備文件。
d - 目錄。
c - 字元設備檔案。
p - 管道文件。
l - 符號連結檔。
f - 普通文件。
-size n[c] 尋找文件長度為n區塊的文件,以c時表示檔案長度以位元組計。
-depth 在尋找文件時,先尋找目前目錄中的文件,然後再在其子目錄中尋找。
-fstype 尋找位於某一類型檔案系統中的文件,這些檔案系統類型通常可以在設定檔/etc/fstab中找到,該設定檔中包含了本系統中有關檔案系統的資訊。
-mount 在尋找文件時不會跨越檔案系統mount點。
-follow 如果find指令遇到符號連結文件,就會追蹤至連結所指向的文件。
-cpio 對符合的檔案使用cpio指令,將這些檔案備份到磁帶裝置中。
使用name選項
檔案名稱選項是find指令最常用的選項,要麼單獨使用該選項,要麼和其他選項一起使用。可以使用某種文件名模式來匹配文件,記住要用引號將文件名模式引起來。
不管當前路徑是什麼,如果想要在自己的根目錄$HOME中查找文件名符合*.txt的文件,使用~作為pathname參數,波浪號~代表了你的$HOME目錄。
$ find ~ -name "*.txt" -print
想要在當前目錄及子目錄中找到所有的'*.txt'文件,可以用:
$ find . -name "*.txt" -print
想要的當前目錄及子目錄中查找文件名以一個大寫字母開頭的文件,可以用:
$ find . -name "[A-Z]*" -print
想要在/etc目錄中查找文件名以h o s t開頭的文件,可以用:
$ find /etc -name "host*" -print
如果想在當前目錄查找文件名以兩個小寫字母開頭,跟著是兩個數字,最後是* . t x t的文
件,下面的指令就能夠傳回名為ax37.txt的檔案:
$ find . -name "[a-z][a-z][0--9][0--9].txt" -print
使用perm選項
如果希望按照檔案權限模式來尋找檔案的話,可以採用-perm選項。你可能需要找到所有使用者都有執行權限的文件,或是希望查看某個使用者目錄下的文件權限類型。在使用這項選項的時候,最好使用八進制的權限表示法。為了在目前目錄下尋找文件權限位為7 5 5的文件,即文件屬主可以讀取、寫入、執行,其他使用者可以讀取、執行的文件,可以用:
$ find . -perm 755 -print邏輯運算符
find中的邏輯運算子主要有以下幾個,依照優先順序從高到低的順序如下:
( expr )
括號優先順序最高,先對括號內的求值
! expr
對expr表達式的值取反
-not expr
同上,但是POSIX不支援
expr1 expr2
不加任何運算符,相當於兩個之間加and,即與運算,兩個表達式值都為true整個才返回true。先對expr1表達式求值,若為false,則不對expr2求值。
expr1 -a expr2
同上
expr1 -and expr2
同上,但是POSIX不支持
expr1 -o expr2
表示對expr1和expr2兩個表達式的值或,左右兩個表達式有一個
表示對expr1和expr2兩個表達式的值或,左右兩個值求一個值表達式就是true。先對expr1表達式求值,若為ture,則不對expr2求值。
expr1 -or expr2
同上,但是POSIX不支援
expr1 , expr2
-prune是一個動作項,它表示當檔案是一個目錄檔案時,不進入此目錄進行搜尋。要理解-prune動作,首先得理解find指令的搜尋規則(也可以說find指令的演算法)。
find指令遞歸遍歷所指定的目錄樹,針對每個檔案依序執行find指令中的運算式,表達式先依照邏輯運算子進行結合,然後依序從左至右對運算式求值。以下面程式碼為例,進行說明
find PATHP1 OPT1 TEST1 ACT1 ( TEST2 or TEST3 ) ACT2
1、根據OPT1設定項進行find指令的整體設置,若沒有-depth設定項,依序進行下面的步驟
2、令文件變數File = PATHP1
3、對File檔案進行TEST1測試,若執行結果為false,轉(8)
4、對File檔案進行ACT1動作,若執行結果為false,轉(8)
5、對File文件進行TEST2測試,若執行結果為true,轉(7)
6、對File文件進行TEST3測試,若執行結果為false,轉(8)
7、對File文件進行ACT2動作
8、若File文件是一個目錄,並且沒有被執行過-prune動作,則進入此目錄
9、當前目錄下是否還有文件,若有依次取一個文件,令File指向此文件,轉(3);
10、判斷目前目錄是否是PATHP1,若是則程式退出;若不是,則返回上一層目錄,轉(9)
理解了上面的流程,那麼不難理解下面的程式碼為什麼只輸出一個'.'
$ find . -prune
.
再有,目前目錄下大於4090位元組的檔案有兩個,而大於4096位元組的檔案只有一個,如下:
$ find . -size +4090c -print
.
./a_book_of_c. chm
$ find . -size +4096c -print
./a_book_of_c.chm
那麼,將上面兩個-print都替換為-prune,這兩條指令分別輸出什麼?
$ find . -size +4090c -prune
.
$ find . -size +4096c -prune
./a_book_of_c.chm
-prune經常和-path或-wholename一起使用,以避免某個目錄,常見的形式是:
$ find PATH (-path
$ find . -size +0c -wholename "*e*[0-9]*" -o ! /( -name "." -o -name "*phone" /) -prune -name "*.c" -user xixi -o -name "*phone"
如果在查找文件時希望忽略某個目錄,因為你知道那個目錄中沒有你所要查找的文件,那麼可以使用-prune選項來指出需要忽略的目錄。在使用-prune選項時要當心,因為如果你同時使用了-depth選項,那麼-prune選項就會被find指令忽略。
如果希望在/apps目錄下查找文件,但不希望在/apps/bin目錄下查找,可以用:
$ find /apps -name "/apps/bin" -prune -o -print
使用user和nouser選項
如果希望按照文件屬主查找文件,可以給出相應的用戶名。例如,在$HOME目錄中尋找文件屬主為dave的文件,可以使用:
$ find ~ -user dave -print
在/etc目錄下找到文件屬主為uucp的文件:
$ find /etc -user uucp -print
為了查找屬主帳號已經被刪除的文件,可以使用-nouser選項。這樣就能夠找到那些屬主在/etc/password檔案中沒有有效帳戶的文件。使用-nouser選項時,不必給予使用者名稱;find指令
能夠為你完成對應的工作。例如,希望在/home目錄下找到所有的這類文件,可以用:
$ find /home -nouser -print
使用group和nogroup選項
就像user和nouser選項一樣,針對文件所屬於的用戶群組, find指令也有相同的選項,為了在/apps目錄下查找屬於accts用戶群的文件,可以用:
$ find /apps -group accts -print
要查找沒有有效所屬用戶組的所有文件,可以使用nogroup選項。下面的find命令從文件系統的根目錄處查找這樣的文件
$ fine / -nogroup -print
按照更改時間查找文件
如果希望按照更改時間來查找文件,可以使用mtime選項。如果系統突然沒有可用空間了,很有可能某一個檔案的長度在此期間成長迅速,這時就可以用mtime選項來尋找這樣的檔案。用減號-來限定更改時間在距今n日以內的文件,而用加號+來限定更改時間在距今n日以前的文件。
希望在系統根目錄下查找更改時間在5日以內的文件,可以用:
$ find / -mtime -5 -print
為了在/var/adm目錄下查找更改時間在3日以前的文件,可以用:
$ find /var/adm -mtime +3 -print
使用newer選項
如果希望查找更改時間比某個文件新但比另一個文件舊的所有文件,可以使用-newer選項。它的一般形式為:
newest_file_name ! oldest_file_name
其中,!是邏輯非符號。這裡有兩個文件,它們的更改時間大約相差兩天。
下面給出的find指令能夠找出更改時間比檔案age.awk新但比檔案belts.awk舊的檔案:
$find . -newer age.awk ! -newer belts.awk -exec ls -l {} ;
如果想使用find命令的這一選項來查找更改時間在兩個小時以內的文件,除非有一個現成的文件其更改時間恰好在兩個小時以前,否則就沒有可用來比較更改時間的文件。為了解決這個問題,可以先建立一個檔案並將其日期和時間戳記設定為所需的時間。這可以用touch指令來實現。
假設現在的時間是2 3 : 4 0,希望查找更改時間在兩個小時以內的文件,可以先創建這樣
一個文件:
$touch -t 05042140 dstamp
一個符合要求的文件已經被創建;這裡我們假設今天是五月四日,而該文件的更改時間是21:40,比現在剛好早兩個小時。
現在我們就可以使用find命令的-newer選項在當前目錄下查找所有更改時間在兩個小時以內的文件:
$ find . -newer dstamp -print
使用type選項
Unix或Linux系統中有若干種不同的檔案類型,這部分內容我們在前面的章節已經做了
如果要在/etc目錄下查找所有的目錄,可以用:
$ find /etc -type d -print
為了在當前目錄下查找除目錄以外的所有類型的文件,可以用:
$ find . ! -type d -print
為了在/etc目錄下查找所有的符號鏈接文件,可以用:
$ find /etc -type l -print
使用size選項
可以依照文件長度來尋找文件,這裡所指的文件長度既可以用區塊(block)來計量,也可以用位元組來計量。以位元組計量檔案長度的表達形式為N c;以區塊計量檔案長度只用數字表示即可。就我個人而言,我總是使用以字節計的方式,在按照文件長度查找文件時,大多數人都喜歡使用這種以字節表示的文件長度,而不用塊的數目來表示,除非是在查看檔案系統的大小,因為這時使用區塊來計量更容易轉換。
為了在當前目錄下查找文件長度大於1 M字節的文件,可以用:
$ find . -size +1000000c -print
為了在/home/apache目錄下查找文件長度恰好為1 0 0字節的文件,可用:
$ find /home/apache -size 100c -print
為了在當前目錄下查找長度超過1 0塊的文件(一塊等於5 1 2位元組),可以用:
$ find . -size +10 -print
使用depth選項
在使用find指令時,可能希望先符合所有的文件,再在子目錄中尋找。使用depth選項就可以讓find指令這樣做。這樣做的一個原因是,當在使用find命令向磁帶上備份文件系統時,希望首先備份所有的文件,其次再備份子目錄中的文件。
在下面的範例中,find指令從檔案系統的根目錄開始,尋找一個名為CON.FILE的檔案。
它將首先匹配所有的文件然後再進入子目錄中查找。
$ find / -name "CON.FILE" -depth -print
使用mount選項
在目前的檔案系統中尋找檔案(不進入其他檔案系統),可以使用f i n d指令的m o u n t選項。
在下面的範例中,我們從目前目錄開始尋找位於本檔案系統中檔案名稱以X C結尾的檔案:
$ find . -name "*.XC" -mount -print
使用cpio選項
cpio指令可以用來向磁帶設備備份檔案或從中復原檔案。可以使用find命令在整個文件系統中(更多的情況下是在部分文件系統中)查找文件,然後用cpio命令將其備份到磁帶上。如果希望使用cpio指令備份/etc/、/home/和/apps目錄中的文件,可以使用下面所給予的指令,不過要記住你是在檔案系統的根目錄下:
$cd /
$find etc home apps -depth -print | cpio -ivcdC65536 -o /dev/rmt0
(在上面的例子中,第一行末尾的告訴shell命令還未結束,忽略後面的回車。)
在上面的例子中,第一行末尾的告訴shell命令還未結束,忽略後面的回車。)
在上面的例子中,應注意到路徑中缺少/,這叫作相對路徑。之所以使用相對路徑,是因為從磁帶中復原這些檔案的時候,可以選擇復原檔案的路徑。例如,可以將這些檔案先還原到另一個目錄中,對它們進行某些操作後,再還原到原始目錄中。如果在備份時使用了絕對路徑,例如/etc,那麼在恢復時,就只能恢復到/ etc目錄中去,別無其他選擇。在上面
的例子中,我告訴find命令首先進入/etc目錄,然後是/home和/apps目錄,先匹配這些目錄下的文件,然後再匹配其子目錄中的文件,所有這些結果將通過管道傳遞給cpio指令進行備份。順便說一下,在上面的例子中cpio指令使用了C65536選項,我本來可以使用B選項,不過這
樣每塊的大小只有5 1 2字節,而使用了C65536選項後,塊的大小變成了64K位元組(65536 /1024)。
使用exec或ok來執行shell命令
-exec選項讓find指令對符合的檔案執行該參數所給予的shell指令。對應指令的形式為' command' {} ;,注意{ }與;之間的空格。 -ok和-exec的作用相同,只不過以更安全的模式來執行該參數所給予的shell指令,在執行每一個指令之前,都會給予提示,讓使用者來決定是否執行。一旦find命令匹配到了相應的文件,就可以用-exec項目中的命令對其進行操作(在有些作業系統中只允許-exec選項執行諸如l s或ls -l這樣的命令)。大多數用戶使用此選項是為了尋找舊檔案並刪除它們。這裡我強烈建議你在真正執行rm指令刪除檔案之前,最好先用ls指令看一下,確認它們是所要刪除的檔案。
為了使用exec選項,必須同時使用print選項。如果驗證find指令,會發現指令只輸出從目前路徑起的相對路徑及檔名。
$find . -type f -exec ls -l {} ;
在上面的例子中,find命令匹配到了當前目錄下的所有普通文件,並在-exec選項中使用ls -l命令將它們列出。
為了在/logs目錄中查找更改時間在5日以前的檔案並刪除它們,可以用:
$ find logs -type f -mtime +5 -exec rm {} ;
記住,在shell中用任何方式刪除文件之前,應先查看相應的文件,一定要小心!當使用諸如mv或rm命令時,可以使用-exec選項的安全模式。它將在對每個匹配到的文件進行操作之前提示你。在下面的例子中,find命令在當前目錄中查找所有文件名以. LOG結尾、更改時間在5日以上的文件,並刪除它們,只不過在刪除之前先給出提示。
按y鍵刪除文件,按n鍵不刪除。
-regex同樣屬於測試項目。使用-regex時有一點要注意:-regex不是符合檔案名,而是符合完整的檔案名稱(包括路徑)。例如,目前目錄下有一個檔案"abar9",如果你用"ab.*9"來匹配,將查找不到任何結果,正確的方法是使用".*ab.*9"或".*/ab .*9"來匹配。針對上面的那個查找c程式碼的問題,可以這麼寫:
$ find . -regex ".*/[0-9]*/.c" -print
使用wholename與path選項
這裡-wholename和-path和上面提到的全路徑有一定關聯。
-wholename和-path都屬於測試項目(test),功能也是一樣。 -path從字面上看給人一種錯覺,好像只匹配路徑名(或目錄名),其實它也可以匹配檔名,因此-wholename這個名字更貼切一些。看看這個例子,目前目錄下有一個phone目錄,phone目錄裡有一個檔案名稱是puk.txt,使用-path:
$ find . -path '*phone/pu*'
./phone/puk.txt
另外要提一點:使用-path的一般格式是:find [path ...] -path pattern ...
輸出格式
如果你不想查找到你想要的文件事單調的輸出檔名,你可以使用-printf動作項目輸出你想要的格式,下面舉幾個-printf動作的參數:
%p 輸出文件名,包括路徑名
%f 輸出檔案名,不含路徑名
%m 以8進位方式輸出檔案的權限
%g 輸出檔案所屬的群組的屬主名
...
例如:
$ find . -user xixi -printf "%m %p //n"
644 ./phone1/hello.c
644 ./0dfe.c
find
find
在使用find指令的-exec選項處理符合的檔案時,find指令將所有符合的檔案一起傳遞給exec執行。不幸的是,有些系統對能夠傳遞給exec的命令長度有限制,這樣在find命令運行幾分鐘之後,就會出現溢出錯誤。錯誤訊息通常是“參數列太長”或“參數列溢出”。這就是
數來決定。
下面的例子查找系統中的每一個普通文件,然後使用xargs命令來測試它們分別屬於哪類文件:下面的例子在整個系統中查找內存信息轉儲文件(core dump),然後把結果保存到/ tmp/core.log 檔案中:
$ find . -name "core" -print | xargs echo "" >/tmp/core.log
下面的範例在/apps/audit目錄下找到所有使用者有讀取、寫入和執行權限的文件,並收回相應的寫入權限:
$ find /apps/audit -perm -7 -print | xargs chmod o-w
在下面的例子中,我們用g r e p命令在所有的普通文件中搜索device這個詞:
$ find / -type f -print | xargs grep "device"
在下面的例子中,我們用grep指令在目前目錄下的所有普通檔案中搜尋DBO這個字:
$ find . -name * -type f -print | xargs grep "DBO"
注意,在上面的範例中,用來取消f i n d指令中的*在shell中的特殊意義。