考慮以下場景:你編寫了一個python服務程序,並且在命令列下啟動,而你的命令列會話又被終端所控制,python服務成了終端程式的一個子進程。因此如果你關閉了終端,這個命令列程式也會跟著關閉。
要使你的python服務不受終端機影響而常駐系統,就需要將它變成守護程式。
守護程式就是Daemon程序,是一種在系統後台執行的程序,它獨立於控制終端並且執行一些週期任務或觸發事件,通常被命名為"d"字母結尾,如常見的httpd 、syslogd、systemd和dockerd等。
python可以很簡潔地實作守護進程,下面給出程式碼和對應註解。這份程式碼穩定運作在我本地電腦的一個守護程式(自製鬧鐘)裡,暫時沒出過問題。
# coding=utf8 import os import sys import atexit def daemonize(pid_file=None): """ 创建守护进程 :param pid_file: 保存进程id的文件 :return: """ # 从父进程fork一个子进程出来 pid = os.fork() # 子进程的pid一定为0,父进程大于0 if pid: # 退出父进程,sys.exit()方法比os._exit()方法会多执行一些刷新缓冲工作 sys.exit(0) # 子进程默认继承父进程的工作目录,最好是变更到根目录,否则回影响文件系统的卸载 os.chdir('/') # 子进程默认继承父进程的umask(文件权限掩码),重设为0(完全控制),以免影响程序读写文件 os.umask(0) # 让子进程成为新的会话组长和进程组长 os.setsid() # 注意了,这里是第2次fork,也就是子进程的子进程,我们把它叫为孙子进程 _pid = os.fork() if _pid: # 退出子进程 sys.exit(0) # 此时,孙子进程已经是守护进程了,接下来重定向标准输入、输出、错误的描述符(是重定向而不是关闭, 这样可以避免程序在 print 的时候出错) # 刷新缓冲区先,小心使得万年船 sys.stdout.flush() sys.stderr.flush() # dup2函数原子化地关闭和复制文件描述符,重定向到/dev/nul,即丢弃所有输入输出 with open('/dev/null') as read_null, open('/dev/null', 'w') as write_null: os.dup2(read_null.fileno(), sys.stdin.fileno()) os.dup2(write_null.fileno(), sys.stdout.fileno()) os.dup2(write_null.fileno(), sys.stderr.fileno()) # 写入pid文件 if pid_file: with open(pid_file, 'w+') as f: f.write(str(os.getpid())) # 注册退出函数,进程异常退出时移除pid文件 atexit.register(os.remove, pid_file)
概括一下守護程式的寫步驟:
1、fork出子進程,退出父程式
2、子程式變更工作目錄(chdir)、檔案權限掩碼(umask)、進程組和會話組(setsid)
3、子進程fork孫子進程,退出子進程
4、孫子進程刷新緩衝,重定向標準輸入/輸出/錯誤(一般到/dev/null,意即丟棄)
5、(可選)pid寫入檔案
第一次fork,是為了脫離終端控制的魔爪。父進程之所以退出,是因為終端敲擊鍵盤、或者關閉時給它發送了信號;而fork出來的子進程,在父進程自殺後成為孤兒進程,進而被操作系統的init進程接管,因此脫離終端控制。
所以其實,第二次fork並不是必須的(很多開源專案裡的程式碼就沒有fork兩次)。只不過出於謹慎考慮,防止進程再次開啟一個控制終端。因為子進程現在是會話組長了(對話期的首次進程),有能力打開控制終端,再fork一次,孫子進程就不能打開控制終端了。
Linux是“一切皆檔案”,檔案描述子是核心為已開啟的檔案所建立的索引,通常是非負整數。進程透過檔案描述符執行IO操作。
每個程序有自己的文件描述符表,因此相同的描述符可能指向同一個文件,也可能指向不同文件;來自不同進程的不同的描述符,當然也有可能指向同一個文件。
預設情況下,0代表標準輸入,1代表標準輸出,2代表標準誤差。
我們知道,在Linux中,任何一個檔案都有讀取(read)、寫入(write)和執行(execute)的三種使用權限。其中,讀取的權限用數字4代表,寫權限是2,執行權限是1。指令ls -l可以查看檔案權限,r/w/x分別表示具有讀取/寫入/執行權限。
任何文件,也都有使用者(User),使用者群組(Group),其他群組(Others)三種身分權限。一般用3個數字表示檔案權限,例如754:
7,是User權限,即檔案擁有者權限
5,是Group權限,擁有者所在使用者群組的群組員所具有的權限
4,是Others權限,也就是其他群組使用者的權限啦
而umask是為了控制預設權限,防止新建檔案或資料夾具有全權。
系統一般預設為022(使用指令umask檢視),表示預設建立檔案的權限是644,資料夾是755。你應該可以看出它們的規律,就是檔案權限和umask的相加結果為666(笑),資料夾權限和umask的相加結果為777。
每個進程都屬於一個進程組(PG,Process Group),進程組可以包含多個進程。
進程組有一個進程組長(Leader),進程組長的ID(PID, Process ID)就作為整個進程組的ID(PGID,Process Groupd ID)。
登陸終端機時,就會創造一個會話,多個進程組可以包含在一個會話中。而創建會話的進程,就是會話組長。
已經是會話群組長度的進程,不可以再呼叫setsid()方法來建立會話。因此,在上面程式碼中,子進程可以呼叫setsid(),而父進程不能,因為它本身就是會話組長。
另外,sh(Bourne Shell)不支援會話機制,因為會話機制需要shell支援工作控制(Job Control)。
透過&符號,可以把指令放到背景執行。它與守護程式是不同的:
1、守護程式與終端無關,是被init程式收養的孤兒程式;而後台程式的父程式是終端,仍然可以在終端機上列印
2、守護程式在關閉終端機時依然堅挺;而後台程序會隨用戶退出而停止,除非加上nohup
3、守護程式改變了會話、進程組、工作目錄和檔案描述符,後台程序直接繼承父進程(shell)的
換句話說:守護進程就是默默地奮鬥打拼的有為青年,而後台進程是默默繼承老爸資產的富二代。
以上是Python守護程式的實現的詳細內容。更多資訊請關注PHP中文網其他相關文章!