網站效能優化對於大型網站來說非常重要,一個網站的訪問打開速度影響著用戶體驗度,網站訪問速度慢會造成高跳出率,小網站很好解決,那對於大型網站由於欄目多,圖片和影像都比較龐大,那該怎麼進行整體效能優化呢?本文為你提供一份大型php網站效能和並發存取優化方案.
一、大型網站效能提高策略:
大型網站,例如門戶網站,在面對大量使用者存取、高並發請求方面,基本的解決方案集中在這樣幾個環節:使用高效能的伺服器、高效能的資料庫、高效率的程式語言、還有高效能的Web容器。這幾個解決思路在某種程度上意味著更大的投入。
web容器是一種服務程序,在伺服器一個連接埠就有一個提供對應服務的程序,而這個程序就是處理從客戶端發出的請求,如JAVA中的Tomcat容器,ASP的IIS或PWS都是這樣的容器。一個伺服器可以多個容器。
1、HTML靜態化
其實大家都知道,效率最高、消耗最小的就是純靜態化的html頁面,所以我們盡可能讓我們的網站上的頁面採用靜態頁面來實現,這個最簡單的方法其實也是最有效的方法。
2、圖片伺服器分離
大家知道,對Web伺服器來說,不管是Apache、IIS或其他容器,圖片是最消耗資源的,所以我們有必要將圖片與頁面進行分離,這是基本上大型網站都會採用的策略,他們都有獨立的、甚至很多台的圖片伺服器。這樣的架構可以降低提供頁面存取請求的伺服器系統壓力,並且可以確保系統不會因為圖片問題而崩潰。
在應用程式伺服器和圖片伺服器上,可以進行不同的設定最佳化,例如apache在設定ContentType的時候可以盡量少支援、盡量少的LoadModule,確保更高的系統消耗和執行效率。
3、資料庫叢集、庫表雜湊
大型網站都有複雜的應用,這些應用程式必須使用資料庫,那麼在面對大量存取的時候,資料庫的瓶頸很快就能顯現出來,這時一台資料庫很快就會無法滿足應用,於是我們需要使用資料庫叢集或是庫表散列。
在資料庫叢集方面,許多資料庫都有自己的解決方案,常用的MySQL提供的Master/Slave也是類似的方案。
叢集通常會使用CDN與GSBL與DNS負載平衡技術,每個地區一組前台伺服器群,例如:網易,百度使用了DNS負載平衡技術,每個頻道一組前台伺服器,一搜使用了DNS負載技術,所有頻道共用一組前台伺服器叢集。
庫表雜湊是常用且最有效的解決方案。
我們在應用程式中安裝業務和應用程式或功能模組將資料庫分離,不同的模組對應不同的資料庫或表,再按照一定的策略對某個頁面或功能進行更小的資料庫散列,例如使用者表,依照使用者ID進行表散列,這樣就能夠低成本的提升系統的效能並且有很好的擴充性。
sohu的論壇就是採用了這樣的架構,將論壇的使用者、設定、貼文等資訊進行資料庫分離,然後對貼文、使用者依照板塊和ID進行雜湊資料庫和表,最終可以在配置文件中進行簡單的配置便能讓系統隨時增加一台低成本的資料庫進來補充系統效能。
4、快取
快取一詞搞技術的都接觸過,很多地方用到快取。網站架構和網站開發中的快取也是非常重要。這裡先講述最基本的兩種快取。高級和分散式的快取在後面講述。
架構方面的緩存,對Apache比較熟悉的人都能知道Apache提供了自己的緩存模組,也可以使用外加的Squid模組進行緩存,這兩種方式均可以有效的提高Apache的訪問響應能力。
網站程式開發方面的緩存,Linux上提供的Memory Cache是常用的緩存接口,可以在web開發中使用,例如用Java開發的時候就可以調用MemoryCache對一些資料進行緩存和通訊共享,一些大型社區使用了這樣的架構。另外,使用web語言開發的時候,各種語言基本上都有自己的快取模組和方法,PHP有Pear的Cache模組,Java就更多了,.net不是很熟悉,相信也肯定有。
5、鏡像
鏡像是大型網站常採用的提高效能和資料安全性的方式,鏡像的技術可以解決不同網路存取商和地理帶來的使用者存取速度差異,例如ChinaNet和EduNet之間的差異就促使了許多網站在教育網內建立鏡像站點,資料進行定時更新或即時更新。
6、負載平衡
負載平衡將是大型網站解決高負載存取和大量並發請求採用的高端解決方案。
負載平衡技術發展了多年,有很多專業的服務提供者和產品可以選擇,我個人接觸過一些解決方法,其中有兩個架構可以給大家做參考
二、PHP程式碼編寫最佳化:
1. echo比print快很多。
兩個方法都會在頁面上列印東西,不過echo不回傳任何值,print會在成功或失敗的時候回傳0或1。
2. include_once比include更耗時。
因為它需要去檢查你要包含的class是否已經被包含進來。
3. 對於長段落的字串一定要使用單引號,而不是雙引號。
因為雙引號會去搜尋字串中的變數。例如:echo ‘This is long string’.$name就比echo 「This is long string $name」快很多。
4. 不要再循環中巢狀使用for迴圈
#5. 如果能將函數定義為靜態的
那就不要定義成為成員函數,靜態函數比成員函數快33%。
6. 如果你可以不透過正規表示式就能解決問題
##那麼就別用正規表示。正規表示式比PHP原生的函數慢一些。 例如使用str_replace取代preg_replae。7. 盡量不要使用相對路徑來包含文件
#在相對路徑中查找文件,會現在當前目錄中查找,然後依次再查找。這樣找文件就很 慢。最好是先定義WEB_ROOT這樣的常數,然後再使用這個常數來包含檔案。8. 全等符號===比相等==要快
而且if(1 == '1′)會回傳true,if(0 = = ”)也會回傳true,而當你使用全等符號的時候if(1 ==='1′)和if(0===”)都會回傳false。所以當你在程式中需要偵測一些布林變數 的時候最好使用全等符號。三、針對thinkphp 有以下幾種方式
#1. 關閉偵錯模式##由於關閉偵錯模式之後,系統會自動產生專案編譯快取以及關閉日誌寫入,這樣可以減少很多的IO載入和日誌寫入的開銷。
2. 開啟頁面壓縮輸出3.1版本開始,增加了OUTPUT_ENCODE設定參數,用於控制頁面壓縮輸出。
3. 開啟快取在網站部署環境安裝APC或 Xcache快取能夠有效提升網站運作效能和記憶體佔用
XCache 是一個開源的opcode 快取器/最佳化器, 這意味著他能夠提高您伺服器上的PHP 效能. 他透過把編譯PHP 後的資料緩衝到共享記憶體從而避免重複的編譯過程, 能夠直接使用緩衝區已編譯的程式碼從而提高速度. 通常能夠提高您的頁面生成速率2 到5 倍, 降低伺服器負載.
Alternative PHP Cache (APC)是一種對PHP有效的開放源高速緩衝儲存器工具,它能夠緩存opcode的php中間碼。
4. 欄位快取預設情況下,欄位快取是自動產生的,在開發完成之後,基本上資料庫的變動變得比較少,因此可以考慮合併字段緩存到對應的模型類,這樣能夠減少每次讀取字段緩存的IO開銷。合併的方法是在Runtime/Data/_fields下面找到對應的欄位快取檔案
四、資料庫最佳化1、選擇正確的儲存引擎
以MySQL為例,包括有兩個儲存引擎MyISAM 和InnoDB,每個引擎都有優點和缺點。
MyISAM 適合於一些需要大量查詢的應用程式。 InnoDB 的趨勢會是一個非常複雜的儲存引擎,對於一些小的應用,它會比 MyISAM 還要慢。但是它支援“行鎖” ,支援事務。
2、最佳化欄位的資料型別記住一個原則,越小的列會越快。對於大多數的資料庫引擎來說,硬碟操作可能是最重大的瓶頸。所以,把你的資料變得緊湊會對這種情況非常有幫助,因為這減少了對硬碟的存取。
如果一個表只會有幾列罷了(比如說字典表,配置表),那麼,我們就沒有理由使用INT 來做主鍵,使用MEDIUMINT, SMALLINT 或是更小的TINYINT 會更經濟一些。如果你不需要記錄時間,使用 DATE 會比 DATETIME 好得多。當然,你也需要留夠足夠的擴充空間。
3、為搜尋欄位新增索引索引不一定就是給主鍵或是唯一的欄位。如果在你的表中,有某個字段你總是要會經常用來做搜索,那麼最好是為其建立索引,除非你要搜索的字段是大的文本字段,那應該建立全文索引。
4、避免使用Select *從資料庫讀出越多的數據,那麼查詢就會變得越慢。並且,如果你的資料庫伺服器和WEB伺服器是兩台獨立的伺服器的話,這也會增加網路傳輸的負載。即使你要查詢資料表的所有字段,也盡量不要用*通配符,善用內建提供的字段排除定義也許能給帶來更多的便利。 5、使用 ENUM 而不是 VARCHAR ENUM 類型是非常快速且緊湊的。在實際上,其保存的是 TINYINT,但其外表上顯示為字串。這樣一來,用這個欄位來做一些選項清單變得相當的完美。例如,性別、民族、部門和狀態之類的這些欄位的取值是有限且固定的,那麼,你應該使用 ENUM 而不是 VARCHAR。 6、盡可能的使用NOT NULL 除非你有一個很特別的原因去使用NULL 值,你應該總是讓你的欄位保持NOT NULL 。 NULL其實需要額外的空間,而且,在你進行比較的時候,你的程式會更複雜。 當然,這裡並不是說你就不能使用NULL了,現實情況是很複雜的,還是會有些情況下,你需要使用NULL值。 7、固定長度的表會更快 如果表中的所有欄位都是“固定長度”的,整個表會被認為是“static”或“fixed-length”。 例如,表中沒有以下類型的欄位: VARCHAR,TEXT,BLOB。只要你包括了其中一個這些字段,那麼這個表就不是「固定長度靜態表」了,這樣,MySQL 引擎會用另一種方法來處理。 固定長度的表會提高效能,因為MySQL搜尋得會更快一些,因為這些固定的長度是很容易計算下一個資料的偏移量的,所以讀取的自然也會很快。而如果欄位不是定長的,那麼,每次要找下一條的話,就需要程式找到主鍵。 並且,固定長度的表也更容易被快取和重建。不過,唯一的副作用是,固定長度的字段會浪費一些空間,因為定長的字段無論你用不用,他都是要分配那麼多的空間。 使用「垂直分割」技術,你可以分割你的表成為兩個一個是定長的,一個則是不定長的。 8、垂直分割 「垂直分割」是一種將資料庫中的表格按列變成幾張表的方法,這樣可以降低表的複雜度和字段的數目,從而達到最佳化的目的。 例如:在User表中有一個字段是家庭地址,這個字段是可選字段,相比起,而且你在資料庫操作的時候除了個人資訊外,你並不需要經常讀取或是改寫這個字段。那麼,為什麼不把他放到另外一張表中呢? 這樣會讓你的表有更好的效能,大家想想是不是,大量的時候,我對於用戶表來說,只有用戶ID,用戶名,口令,用戶角色等會被經常使用。小一點的表總是會有好的性能。 另外,你需要注意的是,這些被分出去的字段所形成的表,你不會經常性地去Join他們,不然的話,這樣的性能會比不分割時還要差,而且,會是極數級的下降。 9、EXPLAIN 你的 SELECT 查詢; 使用 EXPLAIN 關鍵字可以讓你知道MySQL是如何處理你的SQL語句的。這可以幫你分析你的查詢語句或是表格結構的效能瓶頸。 EXPLAIN 的查詢結果也會告訴你你的索引主鍵被如何利用的,你的資料表是如何被搜尋和排序的…等等,等等。 通常我們可以對比較複雜的尤其是牽涉到多表的SELECT語句,把關鍵字EXPLAIN加到前面。你可以使用phpmyadmin來做這個事。詳情請見附件explain.doc. 五、前端優化 #優化完後端和資料庫之後,我們緊接著要做的就是針對輸出的頁面優化你的前端頁面和資源文件,主要包括對圖片、JS和樣式文件的最佳化。 我們建議採用下列網頁效能測試工具來偵測與分析,會給予相關的最佳化建議: PageSpeed Google開發的工具 網站管理員和網頁開發人員可以使用PageSpeed來評估他們網頁的效能,並獲得有關如何改善效能的建議。 yslow YSlow 可以對網站的頁面進行分析,並告訴你為了提高網站效能,如何基於某些規則而進行最佳化。
以上是大型php網站效能和並發存取優化方案的詳細內容。更多資訊請關注PHP中文網其他相關文章!