因工作需要,需要採集html,把html內容儲存到資料庫。為了避免影響使用,寬高樣式需要刪除。例如圖片和p中的width, height等。
不過採集到的html中,樣式的寫法各有不同,例如大小寫,中間有空格等。
因此使用php正規寫了下面這個方法,將這些奇葩的樣式過濾。
程式碼如下:
<?php/** * 清除宽高样式 * @param String $content 内容 * @return String */function clear_wh($content){ $config = array('width', 'height'); foreach($config as $v){ $content = preg_replace('/'.$v.'\s*=\s*\d+\s*/i', '', $content); $content = preg_replace('/'.$v.'\s*=\s*.+?["\']/i', '', $content); $content = preg_replace('/'.$v.'\s*:\s*\d+\s*px\s*;?/i', '', $content); } return $content; }?>
#示範:##
<?php$html = <<<HTML <p style="text-align:center" width="500" height="300"> <p style="Width : 100px ; Height: 100 px;"> <img src="/images/test.jpg" width=400 height = 200> <p style="float:left; width: 100px; height : 200 px;"></p> </p> <p style="width : 100 px ;height: 100px"> <img src="/images/test.jpg" width=400 height = 200> </p> </p> HTML;echo '<xmp>';echo '原内容:'.PHP_EOL;echo $html.PHP_EOL.PHP_EOL;echo '过滤后内容:'.PHP_EOL;echo clear_wh($html);echo '</xmp>'; ?>
輸出:
原内容:<p style="text-align:center" width="500" height="300"> <p style="Width : 100px ; Height: 100 px;"> <img src="/images/test.jpg" width=400 height = 200> <p style="float:left; width: 100px; height : 200 px;"></p> </p> <p style="width : 100 px ;height: 100px"> <img src="/images/test.jpg" width=400 height = 200> </p></p>过滤后内容:<p style="text-align:center" > <p style=" "> <img src="/images/test.jpg" > <p style="float:left; "></p> </p> <p style=""> <img src="/images/test.jpg" > </p></p>
以上是php使用正規去除寬高樣式的詳細內容。更多資訊請關注PHP中文網其他相關文章!