html标签闭合检测与修复,说的有点大 , 并没有考虑的很完整,没有使用正则表达式, 适用于html文件中只有开始标签没有结束标签, 是有结束标签没有开始标签的情况。标签闭合的位置需要根据需求调整
- $str = '
-
-
- content
-
-
-
-
-
-
- content full
-
- this is content
- this is content
- This is cont
-
- This is content
this is content';
$str_len = strlen($str);
//記錄起始標籤
$pre_data = array();
//記錄起始標籤位置
$pre_pos = array();
$last_data = array();
$error_data = array ();
$error_pos = array();
$i = 0;
//標記為$start_flag = false;
while( $i
if($str[$i]==" $i++;
$_tmp_str = '';
//標記為 $start_flag = true;
/ /標記空白
$space_flag = false;
while($str[$i]!=">" && $str[$i]!="'" && $str[$i]!='" ' && $str[$i] !='/' && $i
if($str[$i]==' ') {
$space_flag = true;
}
if(!$space_flag) {
$_tmp_str .= $str[$i];
}
$i++;
}
}
$i++; $pre_data[] = $_tmp_str;
$pre_pos[] = $i;
} else if ($str[$i]=="
$i += 2;
$_tmp_str = '';
while($str[$i]!=">" && $i $_tmp_str .= $str[$i];
$i++;
}
$last_data[] = $_tmp_str;
$last_data[] = $_tmp_str;
//查看開始標籤的上一個值
if(count($pre_data)>0) {
$last_pre_node = getLastNode($pre_data, 1);
if($last_pre_node == $_tmp_str) {
//配對上, 刪除對應位置的值
array_pop($pre_data);
array_pop($pre_pos);
array_pop($last_data);
} else {
//沒有配對上, 有兩種情況
//情況一: 只有閉合標籤, 沒有開始標籤
//情況二:只有開始標籤, 沒有閉合標籤
array_pop ($last_data);
$error_data[] = $_tmp_str;
$error_pos[] = $i;
}
} else {
array_pop($last_data );
$error_data[] = $_tmp_str;
$error_pos[] = $i;
}
}else if ($str[$i]=="
$i++;
while($i
if( $str[$i]=="-" && $str[$i+1]=="-" && $str[$i+2]==">") {
$i++;
break;
} else {
$i++;
}
}
$i++;
}
$i++;
} $str[$i]=='/' && $str[$i+1]=='>') {
//跳過自動單一閉合標籤
if($start_flag) {
array_pop($pre_data);
array_pop($pre_pos);
$i+=2;
}
}else if($str[$i]= ="/" && $str[$i+1]=="*"){
$i++;
while($i
if($str[$i]=="*" && $str[$i+1]=="/") {
$i++;
break;
} else {
$i++;
}
$i++;
}
}else if($str[$i]=="'") {
$i++;
while($str[$i]!="'" && $i $i++;
}
$i++;
} else if($str[$i]=='"'){
$i++;
while($str[$ i]!='"' && $i $i++;
}
$i++;
} else {
$i++;
}
}
//確定起始標籤的位置
function confirm_pre_pos($str, $pre_pos){
$str_len = strlen($str);
$j=$pre_pos;
while($j
if($str[$j] == '"') {
$j++;
while ($j if($str[$j]=='"') {
$j++;
break;
}
$j++;
}
}
else if($str[$j] == "'") {
$j++;
while ($j if ($str[$j]=="'") { $j++; break; } $j++; } }
else if($str[$j]==">") {
$j++;
while ($j if($str[$j ]==" //退回到原有內容位置
$j--;
break;
}
$j++;
}
break ;
}
else {
$j++;
}
}
return $j;
}
🎜>
//確定起始標籤的位置
function confirm_err_pos($str, $err_pos){
$j=$err_pos;
$j--;
while($j > 0 ) {
if($str[$j] == '"') {
$j--;
while ($j if($str [$j]=='"') {
$j--;
break;
}
$j--;
}
}
else if($str[$j] == "'") {
$j--;
while ($j if($str[$j]==" '") {
$j--;
break;
}
$j--;
}
}
else if($str[$ j]==">") {
$j++;
break;
}
else {
$j--;
}
}
$j--;
}
}
return $j;
}
//取得陣列的倒數第num個值
function getLastNode(array $arr, $num) {
$len = count($arr);
if($len > $num) {
return $arr[$len-$num];
} else {
return $ arr[0];
}
}
//整理數據, 主要是向後看,進一步進行檢查
function sort_data(&$pre_data, &$pre_pos, &$error_data , &$error_pos){
$rem_key_array = array();
$rem_i_array = array();
// 取得需要刪除的值 foreach($error_dataas $key=>$value){
$count = count($pre_data);
for($i=($count-1) ; $i>=0; $i- -) {
if($pre_data[$i] == $value && !in_array($i, $rem_i_array)) {
$rem_key_array[] = $key;
$rem_i_array[] = $ i;
break;
}
}
}
//刪除起始標籤對應的值
foreach($rem_key_array as $_item) {
unset ($error_pos[$_item]);
unset($error_data[$_item]);
}
//刪除結束標籤對應的值
foreach($rem_i_array as $_item ) {
unset($pre_data[$_item]);
unset($pre_pos[$_item]);
}
}
//整理數據,閉合標籤
function modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos){
$move_log = array();
//只有閉合標籤的資料
foreach ($error_data as $key => $value) {
# code...
$_tmp_move_count = 0;
foreach ($move_log as $pos_key => $move_value) {
# code...
if($error_pos[$key]>=$pos_key) {
$_tmp_move_count += $move_value;
}
}
$data = insert_data($str, $value, $error_pos[$key]+$_tmp_move_count, false);
$str = $data['str'];
$move_log[$data['str'];
$move_log[$data['str'];
$move_log[$data[ 'pos']] = $data['move_count'];
}
//只有起始標籤的資料
foreach ($pre_data as $key => $value) {
# code...
$_tmp_move_count = 0;
foreach ($move_log as $pos_key => $move_value) {
# code...
if($pre_value) {
# code...
if($pre_pos[$ key]>=$pos_key) {
$_tmp_move_count += $move_value;
}
}
$data = insert_data($str, $value, $pre_pos[$key]+ $_tmp_move_count, true);
$str = $data['str'];
$move_log[$data['pos']] = $data['move_count'];
}
return $str;
}
//插入數據, $type 表示插入數據的方式
function insert_data($str, $insert_data, $pos, $type) {
$len = strlen($str);
//起始標籤類型
if($type ==true) {
$move_count = strlen($insert_data)+3;
$pos = confirm_pre_pos($str, $pos);
$ pre_str = substr($str, 0, $pos);
$end_str = substr($str, $pos);
$mid_str = "" . $insert_data . "> ";
//閉合標籤類型
} else {
$pos = confirm_err_pos($str, $pos);
$move_count = strlenove_count =count ($insert_data) + 2; $pre_str = substr($str, 0, $pos); $end_str = substr($str, $pos); $mid_str = ""; }
$str = $pre_str.$mid_str.$end_str;
return array('str'=>$str, 'pos'=>$pos, 'move_count'=> ;$ move_count);
}
sort_data($pre_data, $pre_pos, $error_data, $error_pos);
$new_str = 修改_data($str, $pre_data, $prepos_data, $pre_pos, $error_data, $error_pos);
echo $new_str;
// print_r($pre_data);
// print_r($pre_pos);
// print_r($error_data);
// print_r($error_pos);
// echo strlen($str);
// foreach($pre_pos as $value){
// $value = recognize_pre_pos($str, $value);
// for($i=$value-5; $i// echo $str[$i];
// }
// echo "n";
// }
// foreach($error_pos as $value){
// for($i=$value-5; $i// echo $str[$i];
// }
// echo "n ";
// }
?>
複製程式碼
|