html标签闭合检测与修复,说的有点大 , 并没有考虑的很完整,没有使用正则表达式, 适用于html文件中只有开始标签没有结束标签, 是有结束标签没有开始标签的情况。标签闭合的位置需要根据需求调整
- $str = '
-
-
- content
-
-
-
-
-
-
- content full
-
- this is content
- this is content
- This is cont
-
- This is content
콘텐츠입니다';
$str_len = strlen($str);
//녹화 시작 시작 태그
$pre_data = array();
//시작 태그 위치 기록
$pre_pos = array();
$last_data = array();
$error_data = array();
$error_pos = array();
$i = 0;
//< start$start_flag = false;로 표시됨 while( $i < $str_len ) { if($str[$i]=="<" && $str[$i 1]!='/' && $str[ $i 1]!='!') { $i ; $_tmp_str = ''; // < start $start_flag = true;로 표시됨 //공백으로 표시 $space_flag = false; while($str[$i]!=">" && $str[$i]!="'" && $str[$i ]!='"' && $str[$i] !='/' && $i<$str_len){ if($str[$i]==' ') { $ space_flag = true; } if(!$space_flag) { $_tmp_str .= $str[$i] } $i ; } $pre_data[] = $_tmp_str; $pre_pos[] = $i; } else if ($str[$i]=="<" && $str[$i 1]=='/') { $i = 2; $_tmp_str = ''; while($str[$i]!="> " && $i<$str_len){ $_tmp_str .= $str[$i]; $i ; } $last_data[] = $_tmp_str; //시작 태그의 이전 값 보기 if(count($pre_data)>0) {
$last_pre_node = getLastNode($pre_data, 1);
if( $ last_pre_node == $_tmp_str) {
//페어링 시 해당 위치의 값을 삭제
array_pop($pre_data);
array_pop($pre_pos);
array_pop($last_data);
} else {
//일치 없음, 두 가지 경우
//사례 1: 닫는 태그만 있고 시작 태그는 없음
//사례 2: 시작 태그만 있음 , 닫는 태그 없음
array_pop($last_data);
$error_data[] = $_tmp_str;
$error_pos[] = $i;
}
} else {
array_pop($last_data);
$error_data[] = $_tmp_str;
$error_pos[] = $i;
}
}else if ($ str[ $i]=="<" && $str[$i 1]=="!") { $i ; while($i<$str_len) { if($str[$i]=="-" && $str[$i 1]=="-" && $str[$i 2]==">") {
$ i ;
break;
} else {
$i ;
}
}
$i ;
}else if($str[$i]=='/' && $str[$i 1]=='>') {
//자동 단일 닫기 태그 건너뛰기
if ($start_flag) {
array_pop($pre_data);
array_pop($pre_pos);
$i =2;
}
}else if($ str [$i]=="/" && $str[$i 1]=="*"){
$i ;
while($i<$str_len) { if($str[$i]=="*" && $str[$i 1]=="/") { $i ; break; } else { $i ; } $i ; } }else if($str[$i]== " '"){ $i ; while($str[$i]!="'" && $i<$str_len) { $i ; } $i ; } else if($str[$i]=='"'){ $i ; while( $ str[$i]!='"' && $i<$str_len ) { $i ; } $i ; } else { $ i ; }}//시작 태그 위치 결정function verify_pre_pos($str, $pre_pos){ $str_len = strlen( $str ); $j=$pre_pos; while($j < $str_len) { if($str[$j] == '"') { $j ; while ($j<$str_len) { if($str[$j]=='"') { $j ; break; } $ j ; } } else if($str[$j] == "'") { $j ; while ($j<$str_len ) { if($str[$j]=="'") { $j ; break; } $j ; } } else if($str[$j]==">") {
$j ;
while ($j<$str_len) { if($str[$ j]=="<") { //원래 내용 위치로 복귀 $j--; break; } $j ; } break; } else { $j ; } } return $j;}//시작 태그 위치 결정function verify_err_pos($str, $err_pos){ $j=$err_pos; $j--; while($ j > 0) { if($str[$j] == '"') { $j--; while ($j<$str_len) { if ($str[$j]=='"') { $j--; break; } $j--; } } else if($str[$j] == "'") { $j--; while ($j<$str_len) { if($str[$j ] ==="'") { $j--; break; } $j--; } } else if ($ str[$j]==">") {
$j ;
break;
}
else {
$j--;
}
}
return $j;
}
//배열 맨 아래에서 숫자 값 가져오기
function getLastNode (배열 $arr , $num){
$len = count($arr);
if($len > $num) {
return $arr[$len-$num];
} else {
return $arr[0];
}
}
//데이터 정리, 주로 과거를 살펴보고 추가 검사 수행
function sort_data(&$pre_data , &$ pre_pos, &$error_data, &$error_pos){
$rem_key_array = array();
$rem_i_array = array();
//필요한 값을 가져옵니다. 삭제 예정
foreach($error_data as $key=>$value){
$count = count($pre_data);
for($i=($count- 1) ; $i> =0; $i--) {
if($pre_data[$i] == $value && !in_array($i, $rem_i_array)) {
$rem_key_array[] = $key;
$rem_i_array[] = $i;
break;
}
}
}
//시작 태그의 해당 값 삭제
foreach($rem_key_array as $_item ) {
unset($error_pos[$_item]);
unset($error_data[$_item]);
}
//해당 항목 삭제 종료 태그 값
foreach ($rem_i_array as $_item) {
unset($pre_data[$_item]);
unset($pre_pos[$_item]);
}
}
//데이터 정리 및 태그 닫기
function 수정_data($str, $pre_data, $pre_pos, $error_data, $error_pos){
$move_log = array();
/ /닫힌 태그에 대한 데이터만
foreach ($error_data as $key => $value) {
# 코드...
$_tmp_move_count = 0;
foreach ($move_log as $pos_key = > $move_value) {
# 코드...
if($error_pos[$key]>=$pos_key) {
$_tmp_move_count = $ move_value;
}
}
$data = insert_data($str, $value, $error_pos[$key] $_tmp_move_count, false);
$str = $data ['str'];
$move_log[$data['pos']] = $data['move_count'];
}
//데이터만 시작 태그
foreach ($pre_data as $key => $value) {
# 코드...
$_tmp_move_count = 0;
foreach ($move_log as $pos_key => $move_value) {
# 코드...
if($pre_pos[$key]>=$pos_key) {
$_tmp_move_count = $move_value;
}
}
$data = insert_data($str, $ value, $pre_pos[$key] $_tmp_move_count, true);
$str = $data['str'];
$ move_log[$data['pos']] = $ data['move_count'];
}
return $str;
}
//Insert data, $type 데이터를 삽입하는 방법을 나타냅니다
function insert_data($str, $insert_data, $pos, $type) {
$len = strlen($str );
//태그 유형 시작
if($type==true) {
$move_count = strlen($insert_data) 3;
$pos = verify_pre_pos($str, $pos);
$pre_str = substr($str, 0, $pos);
$end_str = substr($str, $pos);
$mid_str = "< /" . $insert_data . ">";
//닫는 태그 유형
} else {
$ pos = verify_err_pos($str, $pos);
$move_count = strlen($insert_data) 2;
$pre_str = substr($str, 0, $pos);
$end_str = substr($str, $ pos);
$mid_str = "<" $insert_data . $str = $pre_str.$mid_str.$end_str; return array('str'=>$str, 'pos'=>$pos, 'move_count'=> ;$move_count);
}
sort_data($pre_data, $pre_pos, $error_data, $error_pos);
$new_str = 수정_데이터($str, $pre_data, $pre_pos, $error_data, $error_pos);
echo $new_str;
// print_r($pre_data);
// print_r($pre_pos);
// print_r($error_data);
// print_r($error_pos);
// echo strlen($str);
// foreach($pre_pos를 $value로){
// $value = verify_pre_pos($str, $value);
// for($i=$value-5; $i<=$value; $i ) {// echo $str[$i];// }// echo "n";// }// foreach($error_pos를 $value로){ // for($i=$value-5; $i<=$value; $i ) {// echo $str[$i];// }// echo "n ";// }?>
复제대码
|