記事抄録を自動生成【JavaScript版】。
BLOG などのプログラムを作成する場合、記事の前の部分を表示する必要があることがよくありますが、不適切な切り詰めにより終了タグが破壊され、
ドキュメント構造全体が損傷する可能性があります。要求の少ないアプリケーションで使用すると、この問題が解決されます。
この機能をサーバー側で適用するかクライアント側で適用するかを検討する必要があります。この関数は実行するとマシンへの負荷が高くなる可能性があるため、
セキュリティ要件が高くない場合はクライアントに配置できます。
対応するデータベース クエリも最適化されるように、この概要をデータ テーブルの別のフィールドに配置することをお勧めします。多くの時間を費やす代わりに、小さなスペースを犠牲にするのは
かなりの取引です。
セキュリティの問題、主にコンテンツのセキュリティについてもう一度話しましょう。クライアントが通常の要約情報を変更する場合、通常、BLOG
の所有者がその権限を持ち、要約と原文の一貫性を破壊するのは彼自身の仕事です。コンテンツ以外のセキュリティはサーバー側で解決できます。したがって、この機能はクライアント側で使用することをお勧めします。
コアコード:
最近適用したところ、上記の関数がマルチバイト文字セットをうまくサポートしていないことが判明したので、書き直しました。
問題が発生した場合は、次の機能を試してみてください。
function Generate_Brief($text){
global $Briefing_Length;
mb_regex_encoding("UTF-8");
if(mb_strlen($text) <= BRIEF_LENGTH ) return $text;
$Foremost = mb_substr($text, 0, BRIEF_LENGTH);
$re = "<(/?)
(P|DIV|H1|H2|H3|H4|H5|H6|ADDRESS|PRE|TABLE|TR|TD|TH|INPUT|SELECT|TEXTAREA |OBJECT|A|UL|OL|LI|
BASE|META|LINK|HR|BR|PARAM|IMG|AREA|INPUT|SPAN)[^>]*(>?)";
$Single = "/BASE|META|LINK|HR|BR|PARAM|IMG|AREA|INPUT|BR/i";
$Stack = array(); $posStack = array();
mb_ereg_search_init($Foremost, $re, 'i');
while($pos = mb_ereg_search_pos()){
$match = mb_ereg_search_getregs();
/* [子マッチングの定式化]:
$matche[1] : A "/" 現在の "<...>" かどうかを示す文字 摩擦は、
終了部分
$matche[2] : 要素名です。
$matche[3] : 右 > 「<...>」の 摩擦
*/
if($match[1]==""){
$Elem = $match[2];
if(mb_eregi($Single, $Elem) && $match[3] !=""){
続き;
}
array_push($Stack, mb_strtoupper($Elem));
array_push($posStack, $pos[0]);
}else{
$StackTop = $Stack[count($Stack)-1];
$End = mb_strtoupper($match[2]);
if(strcasecmp($StackTop,$End)==0){
array_pop($Stack);
array_pop($posStack);
if($match[3] ==""){
$Foremost = $Foremost.">";
}
}
$cutpos = array_shift($posStack) - 1;
$Foremost = mb_substr($Foremost,0,$cutpos,"UTF-8");
$Foremost を返します。
};欢迎大家找错误。