PHP将HTML转换成纯文本内容实例
把html转换成纯文本我们可以使用很多方法,不过最简单的就是使用strip_tags函数,但是还有一些朋友会发现可以使用自定义函数过滤掉,下面整理了一些方法.
将HTML转换为纯文本:有时候可能需要将HTML文本转换为纯文本,可以使用strip_tags()函数达到这个目的,该函数删除字符串中的所有HTML和PHP标记,只剩下文本实体,其形式为:
string strip_tags(string str[,string allowable_tags])
可选的参数allowable_tags指定在此过程中可以跳过的标记,下面的例子使用了strip_tags()删除字符串中的所以HTML标记,代码如下:
$input = "Email example@example.com"; echo strip_tags($input); 这回返回以下结果:Email example@example.com 下面的例子删除<a>标记之外的所有标记: $input = "This example is yanshare!"; echo strip_tags($input, ""); //返回结果如下: This example is yanshare! PHP版将html中的<br />换行符转换为文本框中的换行符,代码如下: function br2nl($text){ return preg_replace('/<br\\s*?\/??>/i','',$text); } //或者: function br2nl($text){ $text=preg_replace('/<br\\s*?\/??>/i',chr(13),$text); return preg_replace('/ /i',' ',$text); }
登入後複製
代码如下:
<?php // $document 应包含一个 HTML 文档。 // 本例将去掉 HTML 标记,javascript 代码 // 和空白字符。还会将一些通用的 // HTML 实体转换成相应的文本。 $search = array ("'<script[^>]*.*?</script>'si", // 去掉 javascript "'<[/!]*?[^<>]*'si", // 去掉 HTML 标记 "'([rn])[s]+'", // 去掉空白字符 "'&(quot|#34);'i", // 替换 HTML 实体 "'&(amp|#38);'i", "'&(lt|#60);'i", "'&(gt|#62);'i", "'&(nbsp|#160);'i", "'&(iexcl|#161);'i", "'&(cent|#162);'i", "'&(pound|#163);'i", "'&(copy|#169);'i", "'&#(d+);'e"); // 作为 PHP 代码运行 $replace = array ("", "", "1", "\"", "&", "<", ">", " ",
登入後複製
chr(161),
chr(162),
chr(163),
chr(169),
"chr(1)");
$text = preg_replace ($search, $replace, $document);
<?php $mystr = << < SATO此处省略几十行HTML代码 ^ _ ^ SATO; $str = strip_tags($mystr);
登入後複製
//到这里就已经达到我的HTML转为TXT文本的目的了,哈哈,使用这个函数真方便
//下面是插件的一些切词等操作,这里就不多说了
后来我从网上看到了一个使用PHP写的方法, 使用这个方法也可以实现将HTML转为TXT文本, 个人觉得也还蛮实用的, 在这里分享一下, 代码如下:
function HtmlToText($str) { $str = preg_replace("/<sty(.*)\/style>|<scr(.*)\/script>|<!--(.*)-->/isU", "", $str); //去除CSS样式、JS脚本、HTML注释 $alltext = ""; //用于保存TXT文本的变量 $start = 1; //用于检测<左、>右标签的控制开关 for ($i = 0; $i < strlen($str); $i++) { //遍历经过处理后的字符串中的每一个字符 if (($start == 0) && ($str[$i] == ">")) { //如果检测到>右标签,则使用$start=1;开启截取功能 $start = 1; } else if ($start == 1) { //截取功能 if ($str[$i] == "<") { //如果字符是<左标签,则使用<font color='red'>|</font>替换 $start = 0; $alltext.= "<font color='red'>|</font>"; } else if (ord($str[$i]) > 31) { //如果字符是ASCII大于31的有效字符,则将字符添加到$alltext变量中 $alltext.= $str[$i]; } } } //下方是去除空格和一些特殊字符的操作 $alltext = str_replace(" "," ",$alltext); $alltext = preg_replace("/&([^;&]*)(;|&)/","",$alltext); $alltext = preg_replace("/[ ]+/s"," ",$alltext); return $alltext; }
登入後複製
使用上面这个方法也可以实现将简答的HTML代码转换为TXT文本.
本文链接:
收藏随意^^请保留教程地址.
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章
刺客信條陰影:貝殼謎語解決方案
3 週前
By DDD
Windows 11 KB5054979中的新功能以及如何解決更新問題
2 週前
By DDD
在哪裡可以找到原子中的起重機控制鑰匙卡
3 週前
By DDD
<🎜>:死鐵路 - 如何完成所有挑戰
4 週前
By DDD
Atomfall指南:項目位置,任務指南和技巧
4 週前
By DDD

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)
