本篇文章主要介紹PHP如何讀取漢字的點陣數據,有興趣的朋友參考下,希望對大家有幫助。
解決方法:
簡體中文國標字庫7445個字符,其中漢字6773個,包括一級漢字3755個,二級漢字3008個。採用2位元組(16位元二進位)編碼。
區碼:國標GB2312規定,所有的國標漢字與符號組成一個94×94的矩陣。在此方陣中,每一行稱為一個」區」,每一列稱為一個」位」,因此,這個方陣實際上組成了一個有94個區(區號分別為0 1到94)、每個區內有94個位元(位號分別為01到94)的漢字字元集。一個漢字所在的區號和位號簡單地組合在一起就構成了該漢字的」區位碼」。在漢字的區位碼中,高兩位為區號,低兩位為位號。由此可見,區位碼與漢字或符號之間是一一對應的。
內碼:漢字的內碼是指在電腦中表示漢字的編碼。機內碼與區位碼稍有差別。目前,對於國內大多數的電腦系統,一個漢字的內碼佔兩個位元組,分別稱為高位元組與低位元組,且這兩位位元組與區位碼的關係如下: 內碼高位元=區碼A0H(H表示十六進位) 內碼低位=位碼A0H 例如,漢字」啊」的區碼為」1601″,區碼和位碼分別用十六進位表示即為」1001H”,則它的內碼為”B0A1H”。其中B0H為內碼的高位元組,A1H為內碼的低位元組。
傳回由0和1組成的字串
<?php /** * 读取汉字点阵数据 * */ $str = "中华人民共和国"; $font_file_name = "simsun12.fon"; // 点阵字库文件名 $font_width = 12; // 单字宽度 $font_height = 12; // 单字高度 $start_offset = 0; // 偏移 $fp = fopen($font_file_name, "rb"); $offset_size = $font_width * $font_height / 8; $string_size = $font_width * $font_height; $dot_string = ""; for ($i = 0; $i < strlen($str); $i ++) { if (ord($str{$i}) > 160) { // 先求区位码,然后再计算其在区位码二维表中的位置,进而得出此字符在文件中的偏移 $offset = ((ord($str{$i}) - 0xa1) * 94 + ord($str{$i + 1}) - 0xa1) * $offset_size; $i ++; } else { $offset = (ord($str{$i}) + 156 - 1) * $offset_size; } // 读取其点阵数据 fseek($fp, $start_offset + $offset, SEEK_SET); $bindot = fread($fp, $offset_size); for ($j = 0; $j < $offset_size; $j ++) { // 将二进制点阵数据转化为字符串 $dot_string .= sprintf("%08b", ord($bindot{$j})); } } fclose($fp); echo $dot_string; ?>
總結:以上就是這篇文章的全部內容,希望能對大家的學習有所幫助。
相關推薦:
#以上是PHP如何讀取漢字的點陣數據的詳細內容。更多資訊請關注PHP中文網其他相關文章!