首頁 後端開發 Python教學 淺談python學習之字元編碼與字串

淺談python學習之字元編碼與字串

Oct 29, 2018 pm 05:54 PM
python 字串 字元編碼

本篇文章帶給大家的內容是淺談python學習之字符編碼與字串。有一定的參考價值,有需要的朋友可以參考一下,希望對你們有幫助。

字元編碼是什麼?

例如漢字#”,可以用以下表示

十進制:20013

二進位:01001110 00101101(unicode)/11100100 10111000 10101101(utf-8)##十六

## u4e2d

ascii編碼

#ASCII
    編碼是
  • 1個位元組

  • 只能編碼純英文
  • 節省空間

  • ##unicode編碼Unicode編碼通常是2#個位元組。 (例如字母AASCII編碼是十進位的

    65
  • ,二進位的
  • 01000001

    ;A

    Unicode
  • 編碼是
  • 00000000 01000001

    .)uicode統一編碼,解決編碼衝突,亂碼問題消失

#比ascii多一倍的儲存空間,儲存和傳送時不划算(

UTF-8

解決 )utf-8編碼(可變長的unicode編碼)UTF-8編碼把一個Unicode字元根據不同的數字大小編碼成1-6個字節,常用的英文字母被編碼成1

個字節,漢字通常是3個字節,只有很生僻的字元才會被編碼成4 -6個位元組。 字元ASCII#UnicodeUTF-8A0100000100000000 01000001#01000001
##########x################################################################################################################################################# #01001110 00101101######11100100 10111000 10101101#############

1)如果你要傳輸的文字包含大量英文字符,用UTF-8編碼就能節省空間;

2)ASCII 編碼實際上可以被看成是UTF-8編碼的一部分,所以,大量只支援ASCII#編碼的歷史遺留軟體可以在UTF-8編碼下繼續運作。

電腦系統通用的字元編碼運作方式:

記憶體:統一unicode編碼

#硬碟、傳輸:轉換成utf-8

瀏覽網頁的時候,伺服器會把動態產生的Unicode內容轉換成UTF-8再傳送到瀏覽器。

Python的字串

#相關函數

  • ord()函數取得字符的整數表示(單一字元)參數為要操作的單一字符,並傳回一個整數。

  • chr()函數#將編碼轉換成對應的字元(單一字元)

  • encode()函數,將str##字串以指定的編碼方式(參數)變成bytes

'str'.encode

ascii/utf-8)傳回bytes字串

#中文以ascii編碼會報錯

  • decode()函數把從網路或磁碟上讀取的bytes以指定的編碼方式(參數)變成str

'bytes'.decode(ascii/utf-8)回傳str字串

bytes無法解碼會報錯,

如果bytes中只有一小部分無效的字節,可以傳入errors='ignore'忽略錯誤的位元組

> >> b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore') '中'

  • len( )函數,計算字串包含字元個數

#>>> len(b'ABC') 3 >>> len(b'\xe4\xb8\xad\xe6\x96\x87') 6 >>> len('中文'.encode('utf-8')) 6

在最新的Python 3版本中,字串是以Unicode#的,也就是說,Python的字串支援多語言

Python

的字串類型是str,如果要在網路上傳輸,或儲存到磁碟上,就需要把str變成bytes

>>為了避免亂碼問題,應當始終堅持使用UTF-8編碼對str bytes進行轉換<<

str和bytes的差異

  • 1)str一個字元對應若干個位元組bytes的每個字元都只佔用一個位元組。 (將多位元組的字元分解為單字節的多字元)

#>>> 'ABC'.encode('ascii') b'ABC ' >>> '中文'.encode('utf-8') b'\xe4\xb8\xad\xe6\x96\x87'

#在bytes中,無法顯示為ASCII字元的字節,以\x##顯示。

  • 2)bytes字元帶前綴,帶引號

.py檔案中含中文要用utf-8編碼

#!/usr/bin/env python3 # -*- coding: utf-8 -*-

第一行註解是為了告訴 Linux/OS X系統,這是一個Python可執行程序,##Windows系統會忽略這個註解;

第二行註解是為了告訴Python解釋器,依照UTF-8編碼讀取原始程式碼,否則,你在原始碼中寫的中文輸出可能會有亂碼。

>>編輯器用UTF-8 without BOM<<

#字串格式化問題

>>> 'Hello, %s' % 'world' 'Hello, world' >> ;> 'Hi, %s, you have $%d.' % ('Michael', 1000000) 'Hi, Michael, you have $1000000.'

%運算子

  • 就是用來格式化字串的。在字串內部有幾個%?佔位符,後面就跟幾個變數或值,順序要對應好。如果只有一個%?,括號可以省略。

  • 轉義,用%%來表示一個%

> ;>> 'growth rate: %d %%' % 7 'growth rate: 7 %'

##佔位符%d#%f#%s%x
取代內容
整數
字串
1十六進位整數

#format()另一種格式化字串的方法是使用字串的format()方法,它會用傳入的參數依序取代字串內的佔位符

{0}

{1}…###,不過這種方式寫起來比#####%##### ##要麻煩得多:#########>>> 'Hello, {0}, 成績提升了{1:.1f}%'.format('小明', 17.125) ' Hello, 小明, 成績提升了17.1%'###

以上是淺談python學習之字元編碼與字串的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

mysql 是否要付費 mysql 是否要付費 Apr 08, 2025 pm 05:36 PM

MySQL 有免費的社區版和收費的企業版。社區版可免費使用和修改,但支持有限,適合穩定性要求不高、技術能力強的應用。企業版提供全面商業支持,適合需要穩定可靠、高性能數據庫且願意為支持買單的應用。選擇版本時考慮的因素包括應用關鍵性、預算和技術技能。沒有完美的選項,只有最合適的方案,需根據具體情況謹慎選擇。

HadiDB:Python 中的輕量級、可水平擴展的數據庫 HadiDB:Python 中的輕量級、可水平擴展的數據庫 Apr 08, 2025 pm 06:12 PM

HadiDB:輕量級、高水平可擴展的Python數據庫HadiDB(hadidb)是一個用Python編寫的輕量級數據庫,具備高度水平的可擴展性。安裝HadiDB使用pip安裝:pipinstallhadidb用戶管理創建用戶:createuser()方法創建一個新用戶。 authentication()方法驗證用戶身份。 fromhadidb.operationimportuseruser_obj=user("admin","admin")user_obj.

Navicat查看MongoDB數據庫密碼的方法 Navicat查看MongoDB數據庫密碼的方法 Apr 08, 2025 pm 09:39 PM

直接通過 Navicat 查看 MongoDB 密碼是不可能的,因為它以哈希值形式存儲。取回丟失密碼的方法:1. 重置密碼;2. 檢查配置文件(可能包含哈希值);3. 檢查代碼(可能硬編碼密碼)。

如何針對高負載應用程序優化 MySQL 性能? 如何針對高負載應用程序優化 MySQL 性能? Apr 08, 2025 pm 06:03 PM

MySQL數據庫性能優化指南在資源密集型應用中,MySQL數據庫扮演著至關重要的角色,負責管理海量事務。然而,隨著應用規模的擴大,數據庫性能瓶頸往往成為製約因素。本文將探討一系列行之有效的MySQL性能優化策略,確保您的應用在高負載下依然保持高效響應。我們將結合實際案例,深入講解索引、查詢優化、數據庫設計以及緩存等關鍵技術。 1.數據庫架構設計優化合理的數據庫架構是MySQL性能優化的基石。以下是一些核心原則:選擇合適的數據類型選擇最小的、符合需求的數據類型,既能節省存儲空間,又能提升數據處理速度

Python:探索其主要應用程序 Python:探索其主要應用程序 Apr 10, 2025 am 09:41 AM

Python在web開發、數據科學、機器學習、自動化和腳本編寫等領域有廣泛應用。 1)在web開發中,Django和Flask框架簡化了開發過程。 2)數據科學和機器學習領域,NumPy、Pandas、Scikit-learn和TensorFlow庫提供了強大支持。 3)自動化和腳本編寫方面,Python適用於自動化測試和系統管理等任務。

如何將 AWS Glue 爬網程序與 Amazon Athena 結合使用 如何將 AWS Glue 爬網程序與 Amazon Athena 結合使用 Apr 09, 2025 pm 03:09 PM

作為數據專業人員,您需要處理來自各種來源的大量數據。這可能會給數據管理和分析帶來挑戰。幸運的是,兩項 AWS 服務可以提供幫助:AWS Glue 和 Amazon Athena。

2小時的Python計劃:一種現實的方法 2小時的Python計劃:一種現實的方法 Apr 11, 2025 am 12:04 AM

2小時內可以學會Python的基本編程概念和技能。 1.學習變量和數據類型,2.掌握控制流(條件語句和循環),3.理解函數的定義和使用,4.通過簡單示例和代碼片段快速上手Python編程。

mysql 可以連接到 sql 服務器嗎 mysql 可以連接到 sql 服務器嗎 Apr 08, 2025 pm 05:54 PM

否,MySQL 無法直接連接到 SQL Server。但可以使用以下方法實現數據交互:使用中間件:將數據從 MySQL 導出到中間格式,然後通過中間件導入到 SQL Server。使用數據庫鏈接器:商業工具可提供更友好的界面和高級功能,本質上仍通過中間件方式實現。

See all articles