在java web編程中經常會出現亂碼,現在詳細講解一下如何進行設置,避免亂碼
1 網頁編碼
在編寫網頁的時候,需要指定網頁的編碼格式,使用
在編寫網頁的時候,需要指定網頁的編碼格式,使用來指定。此時瀏覽器讀取或傳送請求的時候會以指定的編碼格式儲存或傳送資料。在此是以utf-8形式。
例如程式碼片段:
<form action="/Pro1/bb" method="post"> 用户名: <input type="text" name="username" ><br> 性别: 男<input type="radio" name="gender" value="男"> 女<input type="radio" name="gender" value="女"><br> 喜欢的颜色:<br> 红<input type="checkbox" name="color" value="红"> 绿<input type="checkbox" name="color" value="绿"> 蓝<input type="checkbox" name="color" value="蓝"> <br>来自的国家 <select name="country"> <option value="中国">中国</option> <option value="美国">美国</option> <option value="日本">日本</option> </select> <br> <input type="submit" value="提交"> <input type="reset" value="重置"> </form>
2 後端讀取請求資料
在java web的servlet中要想取得請求的數據,需要將過來的二進位資料依照對應的碼表進行解碼人類可以讀懂字串。這個範例中是使用post方法,所以在處理post請求中,在取得有中文的請求參數前需要先設定編碼格式,不然會出現亂碼。因為伺服器預設使用iso-8859-1編碼表進行解碼。
當然,如果想要在輸出中輸出中文字符,也需要使用統一的字符編碼,此處是utf-8,代碼如下
public void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { request.setCharacterEncoding("utf-8"); response.setContentType("text/html;charset=utf-8"); PrintWriter out = response.getWriter(); String username = request.getParameter("username"); String gender = request.getParameter("gender"); String[] colors = request.getParameterValues("color"); String country = request.getParameter("country"); out.println("<!DOCTYPE HTML>"); out.println("<HTML>"); out.println(" <HEAD><TITLE>测试servlet</TITLE></HEAD>"); out.println(" <BODY>"); out.print("<h1>以下是您的输入</h1>"); out.print("<p>"); out.print("您的用户名:"+username+"<br>"); out.print("您的性别:"+gender+"<br>"); out.print("您喜欢的颜色:"); for(String cr:colors){ out.print(cr+" "); } out.print("<br>"); out.print("您的国家:"+country+"<br>"); out.print("</p>"); out.println(" </BODY>"); out.println("</HTML>"); }
注意:此處的request.setCharacterEncoding("utf-8");只對請求實體的內容有效。 post請求參數是存放在請求實體中,get方法的請求參數是放在url的後面以問號開始,‘&’連接多個參數。所以想要取得get方法的參數,需要使用手動解碼,或是使用filter。
手動解碼方法,為了簡單起見只對性別進行解碼,實際使用中需要對每一個參數進行解碼:String gender = new String(req.getParameter("gender").getBytes("iso-8859-1" ),"utf-8") ;
到此時就可以完美解決網頁和伺服器端出現漢字亂碼的現象,記住一條,出現亂碼的都是因為編碼和解碼使用不同編碼表的原因,要使用相同的編碼表,即可解決問題。