목차
JAVA WEB 잘못된 코드 문제 분석
잘못된 코드의 원인
인코딩 및 디코딩
가블드 코드 분석 및 솔루션
Java java지도 시간 JAVA WEB 참고 사항--한자가 깨져 있는 문자

JAVA WEB 참고 사항--한자가 깨져 있는 문자

Jun 26, 2017 am 11:11 AM
web 중국인 왜곡된 문자 메모

JAVA WEB 잘못된 코드 문제 분석

잘못된 코드의 원인

Java 웹 개발 과정에서 잘못된 코드 문제를 자주 접하게 되는 이유는 문자 인코딩과 디코딩 방법의 불일치로 요약할 수 있습니다. .

문자가 깨지는 이유는 문자 인코딩과 디코딩 방법이 일치하지 않기 때문인데 왜 문자를 인코딩해야 할까요? 인코딩하지 않아도 괜찮을까요? 컴퓨터가 데이터를 저장하는 기본 단위가 1바이트, 즉 8비트이기 때문에 표현할 수 있는 최대 문자 수는 28=256자이고, 우리 현실 사회에 존재하는 문자(한자)는 문자, 영어, 기타 문자 등)은 이 숫자를 훨씬 초과하므로 문자와 바이트 간의 충돌을 해결하려면 문자를 컴퓨터에 저장하기 전에 인코딩해야 합니다.

인코딩 및 디코딩

 컴퓨터의 일반적인 인코딩 방법에는 ASCII, ISO-8859-1, GB2312, UTF-16 및 UTF-8이 있습니다.

 ASCII 코드는 바이트의 하위 7비트로 표현되므로 표현할 수 있는 최대 문자 수는 27=128입니다. ISO-8859-1은 ASCII 코드를 기반으로 한 ISO 조직의 확장이며 ASCII 코드와 호환되며 대부분의 서유럽 문자를 포함합니다. ISO8859-1은 1바이트를 사용하여 표현하므로 최대 256자를 표현할 수 있습니다. GB2312는 더블바이트 인코딩을 사용합니다. 인코딩 범위는 A1-F7입니다. 여기서 A1-A9는 기호 영역이고 B0-F7은 6763개의 한자를 포함하는 한자 영역입니다. GBK는 GB2312 인코딩을 확장하고, 표현할 수 있는 한자가 21,003자에 달합니다. UTF-16은 어떤 문자를 표현하든 2바이트로 표현되는 고정 길이 인코딩 방식을 사용합니다. 이는 JAVA 메모리의 문자 저장 형식이기도 합니다. UTF-16과 달리 UTF-8은 가변 길이 인코딩 방식을 사용하며 다양한 유형의 문자를 1~6바이트로 구성할 수 있습니다.

아래와 같이 문자열 "Hyuuga Hinata"를 사용하여 컴퓨터에서 다양한 인코딩 방식의 인코딩을 살펴보겠습니다.

가블드 코드 분석 및 솔루션

 JAVA WEB의 잘못된 코드 문제는 요청으로 인한 잘못된 코드와 응답으로 인한 잘못된 코드로 구분합니다. 코드가 왜곡된 이유, 즉 문자를 분석해야 합니다. 인코딩 방법은 무엇이며 디코딩 방법은 무엇입니까?

요청으로 인해 코드가 왜곡되는 경우에는 HTTP 요청을 분석하여 인코딩 방법을 확인해야 합니다. HTTP 요청은 Get 요청과 Post 요청으로 나누어지므로 다음에서 별도로 논의하겠습니다.

Get 요청의 경우 브라우저의 기본 요청 방법이며, 제출 시 양식을 "Get"으로 설정한 경우의 제출 방법입니다. 다음과 같이 Firefox 브라우저를 통해 특정 콘텐츠를 확인합니다.

주소 표시줄은

요청 콘텐츠는

문자열은 요청 라인에 저장되어 웹 서버로 전송됩니다. "Hyuga Hinata" 인코딩을 통해 브라우저에서 문자열에 대해 사용하는 인코딩 방법이 "UTF-8"임을 알 수 있습니다.

서버 코드를 보면 아래와 같이 문자가 깨져 있는 것을 볼 수 있습니다. 이는 서버가 기본적으로 ISO-8859-1을 사용하여 문자열 인코딩을 받은 후 데이터를 디코딩하기 때문입니다. 접근 방식이 획일적이지 않습니다. 솔루션 회로도는 다음과 같습니다:

 Java 웹 개발 과정에서 우리는 하이퍼링크로 매개변수를 전달하며 중국어 상황을 자주 접하게 됩니다. 이 경우 중국어를 인코딩해야 하며 이를 UTF-8로 설정할 수 있으며 디코딩 방식은 위와 동일합니다.

 

<a href="${pageContext.request.contextPath}/Test?user=<%=URLEncoder.encode("日向雏田", "UTF-8")%>">点击</a>
로그인 후 복사

  게시물 요청의 경우 폼 제출을 '게시'로 설정한 경우의 제출 방식입니다. 다음과 같이 Firefox 브라우저를 통해 특정 콘텐츠를 확인합니다.

주소 표시줄과 페이지는 다음과 같습니다.

 

게시물 요청 콘텐츠는

 

에서 위 그림에서 알 수 있듯이 게시 요청에서는 요청 내용이 요청 본문에 직접 배치되어 웹 서버로 전송되며 인코딩 방법은 "utf-8"입니다.

 이 응답 Servlet에서 doPost 메소드 본문은 다음과 같습니다.

 

public void doPost(HttpServletRequest request, HttpServletResponse response)
			throws ServletException, IOException {
		String user=request.getParameter("user");
		System.out.println(user);//输出为日向雏田
	}
로그인 후 복사

  여기서 코드가 왜곡되는 이유는 여전히 코드 getParameter("user")가 웹 서버는 기본 디코딩 체계 "ISO-8859-1"을 사용하여 인코딩과 디코딩 체계 간에 불일치가 발생합니다. 해결 방법은 get request garbled 솔루션을 사용하는 것이지만 직접적으로 수행하는 더 간단한 솔루션이 있습니다. 메소드 본문의 인코딩을 지정합니다. /Decoding 구성표는 "utf-8"입니다. 계획은 다음과 같습니다. 이상으로 요청으로 인해 왜곡된 코드에 대한 분석이 완료되었습니다.
충격으로 인해 왜곡된 코드에서 웹 서버는 응답 내용을 응답 본문에 작성한 후 상태 줄을 포함하지 않고 클라이언트에 반환합니다. 예를 들어 브라우저에 "HelloWorld"가 출력되면 아래 그림과 같은 응답이 나옵니다.

응답으로 인해 발생하는 잘못된 코드에 대해 다음과 같이 네 가지 방법을 포함해야 합니다.

 
인코딩 유형 설정 response.setHeader("Content-Type", "text/html;cahrset=utf-8") 및 response.setCharacterEncoding("utf-8")과 같은 응답 본문의 인코딩 방법입니다. 응답 본문의 인코딩 방법을 설정할 때 기본값은 ISO-8859-1이며 나중에 응답 본문 문자의 인코딩 방법을 설정하면 이전 설정 인코딩 방법이 반복됩니다. getWriter 메소드 이전에는 이 두 메소드 모두 유효하며, getWriter 메소드에서 인코딩을 설정하는 메소드는 유효하지 않습니다.

그러나 이 두 가지 방법은 약간 다릅니다. 즉, setHeader("Content-Type", "text/html;cahrset=utf-8") 이 방법에서는 브라우저가 자동으로 다음과 같은 인코딩 방법을 사용합니다. 모든 브라우저가 setCharacterEncoding() 메서드를 디코딩하기 위해 이 메서드의 인코딩 메서드를 사용하는 것은 아닙니다. 아래에서 두 가지 메서드를 테스트하고 결과는 다음과 같습니다. rreee

  

  从上面可以看到第一个方法对于浏览器来说,支持的较好,提倡采用第一种方法设置响应体的字符编码方式。

  对于获取响应字符输出流的方法,如果在此之前没有设置响应体的编码方式,那么默认为null,即ISO-8859-1方式进行编码。而且后面设置的编码方式会覆盖前面设置的编码方式。在getWriter()方法之后设置的编码无效。

  对于获取响应输出字节流,我们在输出字符串时,我们需要设置字符串的编码方式如果没有那么默认ISO-8859-1。

  对于前面2个输出流,由于只有一个输出缓存,所以这两个方法互斥。

  以上,为了保证响应无乱码,需要保证字符编码和解码方法的统一,方案如下:

	public void doGet(HttpServletRequest request, HttpServletResponse response)
			throws ServletException, IOException {
//	方案1
//		response.setHeader("Content-Type", "text/html;charset=utf-8");
//		response.getWriter().write("日向雏田");
//	方案2
//		response.getOutputStream().write("日向雏田".getBytes("UTF-8"));
//	方案1,2互斥
	}
로그인 후 복사

  

  此外在Java web开发过程中,我们还会遇到当进行文件下载时,中文文件名导致的问题,如下图所示:

	public void doGet(HttpServletRequest request, HttpServletResponse response)
			throws ServletException, IOException {
		String realPath=this.getServletContext().getRealPath("/src/日向雏田.jpg");
		String fileName=realPath.substring(realPath.lastIndexOf(&#39;\\&#39;)+1);
		response.setHeader("content-disposition", "attachment;filename="+fileName);
		InputStream is=new FileInputStream(new File(realPath));
		OutputStream os=response.getOutputStream();
		byte[] buff=new byte[1024];
		int len=0;
		while((len=is.read(buff))>0){
			os.write(buff, 0, len);
		}
		os.close();
		is.close();
	}
로그인 후 복사

  采用火狐浏览器进行测试,查看页面效果,及其响应结果如下:

  

  经过查看响应头分析,下载文件名存放在响应头中,且对于中文文字没有采用UTF-8、UTF-16、GBK等等能识别中文的编码,那么对于中文文件名导致采用哪种编码方式呢?查看REF 7578得知,在此处采用ASCII编码,但是REF规定,如果不可避免的要使用非ASCII码的字符,程序员应该均匀的使用UTF-8,来最小化交互操作的问题。

  所以,解决方案就是把文件名编码成UTF-8,传递给响应头,浏览器(部分)默认对该文件名进行UTF-8解码处理。

public void doGet(HttpServletRequest request, HttpServletResponse response)
			throws ServletException, IOException {
		String realPath=this.getServletContext().getRealPath("/src/日向雏田.jpg");
		String fileName=realPath.substring(realPath.lastIndexOf(&#39;\\&#39;)+1);
		String utf_8Name=URLEncoder.encode(fileName,"utf-8");//解决方案
		response.setHeader("content-disposition", "attachment;filename="+utf_8Name);
		InputStream is=new FileInputStream(new File(realPath));
		OutputStream os=response.getOutputStream();
		byte[] buff=new byte[1024];
		int len=0;
		while((len=is.read(buff))>0){
			os.write(buff, 0, len);
		}
		os.close();
		is.close();
	}
로그인 후 복사

  效果如下:其中火狐浏览器并没有对其解码

 

위 내용은 JAVA WEB 참고 사항--한자가 깨져 있는 문자의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Xiaohongshu 메모를 삭제하는 방법 Xiaohongshu 메모를 삭제하는 방법 Mar 21, 2024 pm 08:12 PM

Xiaohongshu 메모를 삭제하는 방법 Xiaohongshu 앱에서 메모를 편집할 수 있습니다. 다음으로 편집기는 Xiaohongshu 메모 삭제 방법에 대한 사용자 사진과 텍스트를 가져옵니다. 보세요! Xiaohongshu 사용 튜토리얼 Xiaohongshu 메모 삭제 방법 1. 먼저 Xiaohongshu 앱을 열고 메인 페이지로 들어가서 오른쪽 하단에 있는 [Me]를 선택하여 특별 영역으로 들어갑니다. 2. 그런 다음 내 영역에서 다음과 같이 메모 페이지를 클릭합니다. 3. 노트 페이지에 들어가서 오른쪽 상단에 있는 [점 3개]를 클릭합니다. 4. 마지막으로 기능 표시줄이 하단에 확장되고 [삭제]를 클릭하여 완료합니다.

Call of Duty: Warzone 모바일 게임에서 중국어를 설정하는 방법 Call of Duty: Warzone 모바일 게임에서 중국어를 설정하는 방법 Mar 22, 2024 am 08:41 AM

Call of Duty Warzone은 새로 출시된 모바일 게임입니다. 많은 플레이어들이 이 게임의 언어를 중국어로 설정하는 방법에 대해 매우 궁금해하고 있습니다. 실제로 플레이어는 중국어 언어 팩만 다운로드하면 됩니다. 사용 후 수정하세요. 자세한 내용은 이 중국어 설정 방법 소개에서 배울 수 있습니다. 모바일 게임 Call of Duty: Warzone의 중국어 언어 설정 방법 1. 먼저 게임에 접속한 후 인터페이스 오른쪽 상단에 있는 설정 아이콘을 클릭합니다. 2. 나타나는 메뉴바에서 [다운로드] 옵션을 찾아 클릭하세요. 3. 이 페이지에서 [SIMPLIFIEDCHINESE](중국어 간체)를 선택하여 중국어 간체 설치 패키지를 다운로드합니다. 4. 설정으로 돌아가기

VSCode를 사용하여 중국어 설정: 전체 가이드 VSCode를 사용하여 중국어 설정: 전체 가이드 Mar 25, 2024 am 11:18 AM

중국어 VSCode 설정: 전체 가이드 소프트웨어 개발에서 Visual Studio Code(줄여서 VSCode)는 일반적으로 사용되는 통합 개발 환경입니다. 중국어를 사용하는 개발자의 경우 VSCode를 중국어 인터페이스로 설정하면 작업 효율성이 향상될 수 있습니다. 이 기사에서는 VSCode를 중국어 인터페이스로 설정하는 방법을 자세히 설명하고 특정 코드 예제를 제공하는 완전한 가이드를 제공합니다. 1단계: 언어 팩을 다운로드하고 설치합니다. VSCode를 연 후 왼쪽을 클릭합니다.

중국어를 표시하도록 Excel 테이블을 설정하는 방법은 무엇입니까? Excel 전환 중국어 작업 튜토리얼 중국어를 표시하도록 Excel 테이블을 설정하는 방법은 무엇입니까? Excel 전환 중국어 작업 튜토리얼 Mar 14, 2024 pm 03:28 PM

Excel 스프레드시트는 현재 많은 사람들이 사용하는 사무용 소프트웨어 중 하나입니다. 일부 사용자는 컴퓨터가 Win11 시스템이므로 중국어 인터페이스로 전환하고 싶지만 작동 방법을 모릅니다. 이 문제를 해결하기 위해 편집자는 모든 사용자의 질문에 답변하기 위해 왔습니다. 오늘의 소프트웨어 튜토리얼에서 공유된 내용을 살펴보겠습니다. Excel을 중국어로 전환하기 위한 튜토리얼: 1. 소프트웨어에 들어가서 페이지 상단 도구 모음 왼쪽에 있는 "파일" 옵션을 클릭합니다. 2. 아래 옵션 중에서 "옵션"을 선택하세요. 3. 새 인터페이스에 들어간 후 왼쪽의 '언어' 옵션을 클릭하세요.

Xiaohongshu에 게시한 메모가 누락된 경우 어떻게 해야 합니까? 방금 보낸 메모를 찾을 수 없는 이유는 무엇인가요? Xiaohongshu에 게시한 메모가 누락된 경우 어떻게 해야 합니까? 방금 보낸 메모를 찾을 수 없는 이유는 무엇인가요? Mar 21, 2024 pm 09:30 PM

Xiaohongshu 사용자로서 우리 모두는 게시된 노트가 갑자기 사라지는 상황을 경험해 본 적이 있을 것입니다. 이는 의심할 여지 없이 혼란스럽고 걱정스러운 일입니다. 이런 경우, 우리는 어떻게 해야 합니까? 이번 글에서는 "샤오홍슈에서 발행한 노트가 누락된 경우 어떻게 해야 할까요?"라는 주제를 중심으로 자세한 답변을 드리겠습니다. 1. Xiaohongshu에서 발행한 노트가 누락된 경우 어떻게 해야 합니까? 첫째, 당황하지 마십시오. 메모가 누락된 경우 침착함을 유지하는 것이 중요하며 당황하지 마십시오. 이는 플랫폼 시스템 장애 또는 운영 오류로 인해 발생할 수 있습니다. 출시 기록을 확인하는 것은 쉽습니다. Xiaohongshu 앱을 열고 "나" → "게시" → "모든 출판물"을 클릭하면 자신의 출판 기록을 볼 수 있습니다. 여기에서는 이전에 게시된 메모를 쉽게 찾을 수 있습니다. 3.다시 게시합니다. 발견된 경우

wwe2k24에 중국어가 있나요? wwe2k24에 중국어가 있나요? Mar 13, 2024 pm 04:40 PM

'WWE2K24'는 비주얼콘셉츠(Visual Concepts)가 제작한 레이싱 스포츠 게임으로, 2024년 3월 9일 정식 출시됐다. 이 게임은 높은 평가를 받았으며, 많은 플레이어들이 중국어 버전이 나올지 궁금해하고 있습니다. 불행하게도 아직까지 "WWE2K24"는 중국어 버전을 출시하지 않았습니다. wwe2k24는 중국어로 제공되나요? 답변: 중국어는 현재 지원되지 않습니다. 스팀 중국 지역 WWE2K24 스탠다드 버전의 가격은 199위안, 디럭스 버전은 329위안, 기념 에디션은 395위안이다. 이 게임은 구성 요구 사항이 상대적으로 높으며 프로세서, 그래픽 카드 또는 실행 메모리 측면에서 특정 표준이 있습니다. 공식 권장 구성 및 최소 구성 소개:

Xiaohongshu의 노트에 제품 링크를 추가하는 방법 Xiaohongshu의 노트에 제품 링크를 추가하는 방법에 대한 튜토리얼 Xiaohongshu의 노트에 제품 링크를 추가하는 방법 Xiaohongshu의 노트에 제품 링크를 추가하는 방법에 대한 튜토리얼 Mar 12, 2024 am 10:40 AM

Xiaohongshu 노트에 제품 링크를 추가하는 방법 Xiaohongshu 앱에서는 사용자가 다양한 콘텐츠를 탐색할 수 있을 뿐만 아니라 쇼핑도 할 수 있기 때문에 이 앱에는 쇼핑 추천 및 좋은 제품 공유에 대한 콘텐츠가 많이 있습니다. 이 앱에서는 일부 쇼핑 경험을 공유하고, 협력할 판매자를 찾고, 메모에 링크를 추가하는 등의 작업도 할 수 있습니다. 이 앱은 편리할 뿐만 아니라 많은 전문가가 만들 수 있기 때문에 많은 사람들이 쇼핑에 기꺼이 이 앱을 사용합니다. 흥미로운 콘텐츠를 탐색하고 자신에게 맞는 의류 제품이 있는지 확인할 수 있습니다. 노트에 제품 링크를 추가하는 방법을 살펴보겠습니다. 샤오홍슈 노트에 제품 링크를 추가하는 방법 휴대폰 데스크톱에서 앱을 엽니다. 앱 홈페이지를 클릭하세요

PHP로 txt 파일을 작성할 때 중국어 왜곡 문자를 해결하기 위한 팁 PHP로 txt 파일을 작성할 때 중국어 왜곡 문자를 해결하기 위한 팁 Mar 27, 2024 pm 01:18 PM

PHP로 작성한 중국어 왜곡 문자를 txt 파일로 해결하는 방법 인터넷의 급속한 발전과 함께 널리 사용되는 프로그래밍 언어인 PHP를 점점 더 많은 개발자가 사용하고 있습니다. PHP 개발에서는 중국어 내용이 포함된 txt 파일을 포함하여 텍스트 파일을 읽고 써야 하는 경우가 많습니다. 그러나 인코딩 형식 문제로 인해 때때로 작성된 중국어가 깨져서 나타날 수 있습니다. 이 기사에서는 PHP로 txt 파일에 작성된 중국어 문자 왜곡 문제를 해결하는 몇 가지 기술을 소개하고 구체적인 코드 예제를 제공합니다. PHP, 텍스트의 문제 분석

See all articles