PDF 생성 시 문자 인코딩 문제
PDF를 생성할 때 "cz" 및 "Ć"와 같은 체코어 문자가 잘못 표시되었습니다. 이 문제는 문자 인코딩 및 글꼴 선택을 포함한 다양한 요인으로 인해 발생합니다.
인코딩 참고사항
우선 중유럽과 동유럽 언어에서 사용되는 키릴 문자와 라틴 문자를 구별하는 것이 중요합니다. 코드 페이지 1250 및 1251은 이러한 지역에 대한 다양한 문자 인코딩을 나타냅니다.
텍스트 인코딩 연습
유니코드는 최신 애플리케이션에 권장되는 텍스트 인코딩 표준입니다. 그러나 코드 파일을 일반 텍스트로 저장하면 인코딩이 실수로 변경된 경우 데이터가 손상될 수 있습니다. 코드에 특수 문자를 직접 포함하는 대신 u 표기법을 사용하여 특수 문자를 나타내는 것이 좋습니다.
글꼴 선택
Helvetica는 체코어 문자 렌더링에 적합하지 않습니다. Arial 또는 FreeSans가 더 나은 선택입니다. 또한 embed 매개변수를 true로 설정하면 다양한 시스템에서 일관된 렌더링을 위해 글꼴이 PDF에 포함됩니다.
글꼴 인코딩
내장 글꼴을 사용할 때 글꼴 인코딩을 지정할 수 있습니다. Cp1250은 코드 페이지 1250 인코딩을 지정하여 각 문자에 대해 단일 바이트 표현을 생성합니다. 또는 IDENTITY_H는 문자당 여러 바이트를 사용하는 유니코드 인코딩을 나타냅니다. PDF/A 및 PDF/UA와 같은 최신 표준의 경우 유니코드 인코딩이 권장됩니다.
예
다음 코드는 Cp1250 및 IDENTITY_H 인코딩에서 FreeSans 글꼴을 사용하는 솔루션을 보여줍니다.
<code class="language-java">public static void createPdf(String dest) throws IOException, DocumentException { Document document = new Document(); PdfWriter.getInstance(document, new FileOutputStream(dest)); document.open(); // Cp1250 编码 Font f1 = FontFactory.getFont("resources/fonts/FreeSans.ttf", "Cp1250", true); Paragraph p1 = new Paragraph("测试字母 \u010c,\u0106,\u0160,\u017d,\u0110", f1); document.add(p1); // Unicode 编码 Font f2 = FontFactory.getFont("resources/fonts/FreeSans.ttf", BaseFont.IDENTITY_H, true); Paragraph p2 = new Paragraph("测试字母 \u010c,\u0106,\u0160,\u017d,\u0110", f2); document.add(p2); document.close(); }</code>
결론
PDF 생성에서 국제 문자를 처리하는 것은 쉬운 일이 아닙니다. 텍스트를 정확하게 표현하려면 문자 인코딩과 글꼴 선택을 올바르게 처리하는 것이 중요합니다.
위 내용은 PDF를 생성할 때 체코어 문자(cz, Ć 등)를 올바르게 표시하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!