XML 데이터 읽기 방법의 성능 비교(2)-XML/RSS 튜토리얼-php.cn

집

백엔드 개발

XML/RSS 튜토리얼

XML 데이터 읽기 방법의 성능 비교(2)

黄舟

Feb 13, 2017 pm 03:45 PM

그러고보니 지난 호에서는 일반적인 XML 읽기 방법을 정리했지만 일반적으로 XML 소스의 모든 데이터를 반드시 사용하는 것은 아니기 때문에 첫 글자를 기준으로 위치 등 일부 데이터를 읽어오는 실험을 해봤습니다. 제목의.

세 가지 임의 읽기 방법은 쿼리 조건만 변경하면 됩니다.

XmlDocument:
var nodeList = doc.DocumentElement.SelectNodes("item[substring(title,1,1)=&#39;M&#39;][position() mod 10 = 0]");
　　XPathNavigator:
var nodeList = nav.Select("/channel/item[substring(title,1,1)=&#39;M&#39;][position() mod 10 = 0]");
　　Xml Linq:
var nodelist = from node in xd.XPathSelectElements("/channel/item[substring(title,1,1)=&#39;M&#39;][position() mod 10 = 0]")

로그인 후 복사

XPath를 사용하면 코드 한 줄만 변경하면 됩니다. XPath는 또한 익히기가 매우 쉽고 SQL보다 훨씬 간단합니다. XPath 사용자를 위한 W3C Shcool의 구문 소개와 MSDN의 LINQ To XML을 참조하면 15분 안에 그 비밀을 익힐 수 있습니다.

하지만 XmlReader 방식의 경우 M으로 시작하는 제목도 읽어서 10개 항목 중 1개 항목을 선택하는 것도 쉽지 않습니다. 우아하게 구현되어서 이렇게 해야 했습니다. :

Code

static List<Channel> testXmlReader2()
{
    var lstChannel = new List<Channel>();
    var reader = XmlReader.Create(xmlStream);
    int n = 0;Channel channel = null;
Search:
    while (reader.Read())
    {
        if (reader.Name == "item" && reader.NodeType == XmlNodeType.Element)
        {  
            while (reader.Read())
            {
                if (reader.Name == "item") break;
                if (reader.NodeType != XmlNodeType.Element) continue;
                switch (reader.Name)
                {
                    case "title":
                        var title = reader.ReadString();
                        if (title[0] != &#39;M&#39;) goto Search;          
                        n++;
                        if (n % 10 != 0) goto Search; 
                        channel = new Channel();
                        channel.Title = title;
                        break;
                    case "link":
                        channel.Link = reader.ReadString();
                        break;
                    case "description":
                        channel.Description = reader.ReadString();
                        break;
                    case "content":
                        channel.Content = reader.ReadString();
                        break;
                    case "pubDate":
                        channel.PubDate = reader.ReadString();
                        break;
                    case "author":
                        channel.Author = reader.ReadString();
                        break;
                    case "category":
                        channel.Category = reader.ReadString();
                        break;
                    default:
                        break;
                }
                lstChannel.Add(channel);
            }
        }
    }
    return lstChannel;
}

로그인 후 복사

코드 구조가 크게 변경된 것을 볼 수 있습니다. 조건부 필터링을 수행하려면 로컬 변수 n을 추가하고, 엔터티 클래스의 초기화를 조정하고, 컬렉션 문의 위치를 추가해야 했고, 수년 동안 잊어버렸던 goto 문을 사용해야 했습니다. 점프합니다(VB가 더 좋습니다). Lao Zhao의 말에 따르면, 비즈니스 로직이 코드 세부사항의 구현에 스며들고 있습니다.

작업이 하위 계층에 매우 가깝기 때문에 매크로 수준에서 좋은 코드 최적화 방법을 찾기가 어렵습니다. 필터링 조건, 즉 비즈니스 로직이 더 복잡해지면 코드도 완전히 달라지게 되고, 이해성과 유지보수성은 거울과 같게 됩니다.

이제 시간 성능을 비교해 보겠습니다.

XmlDocment    26ms    
XPathNavigator    26ms    
XmlTextReader    20ms    
Xml Linq    28ms

로그인 후 복사

4가지 방법의 데이터가 가까워졌습니다. Document와 Navigator의 시간 소모가 크게 줄었고, Reader 방법도 크게 줄지 않았습니다. 처음부터 끝까지 읽어야 하기 때문에 3ms가 줄어든 것은 엔터티 객체 생성 오버헤드가 줄어들었기 때문일 수 있습니다. 더 이상한 점은 Linq 방식이 바뀌지 않고 결국 떨어졌다는 것입니다.

다양한 쿼리 조건을 테스트할 수 있습니다. 이 네 가지 방법에는 각각 XML 소스의 크기와 관련된 자체 성능 제한이 있음을 알 수 있습니다. 예를 들어 처음 두 메서드의 경우 XmlDocument.Load 메서드의 실행 시간에 따라 달라집니다. 내 컴퓨터에서는 Xml을 로드하는 데 23ms가 걸립니다. Linq 메서드는 깨지지 않습니다. 처리할 결과가 거의 없으면 실행 시간이 1~2밀리초 줄어듭니다.

문서 및 탐색기 모드에서는 데이터 양이 증가함에 따라 성능이 크게 저하됩니다. 쓸모없는 물건을 많이 만들어내기 때문이라고 추측하기 쉽습니다. 각 방식의 메모리 사용량을 살펴보면, 필터링 없이 모든 데이터를 로드했을 때 Document 방식은 약 23.3M 정도의 메모리를 차지하는 반면, Navigator 방식은 약 22.9M 정도만 차지하는 것을 알 수 있습니다. 이 역시 성능이 좋은 이유를 설명합니다. Document 메소드의 감소가 더욱 뚜렷해졌습니다. 리더 모드는 데이터가 가득 차 있으며 약 20.1M 정도의 메모리만 필요합니다. 프로그램 시작 자체의 오버헤드를 제외하면 이전 두 가지 방법에 비해 절반 미만의 메모리를 차지합니다. Linq 방식은 Reader 방식에 비해 메모리 사용량이 500k도 채 안 되는 놀라운 메모리 성능을 자랑합니다.

추가 분석을 통해 추가 결론에 도달했습니다. 특별한 필요가 없는 한 XmlTextReader는 변경에 대한 준비가 제대로 되어 있지 않으며 오류가 발생하기 쉽습니다. 어떤 경우에는 시간 성능이 Navigator 방법보다 약간 낮기는 하지만 Linq 방법을 사용하는 것이 더 강력하게 권장됩니다. 그러나 뛰어난 메모리 사용 성능이 첫 번째 선택이 되었습니다. 그리고 저는 Linq To XML이 앞으로 더욱 강력해질 것이라고 믿습니다.

위는 XML 데이터 읽기 방식의 성능 비교입니다(2). 더 많은 관련 내용은 PHP 중국어 홈페이지(www.php.cn)를 참고해주세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7509

Cakephp 튜토리얼

1378

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

PowerPoint를 사용하여 XML 파일을 열 수 있나요? Feb 19, 2024 pm 09:06 PM

XML 파일을 PPT로 열 수 있나요? XML, Extensible Markup Language(Extensible Markup Language)는 데이터 교환 및 데이터 저장에 널리 사용되는 범용 마크업 언어입니다. HTML에 비해 XML은 더 유연하고 자체 태그와 데이터 구조를 정의할 수 있으므로 데이터 저장과 교환이 더 편리하고 통합됩니다. PPT 또는 PowerPoint는 프레젠테이션 작성을 위해 Microsoft에서 개발한 소프트웨어입니다. 이는 포괄적인 방법을 제공합니다.

Python을 사용하여 XML 데이터 병합 및 중복 제거 Aug 07, 2023 am 11:33 AM

Python을 사용하여 XML 데이터 병합 및 중복 제거 XML(eXtensibleMarkupLanguage)은 데이터를 저장하고 전송하는 데 사용되는 마크업 언어입니다. XML 데이터를 처리할 때 여러 XML 파일을 하나로 병합하거나 중복된 데이터를 제거해야 하는 경우가 있습니다. 이 기사에서는 Python을 사용하여 XML 데이터 병합 및 중복 제거를 구현하는 방법을 소개하고 해당 코드 예제를 제공합니다. 1. XML 데이터 병합 XML 파일이 여러 개인 경우 이를 병합해야 합니다.

Python을 사용하여 XML 데이터 필터링 및 정렬 Aug 07, 2023 pm 04:17 PM

Python을 사용하여 XML 데이터 필터링 및 정렬 구현 소개: XML은 데이터를 태그 및 속성 형식으로 저장하는 일반적으로 사용되는 데이터 교환 형식입니다. XML 데이터를 처리할 때 데이터를 필터링하고 정렬해야 하는 경우가 많습니다. Python은 XML 데이터를 처리하는 데 유용한 많은 도구와 라이브러리를 제공합니다. 이 기사에서는 Python을 사용하여 XML 데이터를 필터링하고 정렬하는 방법을 소개합니다. XML 파일 읽기 시작하기 전에 XML 파일을 읽어야 합니다. Python에는 많은 XML 처리 라이브러리가 있습니다.

Python에서 XML 데이터를 CSV 형식으로 변환 Aug 11, 2023 pm 07:41 PM

Python의 XML 데이터를 CSV 형식으로 변환 XML(ExtensibleMarkupLanguage)은 데이터 저장 및 전송에 일반적으로 사용되는 확장 가능한 마크업 언어입니다. CSV(CommaSeparatedValues)는 데이터 가져오기 및 내보내기에 일반적으로 사용되는 쉼표로 구분된 텍스트 파일 형식입니다. 데이터를 처리할 때, 간편한 분석과 처리를 위해 XML 데이터를 CSV 형식으로 변환해야 하는 경우가 있습니다. 파이썬은 강력하다

PHP를 사용하여 XML 데이터를 데이터베이스로 가져오기 Aug 07, 2023 am 09:58 AM

PHP를 사용하여 데이터베이스로 XML 데이터 가져오기 소개: 개발 중에 추가 처리 및 분석을 위해 외부 데이터를 데이터베이스로 가져와야 하는 경우가 많습니다. 일반적으로 사용되는 데이터 교환 형식인 XML은 구조화된 데이터를 저장하고 전송하는 데 자주 사용됩니다. 이 기사에서는 PHP를 사용하여 XML 데이터를 데이터베이스로 가져오는 방법을 소개합니다. 1단계: XML 파일 구문 분석 먼저 XML 파일을 구문 분석하고 필요한 데이터를 추출해야 합니다. PHP는 XML을 구문 분석하는 여러 가지 방법을 제공하며 그 중 가장 일반적으로 사용되는 방법은 Simple을 사용하는 것입니다.

Python은 XML과 JSON 간의 변환을 구현합니다. Aug 07, 2023 pm 07:10 PM

Python은 XML과 JSON 간의 변환을 구현합니다. 소개: 일상적인 개발 프로세스에서 우리는 종종 서로 다른 형식 간에 데이터를 변환해야 합니다. XML과 JSON은 일반적인 데이터 교환 형식입니다. Python에서는 다양한 라이브러리를 사용하여 XML과 JSON을 변환할 수 있습니다. 이 문서에서는 코드 예제와 함께 일반적으로 사용되는 몇 가지 방법을 소개합니다. 1. Python에서 XML을 JSON으로 변환하려면 xml.etree.ElementTree 모듈을 사용할 수 있습니다.

Python을 사용하여 XML의 오류 및 예외 처리 Aug 08, 2023 pm 12:25 PM

Python을 사용하여 XML에서 오류 및 예외 처리하기 XML은 구조화된 데이터를 저장하고 표현하는 데 일반적으로 사용되는 데이터 형식입니다. Python을 사용하여 XML을 처리할 때 때때로 오류와 예외가 발생할 수 있습니다. 이 기사에서는 Python을 사용하여 XML의 오류 및 예외를 처리하는 방법을 소개하고 참조용 샘플 코드를 제공합니다. XML 구문 분석 오류를 잡기 위해 try-Exception 문을 사용하십시오. Python을 사용하여 XML을 구문 분석할 때 가끔 오류가 발생할 수 있습니다.

Python은 XML의 특수 문자와 이스케이프 시퀀스를 구문 분석합니다. Aug 08, 2023 pm 12:46 PM

Python은 XML의 특수 문자와 이스케이프 시퀀스를 구문 분석합니다. XML(eXtensibleMarkupLanguage)은 서로 다른 시스템 간에 데이터를 전송하고 저장하는 데 일반적으로 사용되는 데이터 교환 형식입니다. XML 파일을 처리할 때 특수 문자와 이스케이프 시퀀스가 포함되어 구문 분석 오류가 발생하거나 데이터가 잘못 해석될 수 있는 상황이 자주 발생합니다. 따라서 Python을 사용하여 XML 파일을 구문 분석할 때 이러한 특수 문자와 이스케이프 시퀀스를 처리하는 방법을 이해해야 합니다. 1. 특수문자 및

See all articles

XML 데이터 읽기 방법의 성능 비교(2)

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제