jsoup는 크롤링된 웹사이트의 이미지를 어떻게 로컬에 저장합니까?-JS 튜토리얼-php.cn

집

웹 프론트엔드

JS 튜토리얼

jsoup는 크롤링된 웹사이트의 이미지를 어떻게 로컬에 저장합니까?

php中世界最好的语言

Apr 13, 2018 am 09:50 AM

javascript jsoup 저장

이번에는 jsoup이 크롤링된 웹사이트의 사진을 로컬에 저장하는 방법을 보여드리겠습니다. 크롤링된 웹사이트의 사진을 로컬에 저장하는 jsoup의 주의사항은 무엇인가요? .

프로젝트 요구 사항

때문에 차량 브랜드 정보와 차량 모델 정보가 필요합니다. 어제는 jsoup 웹사이트 정보를 크롤링하면서 하루를 보냈습니다. 프로젝트는 maven+spring+springmvc+mybatis를 사용하여 작성되었습니다. jsoup 개발 가이드 주소

크롤링이 필요한 웹사이트 주소입니다

https://car.autohome.com.cn/zhaoche/pinpai/ 1. 먼저 pom.xml

에 종속성을 추가합니다. 이미지를 로컬에 저장해야 하기 때문에 commons-net 패키지를 추가했습니다

<!-- https://mvnrepository.com/artifact/org.jsoup/jsoup -->
    <dependency>
      <groupId>org.jsoup</groupId>
      <artifactId>jsoup</artifactId>
      <version>1.10.3</version>
    </dependency>
<!-- https://mvnrepository.com/artifact/commons-net/commons-net -->
    <dependency>
      <groupId>commons-net</groupId>
      <artifactId>commons-net</artifactId>
      <version>3.3</version>
    </dependency>

로그인 후 복사

2. 크롤러 코드 구현

@Controller
@RequestMapping("/car/")
public class CarController {
  //图片保存路径
  private static final String saveImgPath="C://imgs";
  /**
  * @Title: insert 品牌名称 和图片爬取和添加
  * @Description: 
  * @param @throws IOException  
  * @return void  
  * @throws
  * @date 2018年1月29日 下午4:42:57
  */ 
  @RequestMapping("add")
  public void insert() throws IOException {
    //定义想要爬取数据的地址
    String url = "https://car.autohome.com.cn/zhaoche/pinpai/";
    //获取网页文本
    Document doc = Jsoup.connect(url).get();
    //根据类名获取文本内容
    Elements elementsByClass = doc.getElementsByClass("uibox-con");
    //遍历类的集合
    for (Element element : elementsByClass) {
      //获取类的子标签数量
      int childNodeSize_1 = element.childNodeSize();
      //循环获取子标签内的内容
      for (int i = 0; i < childNodeSize_1; i++) {
        //获取车标图片地址
        String tupian = element.child(i).child(0).child(0).child(0).child(0).attr("src");
        //获取品牌名称
        String pinpai = element.child(i).child(0).child(1).text();
        //输出获取内容看是否正确
        System.out.println("车标图片地址-----------" + tupian);
        System.out.println("品牌-----------" + pinpai);
        System.out.println();
        //把车标图片保存到本地
        String tupian_1 = "http:"+tupian;
        //连接url
        URL url1 = new URL(tupian_1);
        URLConnection uri=url1.openConnection();
        //获取数据流
        InputStream is=uri.getInputStream();
        //获取后缀名
        String imageName = tupian.substring(tupian.lastIndexOf("/") + 1,tupian.length());
        //写入数据流
        OutputStream os = new FileOutputStream(new File(saveImgPath, imageName));
        byte[] buf = new byte[1024];
        int p=0;
        while((p=is.read(buf))!=-1){
          os.write(buf, 0, p);
        }
        /**
         * 因为每个品牌下有多个合资工厂
         * 比如一汽大众和上海大众还有进口大众
         * 所有需要循环获取合资工厂名称和旗下
         * 车系
         */
        
        //获取车系数量
        int childNodeSize_2 = element.child(i).child(1).child(0).childNodeSize();
        /**
         * 获取标签下子标签数量
         * 如果等于1则没有其他合资工厂
         */
        int childNodeSize_3 = element.child(i).child(1).childNodeSize();
        if(childNodeSize_3==1){
          //循环获取车系信息
          for (int j = 0; j < childNodeSize_2; j++) {
            String chexi = element.child(i).child(1).child(0).child(j).child(0).child(0).text();
            System.out.println("车系-----------" + chexi);
          }
        }else{
          /**
           * 如果childNodeSize_3大于1
           * 则有多个合资工厂
           */
          //分别获取各个合资工厂旗下车系
          for (int j = 0; j < childNodeSize_3; j++) {
            
            int childNodeSize_4 = element.child(i).child(1).child(j).childNodeSize();
            /**
             * 如果j是单数则是合资工厂名称
             * 否则是车系信息
             */
            int k = j%2;
            
            if(k==0){
              //获取合资工厂信息
              String hezipinpai = element.child(i).child(1).child(j).child(0).text();
              System.out.println("合资企业名称-----------" + hezipinpai);
            }else{
              //int childNodeSize_5 = element.child(i).child(1).child(0).childNodeSize();
              //循环获取合资工厂车系信息
              for(int l = 0; l < childNodeSize_4; l++){
                String chexi = element.child(i).child(1).child(j).child(l).child(0).child(0).text();
                System.out.println("车系-----------" + chexi);
              }
            }
          }
          
        }
        
        System.out.println("************************");
        System.out.println("************************");
        
      }
    }
  }
}

로그인 후 복사

이 기사의 사례를 읽으신 후 방법을 마스터하셨다고 생각합니다. 더 흥미로운 정보를 보려면 PHP 중국어 웹사이트의 다른 관련 기사를 주목하세요!

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7488

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

Xiaohongshu에서 워터마크 없이 사진을 저장하는 방법 Xiaohongshu에서 워터마크 없이 사진을 저장하는 방법 Mar 22, 2024 pm 03:40 PM

Xiaohongshu에는 누구나 자유롭게 볼 수 있는 풍부한 콘텐츠가 있으므로 이 소프트웨어를 사용하여 매일 지루함을 해소하고 도움을 받을 수 있습니다. 이 소프트웨어를 사용하는 과정에서 많은 사람들이 사진을 저장하고 싶어하는 경우가 있습니다. 하지만 저장된 사진에는 워터마크가 있어서 매우 영향력이 큽니다. 워터마크 없이 사진을 저장하는 방법을 알고 싶으신 분들을 위해 여기에서 누구나 즉시 이해하고 사용할 수 있는 방법을 알려드리겠습니다. 1. 링크를 복사하려면 사진 오른쪽 상단의 "..."를 클릭하세요. 2. 위챗 애플릿을 엽니다. 3. 위챗 애플릿에서 고구마 라이브러리를 검색합니다. 4. 고구마 라이브러리에 들어가서 확인하여 가져옵니다. link 5. 사진을 받아 휴대폰 앨범에 저장하세요

WebSocket과 JavaScript를 사용하여 온라인 음성 인식 시스템을 구현하는 방법 Dec 17, 2023 pm 02:54 PM

WebSocket 및 JavaScript를 사용하여 온라인 음성 인식 시스템을 구현하는 방법 소개: 지속적인 기술 개발로 음성 인식 기술은 인공 지능 분야의 중요한 부분이 되었습니다. WebSocket과 JavaScript를 기반으로 한 온라인 음성 인식 시스템은 낮은 대기 시간, 실시간, 크로스 플랫폼이라는 특징을 갖고 있으며 널리 사용되는 솔루션이 되었습니다. 이 기사에서는 WebSocket과 JavaScript를 사용하여 온라인 음성 인식 시스템을 구현하는 방법을 소개합니다.

Douyin 비디오를 다운로드하고 저장하는 방법 Mar 29, 2024 pm 02:16 PM

1. Douyin 앱을 열고 다운로드하여 저장하려는 동영상을 찾은 후 오른쪽 하단에 있는 [공유] 버튼을 클릭하세요. 2. 나타나는 팝업창에서 두 번째 줄의 기능 버튼을 오른쪽으로 밀어서 [로컬 저장]을 클릭해 주세요. 3. 이때 새로운 팝업 창이 나타나며, 사용자는 동영상의 다운로드 진행 상황을 확인하고 다운로드가 완료될 때까지 기다릴 수 있습니다. 4. 다운로드가 완료되면 [저장되었습니다. 보려면 앨범으로 이동하세요.]라는 메시지가 표시되며, 방금 다운로드한 영상이 사용자의 휴대폰 앨범에 성공적으로 저장됩니다.

WebSocket 및 JavaScript: 실시간 모니터링 시스템 구현을 위한 핵심 기술 Dec 17, 2023 pm 05:30 PM

WebSocket과 JavaScript: 실시간 모니터링 시스템 구현을 위한 핵심 기술 서론: 인터넷 기술의 급속한 발전과 함께 실시간 모니터링 시스템이 다양한 분야에서 널리 활용되고 있다. 실시간 모니터링을 구현하는 핵심 기술 중 하나는 WebSocket과 JavaScript의 조합입니다. 이 기사에서는 실시간 모니터링 시스템에서 WebSocket 및 JavaScript의 적용을 소개하고 코드 예제를 제공하며 구현 원칙을 자세히 설명합니다. 1. 웹소켓 기술

JavaScript 및 WebSocket을 사용하여 실시간 온라인 주문 시스템을 구현하는 방법 Dec 17, 2023 pm 12:09 PM

JavaScript 및 WebSocket을 사용하여 실시간 온라인 주문 시스템을 구현하는 방법 소개: 인터넷의 대중화와 기술의 발전으로 점점 더 많은 레스토랑에서 온라인 주문 서비스를 제공하기 시작했습니다. 실시간 온라인 주문 시스템을 구현하기 위해 JavaScript 및 WebSocket 기술을 사용할 수 있습니다. WebSocket은 TCP 프로토콜을 기반으로 하는 전이중 통신 프로토콜로 클라이언트와 서버 간의 실시간 양방향 통신을 실현할 수 있습니다. 실시간 온라인 주문 시스템에서는 사용자가 요리를 선택하고 주문을 하면

비디오 계정의 비디오를 사진 앨범에 저장하는 방법은 무엇입니까? 방법 공유 Mar 26, 2024 am 11:21 AM

비디오 계정은 사용자가 자신의 비디오를 촬영, 편집 및 공유할 수 있는 인기 있는 짧은 비디오 애플리케이션입니다. 그러나 때로는 필요할 때마다 다시 볼 수 있도록 이러한 멋진 비디오를 사진 앨범에 저장하고 싶을 수도 있습니다. 그럼 다음에는 해당 영상번호의 영상을 앨범에 저장하는 방법을 알려드리겠습니다. 비디오 번호 애플리케이션에 내장된 기능을 통해 비디오를 저장할 수 있습니다. 앱을 열고 저장하려는 비디오를 찾으세요. 비디오 오른쪽 하단에 있는 옵션 아이콘을 클릭하면 메뉴가 팝업되어 "앨범에 저장"을 선택합니다. 그러면 동영상이 휴대전화의 사진 앨범에 저장됩니다. 두 번째 방법은 스크린샷을 찍어 영상을 저장하는 것입니다. 이 방법은 상대적으로 간단하지만 저장된 이미지에는 비디오 컨트롤 바와 같은 순수하지 않은 요소가 포함됩니다. 너

WebSocket과 JavaScript를 사용하여 온라인 예약 시스템을 구현하는 방법 Dec 17, 2023 am 09:39 AM

WebSocket과 JavaScript를 사용하여 온라인 예약 시스템을 구현하는 방법 오늘날의 디지털 시대에는 점점 더 많은 기업과 서비스에서 온라인 예약 기능을 제공해야 합니다. 효율적인 실시간 온라인 예약 시스템을 구현하는 것이 중요합니다. 이 기사에서는 WebSocket과 JavaScript를 사용하여 온라인 예약 시스템을 구현하는 방법을 소개하고 구체적인 코드 예제를 제공합니다. 1. WebSocket이란 무엇입니까? WebSocket은 단일 TCP 연결의 전이중 방식입니다.

HP 프린터로 스캔한 파일은 어디에 저장됩니까? Feb 19, 2024 am 09:18 AM

많은 사용자가 HP 프린터를 사용하여 파일을 스캔한 후 스캔한 파일이 어디에 저장되어 있는지 알 수 없으면 내 컴퓨터에서 예약된 대로 검색할 수 있습니다. HP 프린터로 스캔한 파일은 어디에 저장되어 있습니까? 1. 먼저 내 컴퓨터를 엽니다. 2. 검색할 날짜를 입력하세요. 3. 그러면 스캔한 파일을 찾을 수 있습니다. 4. 프린터 드라이버를 설치한 후 프린터 복합기 보조 소프트웨어가 있을 것입니다. 이를 엽니다. 5. 마지막으로 스캔 폴더 아이콘을 클릭하여 파일을 찾습니다.

See all articles

jsoup는 크롤링된 웹사이트의 이미지를 어떻게 로컬에 저장합니까?

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제