mysql이 데이터를 느리게 삽입하는 이유-Java베이스-php.cn

집

Java

Java베이스

mysql이 데이터를 느리게 삽입하는 이유

藏色散人

Nov 01, 2020 pm 02:53 PM

mysql

mysql이 데이터를 느리게 삽입하는 이유: 1. 기본 코드, 외부 코드 및 인덱스로 인해 삽입 효율성이 감소합니다. 2. 삽입을 위해 이 메서드를 계속 실행하기 위해 for 루프를 사용하기 때문입니다. 쿼리 결과가 제때 공개될 수 없습니다.

mysql이 데이터를 느리게 삽입하는 이유

최근 프로젝트에서는 대량의 데이터를 가져와야 하며, 삽입 과정에서도 쿼리와 삽입이 동시에 필요합니다. 삽입되는 데이터의 양은 약 100만개이다. 처음에는 100만개의 데이터가 큰 용량이 아니라고 생각하여 전원을 연결하고 연결하고 식사를 하고 돌아와서 50w가 넘는 데이터를 삽입한 후에야 겨우 알 수 있었습니다. 초당 10개를 삽입합니다. . 느낌이 너무 이상해요 왜 넣을수록 점점 느려지나요? 그래서 삽입 시간 손실을 분석하기 시작했고, 다음과 같은 해결책을 생각해 냈습니다. (INNODB 엔진이 사용하는 mysql)

1. 메인 코드, 외부 코드 및 기타 코드로 인해 삽입 효율성이 저하되는지 분석합니다. index

메인코드 : 모든 테이블에 메인코드가 필요하므로 삭제할 수 없습니다. MySQL은 기본 코드에 대한 인덱스를 자동으로 생성합니다. 이 인덱스는 기본적으로 Btree 인덱스이므로 데이터를 삽입할 때마다 추가 Btree를 삽입해야 합니다. 이 추가 삽입 시간 복잡성은 log(n)에 관한 것입니다. 이 인덱스는 삭제할 수 없으므로 최적화할 수 없습니다. 그런데 삽입될 때마다 메인 코드의 제약으로 인해 메인 코드가 나타나는지 확인해야 하는데, 이는 log(n)을 필요로 합니다. 이 오버헤드를 줄일 수 있을까요? 대답은 '예'입니다. 메인 코드를 자동 증가 ID AUTO_INCREMENT로 설정할 수 있습니다. 그러면 현재 자동 증가 값이 데이터베이스에 자동으로 기록되어 중복된 메인 코드가 삽입되지 않도록 하여 메인 코드의 중복 검사를 피할 수 있습니다. 암호. '' '' ''웨이 'S'는 '' '' '' 'through' 'through' '' '' '' '' "" "" ""전반을 통해 (부터 1 ~ 1 일부터 통과)를 통해 1 ~부터 ~부터 전반을 통해 전반적으로 전반적으로 전반적으로 전반적으로 전반적으로 전달됩니다. ‐ ‐ ‐ ‐ ‐ ‐‐‐‐‐ ‐ ‐ ‐ ‐ ‐ ‐ ‐ ‐ ‐ ‐ 다운     이 제약조건은 비즈니스 로직과 관련되어 있어 임의로 삭제할 수 없습니다. 그리고 이 시간 비용은 다른 테이블의 크기에 비례하여 일정해야 하며 삽입 횟수가 늘어나도 속도가 느려져서는 안 됩니다. 그래서 제외되었습니다.

인덱스: Btree 삽입에 따른 시간 손실을 줄이기 위해

테이블 생성 시 인덱스를 생성하지 않고 먼저 모든 데이터를 삽입할 수 있습니다. 그런 다음 테이블에 인덱스를 추가합니다. 이 방법은 실제로 시간 오버헤드를 줄여줍니다.

위와 같이 던지고 테스트한 결과 속도가 조금 빨라졌다가 500,000바에 도달한 후 다시 느려지기 시작했습니다. 문제의 핵심은 여기에 있지 않은 것 같습니다. 그래서 계속 정보를 확인하다가 중요한 문제를 발견했습니다. 2. 단일 삽입을 일괄 삽입으로 변경합니다. (참조: 링크를 열려면 클릭하세요.)

Java의 ExecuteUpdate(sql) 메소드는 sql 작업을 수행하려면 SQL에서 다양한 리소스를 호출해야 합니다. for 루프를 사용하여 이 메서드를 지속적으로 실행하여 삽입하면 비용이 많이 듭니다. 따라서 MySQL은 일괄 삽입이라는 솔루션을 제공합니다. 즉, 각 SQL은 직접 제출되지 않고 먼저 배치 작업 세트에 저장됩니다. 작업 세트의 크기가 지정된 임계값에 도달하면 이러한 SQL이 함께 mysql 끝으로 전송됩니다. 100만 개의 데이터 규모에서는 임계값을 10,000으로 설정했습니다. 즉, 한 번에 10,000개의 SQL 문이 제출됩니다. 최종 결과는 꽤 좋으며 삽입 속도는 이전보다 약 20배 빠릅니다. 일괄 삽입 코드는 다음과 같습니다.

public static void insertRelease() {  
        Long begin = new Date().getTime();  
        String sql = "INSERT INTO tb_big_data (count, create_time, random) VALUES (?, SYSDATE(), ?)";  
        try {  
            conn.setAutoCommit(false);  
            PreparedStatement pst = conn.prepareStatement(sql);  
            for (int i = 1; i <= 100; i++) {  
                for (int k = 1; k <= 10000; k++) {  
                    pst.setLong(1, k * i);  
                    pst.setLong(2, k * i);  
                    pst.addBatch();  
                }  
                pst.executeBatch();  
                conn.commit();  
            }  
            pst.close();  
            conn.close();  
        } catch (SQLException e) {  
            e.printStackTrace();  
        }  
        Long end = new Date().getTime();  
        System.out.println("cast : " + (end - begin) / 1000 + " ms");  
    }

로그인 후 복사

3. UPDATE 문의 VALUES 뒤에는 여러 개의 (?,?,?,?)

이 방법이 처음에는 위와 비슷하다고 생각했습니다. , 그러나 다른 사람들이 수행한 실험을 연구한 후 이 방법을 사용하여 위의 일괄 삽입을 개선하는 것이 5배 더 빠를 수 있다는 것을 발견했습니다. 나중에 나는 MySQL에서 내보낸 SQL 파일의 삽입 문도 이와 같이 작성되었음을 발견했습니다. . 이는 UPDATE table_name (a1,a2) VALUES (xx,xx),(xx,xx),(xx,xx)... 입니다. 즉, 문자열을 백그라운드에서 직접 연결해야 합니다. 문자열은 끝까지만 삽입되므로 StringBuffer를 사용하면 더 빠르게 삽입할 수 있습니다. 코드는 다음과 같습니다.

public static void insert() {  
        // 开时时间  
        Long begin = new Date().getTime();  
        // sql前缀  
        String prefix = "INSERT INTO tb_big_data (count, create_time, random) VALUES ";  
        try {  
            // 保存sql后缀  
            StringBuffer suffix = new StringBuffer();  
            // 设置事务为非自动提交  
            conn.setAutoCommit(false);  
            // Statement st = conn.createStatement();  
            // 比起st，pst会更好些  
            PreparedStatement pst = conn.prepareStatement("");  
            // 外层循环，总提交事务次数  
            for (int i = 1; i <= 100; i++) {  
                // 第次提交步长  
                for (int j = 1; j <= 10000; j++) {  
                    // 构建sql后缀  
                    suffix.append("(" + j * i + ", SYSDATE(), " + i * j  
                            * Math.random() + "),");  
                }  
                // 构建完整sql  
                String sql = prefix + suffix.substring(0, suffix.length() - 1);  
                // 添加执行sql  
                pst.addBatch(sql);  
                // 执行操作  
                pst.executeBatch();  
                // 提交事务  
                conn.commit();  
                // 清空上一次添加的数据  
                suffix = new StringBuffer();  
            }  
            // 头等连接  
            pst.close();  
            conn.close();  
        } catch (SQLException e) {  
            e.printStackTrace();  
        }  
        // 结束时间  
        Long end = new Date().getTime();  
        // 耗时  
        System.out.println("cast : " + (end - begin) / 1000 + " ms");  
    }

로그인 후 복사

做了以上的优化后，我发现了一个很蛋疼的问题。虽然一开始的插入速度的确快了几十倍，但是插入了50w条数据后，插入速度总是会一下突然变的非常慢。这种插入变慢是断崖式的突变，于是我冥思苦想，无意中打开了系统的资源管理器，一看发现：java占用的内存在不断飙升。突然脑海中想到：是不是内存溢出了？

4.及时释放查询结果

在我的数据库查询语句中，使用到了pres=con.prepareStatement(sql)来保存一个sql执行状态，使用了resultSet=pres.executeQuery来保存查询结果集。而在边查边插的过程中，我的代码一直没有把查询的结果给释放，导致其不断的占用内存空间。当我的插入执行到50w条左右时，我的内存空间占满了，于是数据库的插入开始不以内存而以磁盘为介质了，因此插入的速度就开始变得十分的低下。因此，我在每次使用完pres和resultSet后，加入了释放其空间的语句：resultSet.close(); pres.close(); 。重新进行测试，果然，内存不飙升了，插入数据到50w后速度也不降低了。原来问题的本质在这里！

위 내용은 mysql이 데이터를 느리게 삽입하는 이유의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7569

Cakephp 튜토리얼

1386

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

107

Related knowledge

MySQL : 쉽게 학습하기위한 간단한 개념 Apr 10, 2025 am 09:29 AM

MySQL은 오픈 소스 관계형 데이터베이스 관리 시스템입니다. 1) 데이터베이스 및 테이블 작성 : CreateAbase 및 CreateTable 명령을 사용하십시오. 2) 기본 작업 : 삽입, 업데이트, 삭제 및 선택. 3) 고급 운영 : 가입, 하위 쿼리 및 거래 처리. 4) 디버깅 기술 : 확인, 데이터 유형 및 권한을 확인하십시오. 5) 최적화 제안 : 인덱스 사용, 선택을 피하고 거래를 사용하십시오.

phpmyadmin을 여는 방법 Apr 10, 2025 pm 10:51 PM

다음 단계를 통해 phpmyadmin을 열 수 있습니다. 1. 웹 사이트 제어판에 로그인; 2. phpmyadmin 아이콘을 찾고 클릭하십시오. 3. MySQL 자격 증명을 입력하십시오. 4. "로그인"을 클릭하십시오.

MySQL : 세계에서 가장 인기있는 데이터베이스 소개 Apr 12, 2025 am 12:18 AM

MySQL은 오픈 소스 관계형 데이터베이스 관리 시스템으로, 주로 데이터를 신속하고 안정적으로 저장하고 검색하는 데 사용됩니다. 작업 원칙에는 클라이언트 요청, 쿼리 해상도, 쿼리 실행 및 반환 결과가 포함됩니다. 사용의 예로는 테이블 작성, 데이터 삽입 및 쿼리 및 조인 작업과 같은 고급 기능이 포함됩니다. 일반적인 오류에는 SQL 구문, 데이터 유형 및 권한이 포함되며 최적화 제안에는 인덱스 사용, 최적화 된 쿼리 및 테이블 분할이 포함됩니다.

MySQL을 사용하는 이유는 무엇입니까? 혜택과 장점 Apr 12, 2025 am 12:17 AM

MySQL은 성능, 신뢰성, 사용 편의성 및 커뮤니티 지원을 위해 선택됩니다. 1.MYSQL은 효율적인 데이터 저장 및 검색 기능을 제공하여 여러 데이터 유형 및 고급 쿼리 작업을 지원합니다. 2. 고객-서버 아키텍처 및 다중 스토리지 엔진을 채택하여 트랜잭션 및 쿼리 최적화를 지원합니다. 3. 사용하기 쉽고 다양한 운영 체제 및 프로그래밍 언어를 지원합니다. 4. 강력한 지역 사회 지원을 받고 풍부한 자원과 솔루션을 제공합니다.

단일 스레드 레 디스를 사용하는 방법 Apr 10, 2025 pm 07:12 PM

Redis는 단일 스레드 아키텍처를 사용하여 고성능, 단순성 및 일관성을 제공합니다. 동시성을 향상시키기 위해 I/O 멀티플렉싱, 이벤트 루프, 비 블로킹 I/O 및 공유 메모리를 사용하지만 동시성 제한 제한, 단일 고장 지점 및 쓰기 집약적 인 워크로드에 부적합한 제한이 있습니다.

MySQL 및 SQL : 개발자를위한 필수 기술 Apr 10, 2025 am 09:30 AM

MySQL 및 SQL은 개발자에게 필수적인 기술입니다. 1.MySQL은 오픈 소스 관계형 데이터베이스 관리 시스템이며 SQL은 데이터베이스를 관리하고 작동하는 데 사용되는 표준 언어입니다. 2.MYSQL은 효율적인 데이터 저장 및 검색 기능을 통해 여러 스토리지 엔진을 지원하며 SQL은 간단한 문을 통해 복잡한 데이터 작업을 완료합니다. 3. 사용의 예에는 기본 쿼리 및 조건 별 필터링 및 정렬과 같은 고급 쿼리가 포함됩니다. 4. 일반적인 오류에는 구문 오류 및 성능 문제가 포함되며 SQL 문을 확인하고 설명 명령을 사용하여 최적화 할 수 있습니다. 5. 성능 최적화 기술에는 인덱스 사용, 전체 테이블 스캔 피하기, 조인 작업 최적화 및 코드 가독성 향상이 포함됩니다.

MySQL의 장소 : 데이터베이스 및 프로그래밍 Apr 13, 2025 am 12:18 AM

데이터베이스 및 프로그래밍에서 MySQL의 위치는 매우 중요합니다. 다양한 응용 프로그램 시나리오에서 널리 사용되는 오픈 소스 관계형 데이터베이스 관리 시스템입니다. 1) MySQL은 웹, 모바일 및 엔터프라이즈 레벨 시스템을 지원하는 효율적인 데이터 저장, 조직 및 검색 기능을 제공합니다. 2) 클라이언트 서버 아키텍처를 사용하고 여러 스토리지 엔진 및 인덱스 최적화를 지원합니다. 3) 기본 사용에는 테이블 작성 및 데이터 삽입이 포함되며 고급 사용에는 다중 테이블 조인 및 복잡한 쿼리가 포함됩니다. 4) SQL 구문 오류 및 성능 문제와 같은 자주 묻는 질문은 설명 명령 및 느린 쿼리 로그를 통해 디버깅 할 수 있습니다. 5) 성능 최적화 방법에는 인덱스의 합리적인 사용, 최적화 된 쿼리 및 캐시 사용이 포함됩니다. 모범 사례에는 거래 사용 및 준비된 체계가 포함됩니다

Redis Exporter 서비스로 Redis 액 적을 모니터링하십시오 Apr 10, 2025 pm 01:36 PM

Redis 데이터베이스의 효과적인 모니터링은 최적의 성능을 유지하고 잠재적 인 병목 현상을 식별하며 전반적인 시스템 신뢰성을 보장하는 데 중요합니다. Redis Exporter Service는 Prometheus를 사용하여 Redis 데이터베이스를 모니터링하도록 설계된 강력한 유틸리티입니다. 이 튜토리얼은 Redis Exporter Service의 전체 설정 및 구성을 안내하여 모니터링 솔루션을 원활하게 구축 할 수 있도록합니다. 이 자습서를 연구하면 완전히 작동하는 모니터링 설정을 달성 할 수 있습니다.

See all articles

mysql이 데이터를 느리게 삽입하는 이유

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제