효과적인 데이터 분석을 수행하는 방법-일반적인 문제-php.cn

집

일반적인 문제

효과적인 데이터 분석을 수행하는 방법

angryTom

Jul 22, 2019 am 11:44 AM

빅데이터

효과적인 데이터 분석을 수행하는 방법

추천 튜토리얼: Python 튜토리얼

인터넷 후반부, 지속적인 개선 작업을 배경으로 제품 관리자는 더 이상 단순히 감정에 의존하여 제품을 만드는 것이 아니라, 데이터 인식을 배양하고, 데이터를 기반으로 지속적으로 제품을 개선할 수 있습니다.

회사의 전문 데이터 분석가와 달리 제품 관리자는 사용자 및 비즈니스 수준에서 더 많은 데이터를 확인하여 데이터 변경 이유를 더 빠르고 철저하게 찾을 수 있습니다.

그렇다면 데이터가 효과적으로 기록되었다는 전제하에 어떻게 데이터를 효과적으로 분석할 수 있을까요?

1. 데이터 분석 목적을 명확히 한다

1. 데이터 분석의 목적이 개정 전과 개정 후 페이지의 장단점을 비교하는 것이라면 측정된 지표는 클릭부터 시작해야 한다 - 페이지 통과율, 이탈률 및 기타 측면에서 전자상거래 애플리케이션은 주문 전환율도 관찰해야 하며, 소셜 애플리케이션은 사용자의 방문 시간, 좋아요 빈도 및 전달 상호작용 등에 주의를 기울여야 합니다.

많은 신규 사용자가 자신의 제품을 디자인할 때 제품 자체의 디자인에 많은 시간을 할애할 수 있지만 제품의 성공을 측정하는 방법에 대해 생각하는 데 에너지를 소비하지 않습니다. "사용자. '개선'에 대한 빈말은 제품 디자인 요구사항 검토를 원활하게 통과하는 데 도움이 되지 않으며, 제품의 KPI 지표를 신속하게 효과적으로 개선할 수도 없습니다.

　　2. 데이터 분석의 목적이 특정 모듈의 비정상적인 데이터 변동 원인을 탐색하는 것이라면 분석 방법은 버전->시간->군중의 피라미드 원리에 따라 점진적으로 해체되어야 합니다.

예를 들어, 최근 홈페이지의 Guess You Like 모듈의 클릭률이 40%에서 35%로, 5%포인트 급락한 것을 발견했다면, 이때 먼저 어떤 버전이 변동되었는지, 새 버전이 온라인 상태인지, 누락된 포인트나 오류로 인해 발생했는지.

버전 변동 데이터가 일관되게 유지된다면 데이터가 언제 변경되기 시작했는지 살펴보세요. 크리스마스와 설날 휴일 요인 때문일까요? 페이지의 다른 모듈에서 전환과 같은 새로운 활동이 시작되었습니다. .

그렇지 않다면 세분화하여 트래픽 소스의 구성이 변경되었는지, 신규 사용자 노출 증가로 인한 것인지 살펴보세요.

제품 관리자는 명확한 목적을 가지고 데이터를 분석하고, 목표 달성을 위해 검증하기 위해 어떤 차원을 구성해야 하는지 생각해야 합니다. 대부분의 경우 제품 관리자는 인내심을 갖고 단계적으로 하위 구분을 해체하여 이유를 조사해야 합니다.

2. 여러 채널을 통한 데이터 수집

일반적으로 수집 채널은 4가지 유형이 있습니다.

　　1. Analysys나 iResearch 등 외부 업계 데이터 분석 보고서에서 얻은 데이터, 신중한 태도로 데이터를 관찰하고, 효과적이고 정확한 정보를 추출하고, 물에 잠길 수 있는 일부 데이터를 떼어내고 경계해야 합니다. 항상 다른 사람이 처리한 2차 데이터입니다.

　　2. AppStore, 고객 서비스 피드백, Weibo 및 기타 커뮤니티 포럼에서 사용자 피드백을 적극적으로 수집합니다. 저는 시간이 나면 커뮤니티 포럼에 가서 사용자의 상태 댓글을 자주 읽습니다. 일반적으로 이러한 댓글은 매우 좋거나 꾸짖는 등 매우 극단적이지만 이러한 댓글은 여전히 내 제품 디자인 개선에 매우 유익합니다. 네, 그 순간 사용자가 왜 그런 감정을 느꼈는지 추론해 볼 수 있습니다.

　　3. 설문지 디자인, 사용자 인터뷰, 기타 설문조사에 직접 참여하고, 사용자와 직접 대면하며, 직접 데이터를 수집하고, 사용자가 제품을 사용할 때 겪는 문제와 감정을 관찰합니다. 설문지는 핵심 질문을 다듬고 질문 수를 줄여야 하며, 재활용 결과는 비효과적이고 형식적인 설문지를 제거해야 합니다. 사용자 인터뷰에서는 유도적인 단어나 질문을 사용하여 사용자의 자연스러운 감정을 편향시키지 않도록 주의해야 합니다.

　　4. 기록된 사용자 행동 궤적에서 데이터를 연구합니다. 대기업은 일반적으로 온라인 사용자 데이터에 대한 일일 또는 실시간 피드백을 제공하기 위해 고정 회선 보고서/이메일을 보유하고 있습니다. 또한 제품 관리자나 데이터 분석가에게 SQL 쿼리 플랫폼을 제공하여 보다 심층적으로 데이터를 탐색하고 비교할 수 있습니다. 방법.

3. 간섭 데이터를 효과적으로 제거합니다

　1. 올바른 샘플 수를 선택하고, 충분히 큰 수를 선택하고, 극단적이거나 우발적인 데이터의 영향을 제거합니다. 2008년 올림픽에서 야오밍의 3점슛 성공률은 100%였고, 고베의 3점슛 성공률은 32%였습니다. 그렇다면 야오밍의 3점슛 성공률이 고베보다 높았다는 뜻인가요? 디스플레이에 문제가 있습니다. 그 올림픽에서 야오밍이 3점슛을 1개만 쐈고 코비는 53개를 쐈거든요.

　　2. 분석 결론의 편향을 줄이기 위해 동일한 샘플링 규칙을 개발하세요. 예를 들어 푸시 카피라이팅 두 개, 첫 번째는 "당신이 아직 받지 못한 마음이 따뜻해지는 테이크아웃 빨간 봉투를 가지고 있습니다. 가장 큰 빨간 봉투는 밥을 제일 잘 먹는 당신만을 위한 것입니다. 클릭해서 들어가세요", 두 번째는 "집 밖으로 나가지 않고도 테이크아웃 저온혜택을 드려요." 가족들이 따뜻하고 맛있는 음식을 즐길 수 있으니 클릭해서 모아보세요. 실험 데이터에 따르면 두 번째 푸시 카피의 클릭률은 첫 번째 푸시 카피의 클릭률보다 30% 더 높았습니다. 그렇다면 정말 두 번째 카피가 더 매력적인 걸까요? 두 번째 푸시 사본 수신자의 활동이 첫 번째 푸시 사본의 수신자 활동보다 훨씬 높은 것으로 나타났습니다.

　　3. 버전 간섭이나 휴일 요인을 제외하면 새 버전의 데이터 성능은 처음 출시될 때 매우 좋은 경우가 많습니다. 왜냐하면 적극적으로 업그레이드하는 사용자는 일반적으로 활동량이 많은 사용자이기 때문입니다. 주말이나 주요 공휴일이 가까워지면 사용자의 소비 욕구가 촉발되고 전자상거래 애플리케이션의 주문 전환율도 급격하게 높아집니다. 따라서 데이터를 비교할 때 실험군과 대조군의 데이터는 시간 차원에서 일관성을 유지해야 한다.

　　4. 과거 데이터는 잊어버리세요. 인간은 데이터 기술과 다르다. 데이터 기술은 100% 기억 능력을 갖고 있는 반면, 인간은 아호빈스의 망각의 법칙에 따라 1일 후 33%, 6일 후 25%, 31일 후 21%만 기억할 수 있다. 그러므로 심사기간을 합리적으로 선택해야 합니다. 예를 들어 Guess You Like 모듈은 관심 태그 점수에 특정 가중치 프로세스를 수행할 뿐만 아니라 제품의 수명주기와 같은 요소를 기반으로 일련의 회귀 실험을 수행하여 청중의 다양한 감소 곡선을 얻습니다. 관심분야 및 구매 경향에 따라 정기적인 시간 변경을 통해 오래된 데이터를 효과적으로 삭제하여 모듈의 클릭률을 높입니다.

　5. 실험은 A1 그룹을 분할해야 합니다. 즉, 실험 그룹 B와 통제 그룹 A에 또 다른 그룹 A1을 추가해야 합니다. A1과 A의 규칙은 일관되어야 하며, 이후 데이터 변동을 탐색해야 합니다. AB를 AA1과 비교하여 데이터의 자연적/비정상적 변동의 영향을 제거합니다. 나의 실제 A/B 실험은 A1 그룹을 설정하는 것이 매우 중요하고 필요하다는 것을 보여줍니다. 데이터 규모가 아무리 크더라도 동일한 실험 규칙을 사용하는 두 그룹의 데이터에도 약간의 변동이 있을 것입니다. 작은 변동은 정제에 있습니다. 오늘의 작업에서 우리의 판단은 크게 혼란스럽고 편향될 수 있습니다.

넷. 합리적이고 객관적으로 데이터를 검토하세요

　1. 침묵하는 사용자를 무시하지 마세요

제품 관리자는 일부 사용자의 피드백을 듣고 많은 시간을 개발에 소비합니다. 응답 기능은 대부분의 사용자가 신경 쓰지 않는 반면 매우 소수의 사용자에게 긴급한 요구 사항인 경우가 많습니다. 이는 핵심 사용자의 요구에 반하여 제품의 새 버전이 출시된 후 데이터가 급락하는 원인이 될 수도 있습니다.

침묵적인 사용자를 무시하고 제품을 사용하는 대부분의 대상 사용자의 핵심 요구 사항을 종합적으로 고려하지 않으면 인력 및 물적 자원이 낭비될 수 있으며 더 나아가 비즈니스 기회를 놓칠 수도 있습니다.

　 2. 데이터 결과를 종합적으로 이해하세요

실험 결과에 대한 기대와 우리의 경험적 지식 사이에 큰 차이가 있는 경우, 맹목적으로 결론을 내리거나 직관에 의문을 제기하지 말고 실행해 보시기 바랍니다. 데이터 분석을 더욱 철저하게 분석합니다.

예를 들어 홈페이지에서 사용자에게 활성 팝업을 전달하는 실험을 한 적이 있는데, 홈페이지 클릭률 측면에서 실험군의 데이터가 대조군을 훨씬 능가하는 것으로 나타났습니다. 전환율은 물론, 7일 유지율까지.. 각 모듈의 전환율이 기대 이상으로 크게 향상되었습니다. 그렇다면 이것이 정말 사용자의 전환율을 자극하는 활성 팝업일까요?

나중에 우리는 홈페이지에 활성 팝업을 표시할 수 있는 사용자는 Wi-Fi 환경과 같이 사용하는 환경에서 네트워크 상태가 더 좋은 경우가 많은 반면, 팝업을 표시하지 않는 사용자는 버스/지하철/상점 기타 모바일 시나리오에서는 네트워크 통신이 좋지 않아 A/B 실험 결과에 영향을 미칠 수 있습니다.

3. 데이터에 너무 의존하지 마세요

데이터에 대한 지나친 의존은 우리가 쓸모없는 데이터 분석을 많이 하게 만들고, 다른 한편으로는 제한을 가하게 됩니다. 제품 관리자가 가져야 할 영감과 창의성 .

Luo Zhenyu가 Friends of Time의 새해 전야 연설에서 언급한 것과 정확히 같습니다. 사용자가 원하는 것을 무엇이든 제공합니다. 이를 모성애 알고리즘이라고 합니다. 그러나 모성애 알고리즘에는 큰 단점이 있습니다. 추천 시간이 지날수록 점점 좁아지겠죠.

반대편에는 높이 서서 멀리 보는 아버지 사랑의 알고리즘이 있습니다. 사용자들에게 쓰레기를 손에 내려 놓고 좋은 소식을 알려 드리겠습니다. 나를 따르십시오. 당시 Qiao Bangzhu가 만든 iPhone 시리즈 제품처럼 그는 사용자의 기대를 뛰어넘는 제품을 만들기 위해 시장 분석을 살펴보거나 사용자 조사를 수행하지 않았습니다.

5. 개요

미국에서 가장 성공적인 동영상 웹사이트인 Netflix는 사용자 습관 기반 분석을 통해 영화 제작 과정에 빅데이터 분석을 통합하여 인기 미국 드라마 "House of of"를 탄생시켰습니다. 카드". 하지만 넷플릭스 직원들은 우리에게 빅데이터에 집착하면 안 된다고 하더군요

9점짜리 TV 시리즈가 고품질 상품으로 평가된다면 빅데이터는 6점이라는 낮은 점수의 위험으로부터 우리를 구할 수 있습니다. 이하이지만 단계적으로 우리를 평범하게 만들 것입니다. 대다수는 7-8 사이의 점수를 얻습니다.

위 내용은 효과적인 데이터 분석을 수행하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7500

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

PHP의 빅데이터 구조 처리 능력 May 08, 2024 am 10:24 AM

빅 데이터 구조 처리 기술: 청킹(Chunking): 데이터 세트를 분할하고 청크로 처리하여 메모리 소비를 줄입니다. 생성기: 전체 데이터 세트를 로드하지 않고 데이터 항목을 하나씩 생성하므로 무제한 데이터 세트에 적합합니다. 스트리밍: 파일을 읽거나 결과를 한 줄씩 쿼리하므로 대용량 파일이나 원격 데이터에 적합합니다. 외부 저장소: 매우 큰 데이터 세트의 경우 데이터를 데이터베이스 또는 NoSQL에 저장합니다.

2024년 AEC/O 산업의 5가지 주요 개발 동향 Apr 19, 2024 pm 02:50 PM

AEC/O(Architecture, Engineering & Construction/Operation)는 건설 산업 분야에서 건축 설계, 엔지니어링 설계, 시공 및 운영을 제공하는 종합 서비스를 말합니다. 2024년 AEC/O 산업은 기술 발전으로 인해 변화하는 도전에 직면하게 될 것입니다. 올해는 첨단 기술이 집약되어 설계, 시공, 운영의 패러다임 전환을 예고하는 해가 될 것으로 예상됩니다. 이러한 변화에 대응하여 업계에서는 빠르게 변화하는 세계의 요구 사항에 적응하기 위해 작업 프로세스를 재정의하고 우선 순위를 조정하며 협업을 강화하고 있습니다. AEC/O 산업의 다음 5가지 주요 트렌드는 2024년 핵심 주제가 될 것이며, 더욱 통합되고 대응력이 뛰어나며 지속 가능한 미래로 나아갈 것을 권장합니다. 통합 공급망, 스마트 제조

C++ 개발 경험 공유: C++ 빅데이터 프로그래밍 실무 경험 Nov 22, 2023 am 09:14 AM

인터넷 시대에 빅데이터는 새로운 자원으로 자리 잡았으며, 빅데이터 분석 기술의 지속적인 발전으로 인해 빅데이터 프로그래밍에 대한 수요가 더욱 절실해지고 있습니다. 널리 사용되는 프로그래밍 언어로서 빅 데이터 프로그래밍에서 C++의 고유한 장점은 점점 더 두드러지고 있습니다. 아래에서는 C++ 빅데이터 프로그래밍에 대한 실제 경험을 공유하겠습니다. 1. 적절한 데이터 구조 선택 적절한 데이터 구조를 선택하는 것은 효율적인 빅데이터 프로그램을 작성하는 데 중요한 부분입니다. C++에는 배열, 연결 목록, 트리, 해시 테이블 등과 같이 사용할 수 있는 다양한 데이터 구조가 있습니다.

58 초상화 플랫폼 구축에 알고리즘 적용 May 09, 2024 am 09:01 AM

1. 58초상화 플랫폼 구축 배경 먼저, 58초상화 플랫폼 구축 배경에 대해 말씀드리겠습니다. 1. 기존 프로파일링 플랫폼의 전통적인 사고로는 더 이상 충분하지 않습니다. 사용자 프로파일링 플랫폼을 구축하려면 여러 비즈니스 라인의 데이터를 통합하여 정확한 사용자 초상화를 구축하는 데이터 웨어하우스 모델링 기능이 필요합니다. 그리고 알고리즘 측면의 기능을 제공해야 하며, 마지막으로 사용자 프로필 데이터를 효율적으로 저장, 쿼리 및 공유하고 프로필 서비스를 제공할 수 있는 데이터 플랫폼 기능도 있어야 합니다. 자체 구축한 비즈니스 프로파일링 플랫폼과 중간 사무실 프로파일링 플랫폼의 주요 차이점은 자체 구축한 프로파일링 플랫폼이 단일 비즈니스 라인에 서비스를 제공하고 필요에 따라 사용자 정의할 수 있다는 것입니다. 모델링하고 보다 일반적인 기능을 제공합니다. 2.58 Zhongtai 초상화 구성 배경의 사용자 초상화

Go 언어에서 빅데이터 프레임워크가 부족한 이유와 해결 방법에 대한 토론 Mar 29, 2024 pm 12:24 PM

오늘날 빅데이터 시대에 데이터 처리 및 분석은 다양한 산업 발전에 중요한 지원 요소가 되었습니다. 개발 효율성이 높고 성능이 뛰어난 프로그래밍 언어로서 Go 언어는 점차 빅데이터 분야에서 주목을 받고 있습니다. 그러나 Go 언어는 Java, Python 등 다른 언어에 비해 빅데이터 프레임워크에 대한 지원이 상대적으로 부족하여 일부 개발자에게 어려움을 초래했습니다. 이 글에서는 Go 언어에서 빅데이터 프레임워크가 부족한 주된 이유를 살펴보고, 그에 따른 솔루션을 제안하고, 구체적인 코드 예제를 통해 이를 설명하겠습니다. 1. 언어로 이동

AI, 디지털 트윈, 시각화... 2023년 Yizhiwei 가을 제품 출시 컨퍼런스의 하이라이트! Nov 14, 2023 pm 05:29 PM

Yizhiwei의 2023년 가을 제품 출시가 성공적으로 마무리되었습니다! 컨퍼런스의 주요 내용을 함께 살펴보겠습니다! 1. 지능적 포용적 개방성, 디지털 트윈의 생산성 향상 Kangaroo Cloud의 공동 창업자이자 Yizhiwei의 CEO인 Ning Haiyuan은 개회 연설에서 다음과 같이 말했습니다. 올해 회사 전략 회의에서 우리는 제품 연구 개발의 주요 방향을 다음과 같이 정했습니다. '지능형 포괄 개방성' '3대 핵심역량', '지능형 포괄 개방성' 3대 핵심 키워드에 초점을 맞춰 '디지털 트윈을 생산력으로 만든다'는 개발 목표를 더 제시했다. 2. EasyTwin: 사용하기 쉬운 새로운 디지털 트윈 엔진 탐색 1. 0.1에서 1.0까지 디지털 트윈 퓨전 렌더링 엔진을 계속 탐색하여 성숙한 3D 편집 모드, 편리한 대화형 청사진 및 대규모 모델 자산을 갖춘 더 나은 솔루션을 제공합니다.

시작 가이드: Go 언어를 사용하여 빅 데이터 처리 Feb 25, 2024 pm 09:51 PM

오픈 소스 프로그래밍 언어로서 Go 언어는 최근 몇 년 동안 점차적으로 광범위한 관심과 사용을 받아 왔습니다. 단순성, 효율성 및 강력한 동시 처리 기능으로 인해 프로그래머가 선호합니다. 빅데이터 처리 분야에서도 Go 언어는 강력한 잠재력을 갖고 있으며, 대용량 데이터를 처리하고 성능을 최적화하며 다양한 빅데이터 처리 도구 및 프레임워크와 잘 통합될 수 있습니다. 본 글에서는 Go 언어의 빅데이터 처리에 대한 몇 가지 기본 개념과 기법을 소개하고, 구체적인 코드 예시를 통해 Go 언어를 사용하는 방법을 보여드리겠습니다.

C++ 기술의 빅데이터 처리: 인메모리 데이터베이스를 사용하여 빅데이터 성능을 최적화하는 방법은 무엇입니까? May 31, 2024 pm 07:34 PM

빅 데이터 처리에서 인메모리 데이터베이스(예: Aerospike)를 사용하면 컴퓨터 메모리에 데이터를 저장하고 디스크 I/O 병목 현상을 제거하며 데이터 액세스 속도를 크게 높이기 때문에 C++ 애플리케이션의 성능을 향상시킬 수 있습니다. 실제 사례에서는 인메모리 데이터베이스를 사용할 때의 쿼리 속도가 하드 디스크 데이터베이스를 사용할 때보다 몇 배 더 빠른 것으로 나타났습니다.

효과적인 데이터 분석을 수행하는 방법

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제