데이터 베이스 MySQL 튜토리얼 思路总结-----对微博情感分析的的挖掘

思路总结-----对微博情感分析的的挖掘

Jun 07, 2016 pm 02:52 PM
분석하다 웨이보 아이디어 요약 감정 파기 친구

一朋友由于工作需要,准备对新浪微博进行相关的抓取挖掘。特别是情感分析这一块,便于他后期的实验实践。实际上,文本挖掘及分析在未来都会产生较大的效果。举一个简单的例子,现在地铁里的每个人每天都会去刷新自己的人人好友圈,微信好友消息。而这些消息

    一朋友由于工作需要,准备对新浪微博进行相关的抓取挖掘。特别是情感分析这一块,便于他后期的实验实践。实际上,文本挖掘及分析在未来都会产生较大的效果。举一个简单的例子,现在地铁里的每个人每天都会去刷新自己的人人好友圈,微信好友消息。而这些消息大部分是基于文本的。如何对这些原始的消息进行挖掘。进而为相应的精准营销做准备。在以后的营销中将会产生重大效果。

原始数据

    这一部分的内容,我们可以通过爬虫技术来抓取。通过聚类算法,找到相同话题的所有微博。然后拿来做为原始数据。还有就是用户好友圈内的评价消息,还有用户产生的连接消息,等等。这些都可以作为原始数据来归入我们的数据库。

确订目标(商业理解)

    这一步也同时与业务理解要很好的关联起来,首先,我们是要用这些原始数据来作什么?比如,我们用情感分析,所有不同用户对同一事件的理解。我们要将他们的微博信息里的关键词找出来。然而进行相应的查找算法,进而确定所有用户对这一事件的评价。然后,我们要通过用户的评价,找到有二次商业利用值的客户。然后确订为目标客户。

数据理解

   所抓取到的微博内容是什么,里边带几个链接?是用什么符号与之相连?文字,图片的分类,另外还有评论信息是否也有参考价值。里边的特殊符号代表什么?等等。这些信息,那些是对我们的来说是有用的,如何去用?比如说要从文本中挖掘出关建字,进行相关的营销活动。从而确定博主的情感动向。进而可以做些什么?理解我们的数据,才能更好的抓取到我们所要使用的数据。

模型建立

   有人说,搞数据挖掘的人就是要来做这一部分的内容。你要建立一个好的模型,那以后的数据通过你的这个模型,那么你所需要的内容自动地就会呈现出来。而这一部分也是整个数据挖掘里最难的部分。

   比如说我们的微博数据,我们可以通过决策树算法建立模型。最后输出那些关健字的客户就是我们的目标客户。又或者,我们可以通过神经网络的算法建立模型,找到相关的所的决策项。实际上,数据挖掘所用到的方法很多,也很复杂,我也是到现在还是没有弄清楚一些算法的核心思想。但这样并不影响我们来使用相关的算法来进行挖掘。再者说,现在的挖掘对象,真正上PB内容的资料也不是很多的。很多企业还停留在小型机的阶段。所以,有的时候,我会开玩笑的说:数据量太小的话,EXECL会更好一些,然后是ACCESS数据库。再然后就是ORCALE数据库.....

   模型建立是一个比较幸苦的工作,可是如果建立完成后,一般3-5年不会发生变化。比如我们现在的信用卡的信用评分系统。

模型评估

   这一部分内容,是进行相关优化。也就是说模型建立好了,开始要跑业务了。要测试一下看它到底能跑到什么样的程度。有的时候,你挖掘了半年,也找到的目标客户,结果被其他人先用其他方法吸引走了,怎么办?所以才要有模型评估这件工作。

   先将大数据里的一部分数据,一般是40%拿来先做训练,你也可以拿少量来试一试。然后看完成这些数据需要多长时间。换了其他的算法后,是否可以提高挖掘时间。一般这一步的数据分配要遵守一个4:3:3的原则,即40%拿来做训练,30%来做测试,另外的30%拿来做验证。综合来说,才能够评价这个模型的好坏,以及这个模型是否能产生它的相应价值。

发布模型

   这是最后一步,让所有微博数据进行相应的算法优化。进而达到最好的挖掘效果。


在以上的这几个步骤中,模型评估与商业理解其实也是相辅相成的,因为这两个主要是与数据最为密切。而数据理解与商业理解又是相互制约的,很多时候,我们是有了大数据,但是我们找不到我们的所要挖掘的目标在那里,这时就需要不断的修订我们的商业理解与数据理解,然而,模型的相关内容,在整个闭环的过程中并不显的那么重要。有的时候,客户的一个很简单的需求,我们并不一定要用复杂的技术来实现,简单也许就意味着胜利。


再来说说在文本挖掘中的思路,少量的文本信息。我们可以放在在WORD里用复制粘贴来完成,多的话可以用EXCEL,再多的话可以用U1,要是还是多就用SAS与R,再多就用其他的了,具体什么软件,我也没用过。


好了,就先总结这么多吧。下周有空再写吧!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

웨이보에서 이전 웨이보를 날짜별로 검색하는 방법_웨이보에서 이전 웨이보를 날짜별로 검색하는 방법 웨이보에서 이전 웨이보를 날짜별로 검색하는 방법_웨이보에서 이전 웨이보를 날짜별로 검색하는 방법 Mar 30, 2024 pm 07:26 PM

1. 먼저 모바일 웹브라우저를 열고, 웨이보 웹버전을 검색한 후, 입장 후 좌측 상단의 아바타 버튼을 클릭하세요. 2. 그런 다음 오른쪽 상단에 있는 설정을 클릭하세요. 3. 설정에서 버전 전환 옵션을 클릭하세요. 4. 그런 다음 버전 스위치에서 컬러 버전 옵션을 선택합니다. 5. 검색을 클릭하여 검색 페이지로 들어갑니다. 6. 키워드를 입력한 후 사람찾기를 클릭하세요. 7. 검색 완료 화면이 나타나면 필터를 클릭하세요. 8. 마지막으로 릴리스 시간 열에 특정 날짜를 입력하고 필터를 클릭합니다.

웨이보의 특별한 관심에 대한 실시간 알림 설정 방법_웨이보의 특별한 관심에 대한 실시간 알림 설정 방법 웨이보의 특별한 관심에 대한 실시간 알림 설정 방법_웨이보의 특별한 관심에 대한 실시간 알림 설정 방법 Mar 29, 2024 pm 10:01 PM

1. Weibo를 열고 내를 클릭한 후 오른쪽 상단에 있는 설정 옵션을 클릭하세요. 2. 설정을 연 후 내부의 푸시 알림 설정을 찾아서 클릭하세요. 3. 푸시 알림 설정에 들어간 후, Special Interest를 찾아 실시간 알림을 클릭하세요.

웨이보 차단 해제 방법_웨이보 차단 해제 방법 웨이보 차단 해제 방법_웨이보 차단 해제 방법 Mar 30, 2024 am 09:51 AM

1. 웨이보 앱 오른쪽 하단의 [내]를 클릭하여 개인 홈페이지에 입장합니다. 2. 그런 다음 오른쪽 상단에 있는 톱니바퀴 아이콘을 클릭하세요. 3. 이때 설정 페이지로 들어가고 여기에서 [블록 설정]을 선택하여 들어갑니다. 4. 차단 설정에서 차단한 친구를 확인하고 탭한 후 팝업 옵션에서 [차단 해제]를 클릭하세요. 5. 또는 웨이보 사용자를 직접 검색하여 차단된 사용자 홈페이지에 진입한 후 오른쪽 상단의 [...]를 클릭하여 블랙리스트를 제거할 수도 있습니다.

'Weibo' 초안 상자 삭제 방법_'Weibo' 초안 상자 삭제 튜토리얼 'Weibo' 초안 상자 삭제 방법_'Weibo' 초안 상자 삭제 튜토리얼 Mar 30, 2024 pm 12:46 PM

1. 먼저 웨이보를 열고 내를 클릭한 후 초안 상자를 클릭하세요. 2. 그런 다음 초안을 길게 누르고 클릭하여 초안 상자를 지우거나 초안을 삭제합니다. 3. 마지막으로 확인을 클릭하세요.

웨이보 라이브 모드 끄는 방법_웨이보 라이브 모드 끄는 방법 웨이보 라이브 모드 끄는 방법_웨이보 라이브 모드 끄는 방법 Mar 30, 2024 am 10:16 AM

1. 먼저 웨이보를 열고 검색을 클릭한 후 더 많은 인기 검색어를 클릭하세요. 2. 그런 다음 입력할 핫 검색을 선택하세요. 3. 그런 다음 핫서치 댓글 라이브 모드로 들어가서 오른쪽 상단에 있는 표준 버전을 찾아서 클릭하세요. 4. 마지막으로 핫서치 표준댓글 영역으로 돌아갈 수 있습니다. 계속해서 라이브 댓글 영역을 보시려면 오른쪽 상단의 라이브 버전을 클릭하세요. 참고: 실시간 댓글이 많은 경우에만 자동으로 라이브 모드로 전환됩니다. 일부 핫 검색은 자동으로 라이브 모드로 전환됩니다. 일반적으로 핫 검색은 표준 모드입니다.

이미지 품질을 압축하지 않고 웨이보에 동영상을 게시하는 방법_화질을 압축하지 않고 웨이보에 동영상을 게시하는 방법 이미지 품질을 압축하지 않고 웨이보에 동영상을 게시하는 방법_화질을 압축하지 않고 웨이보에 동영상을 게시하는 방법 Mar 30, 2024 pm 12:26 PM

1. 먼저 휴대폰에서 웨이보를 열고 오른쪽 하단의 [나]를 클릭하세요(그림 참조). 2. 그런 다음 오른쪽 상단에 있는 [기어]를 클릭하여 설정을 엽니다(그림 참조). 3. 그런 다음 [일반 설정]을 찾아 엽니다(그림 참조). 4. 그런 다음 [동영상 팔로우] 옵션을 입력하세요(그림 참조). 5. 그런 다음 [동영상 업로드 해상도] 설정을 엽니다(그림 참조). 6. 마지막으로 [원본 화질]을 선택하여 압축을 방지합니다(그림 참조).

웨이보 동영상 커버 변경 방법_웨이보 동영상 커버 변경 방법 웨이보 동영상 커버 변경 방법_웨이보 동영상 커버 변경 방법 Mar 29, 2024 pm 10:31 PM

1. 먼저 웨이보를 열고 내를 클릭한 후 아바타를 클릭하고 개인 홈페이지에 들어갑니다. 2. 그런 다음 배경 이미지를 클릭하세요. 3. 그런 다음 클릭하여 비디오 커버를 변경하세요. 4. 마지막으로 앨범에서 동영상을 선택하고 다음을 클릭한 후 게시하고 업로드합니다.

Weibo svip이 방문자 기록을 삭제하면 상대방이 계속 볼 수 있나요? Weibo svip이 방문자 기록을 삭제하면 상대방이 계속 볼 수 있나요? Apr 02, 2024 am 08:04 AM

웨이보 사용자는 SVIP 기능을 활성화하면 방문자 기록을 관리할 수 있으며, 낯선 사람의 홈페이지를 방문하면 표시하기 전에 삭제할 수 있어 상대방이 홈페이지를 탐색하고 있다는 사실을 알 수 없다. Weibo svip 방문자 기록을 삭제한 후에도 상대방이 이를 볼 수 있나요? 1. svip 방문자 기록을 삭제한 후에는 상대방이 이를 볼 수 없습니다. 방문자 수는 표시되지만 방문자의 ID와 아바타는 표시되지 않습니다. 2. 일반 사용자 및 VIP 사용자는 접속 기록을 삭제하거나 조회할 수 없습니다. 단지 몇 명이나 방문했는지만 알 수 있습니다. 3. 웨이보 접속 데이터는 매일 8시에 업데이트됩니다. 접속 기록을 삭제하려면 다음을 수행해야 합니다.

See all articles