情感分析是一种常见的自然语言处理方法的应用,特别是在以提取文本的情感内容为目标的分类方法中。通过这种方式,情感分析可以被视为利用一些情感得分指标来量化定性数据的方法。尽管情绪在很大程度上是主观的,但是情感量化分析已经有很多有用的实践,比如企业分析消费者对产品的反馈信息,或者检测在线评论中的差评信息。
在情感分析应用软件中灵玖的软件NLPIR大数据搜索与挖掘共享软件做的效果是比较好的软件之一。NLPIR由专注于大数据科学研究与工程应用融合领域的十多名博士硕士,倾力15年,持续创新而构建。而情感分析是NLPIR系统里面重要的部分。
最简单的情感分析方法是利用词语的正负属性来判定。句子中的每个单词都有一个得分,乐观的单词得分为 +1,悲观的单词则为 -1。然后我们对句子中所有单词得分进行加总求和得到一个最终的情感总分。很明显,这种方法有许多局限之处,最重要的一点在于它忽略了上下文的信息。例 如,在这个简易模型中,因为“not”的得分为 -1,而“good”的得分为 +1,所以词组“not good”将被归类到中性词组中。尽管词组“not good”中包含单词“good”,但是人们仍倾向于将其归类到悲观词组中。
NLPIR情感分析提供两种模式:全文的情感判别与指定对象的情感判别。情感分析主要采用了两种技术:1.情感词的自动识别与权重自动计算,利用共现关系,采用Bootstrapping的策略,反复迭代,生成新的情感词及权重;2.情感判别的深度神经网络:基于深度神经网络对情感词进行扩展计算,综合为最终的结果。NLPIR情感分析内容形式包括特定人物的正、负面分析,这样可以从整体看到特定人物对社会观点和事情的态度,从而来判断他的态度是积极的还是消极的 。同时通过喜、怒、哀、乐、惊、惧等几种情感维度分别展现他的性格取向,是稳重型还是冒进型;是积极乐观的还是消极愤世的;这样就可以综合的反应特定人物的情感状态。
Word2Vec方法是可以在捕捉语境信息的同时压缩数据规模,同时可以根据上下文来预测当前词语的概率和根据当前词语来预测上下文的概率。而灵玖软件 POS-CBOW方法综合了词性、词的分布特点,采用word2vector改进模型,对5GB的新闻语料进行训练,自动提取出了语义关联关系。如果训练文本调整为专业领域的生语料,该模型同样可以产生专业领域的本体关联关系。这样更能够准确的分析出特定人物的感情变化,并通过可视化的方式体现给大家。
情感分析不是单单的对特定人物感情来进行分析,同时还要对特定人物相关事件一起来分析从而得出更加科学、全面的分析报告。NLPIR系统能够实体抽取智能识别文本中出现的人名、地名、机构名、媒体、作者及文章的主题关键词,这是对语言规律的深入理解和预测,并且其所提炼出的词语不需要在词典库中事先存在。NLPIR实体抽取系统采用基于角色标注算法自动识别命名实体,开发者可在此基础上搭建各种多样化的大数据挖掘应用。
从以上的描述我们可以看出情感分析是非常重要的。情感本身是抽象的,我们只要应用大数据技术联系社会实际的客观现象和行为,才能准确的分析情感的真实内容。情感分析的意义就在于通过大数据情感分析技术来分析特定人物的感情变化及和感情相关的关系,从而提供当前社会人群的共同喜好,生活习惯等为国家发展决策、企业营销等起到重要的重要。同时可以应用到许多行业,其中最重要的几个应用包括:实现情感机器人,自动提供抉择支持,网络舆情风险分析,信息预测等。