微信扫码登录

其他登录方式

绑定手机号

注册

我同意用户协议

忘记密码

用户协议

绑定手机号

近期有不法分子打着爱盈利的旗号,制作“爱盈利”名称的App,并伪造爱盈利证件,骗取用户信任,以抖音点赞赚钱或其他方式赚钱为名义,过程中以升级会员获得高佣金为名让用户充值。
爱盈利公司郑重声明:我司没有研发或运营过任何名为“爱盈利”的APP,我司做任务赚钱类产品从没有让任何普通用户充值升级会员。我公司产品均在本网站可查询,请将网站拉至底部,点击“关于我们”可查看爱盈利相关产品与服务。
温馨提示:当遇到此类问题请拨打官方电话或添加官方微信,以免财产损失。爱盈利官网地址:www.aiyingli.com。
  • 推广与合作
X

用KNIME进行情感分析 | 上

来源: 2543
爱盈利(aiyingli.com)移动互联网最具影响力的盈利指导网站。定位于服务移动互联网创业者,移动盈利指导。我们的目标是让盈利目标清晰可见!降低门槛,让缺乏经验、资金有限的个人和团队获得经验和机会,提高热情,激发产品。

用KNIME进行情感分析 | 上

文 | 数据挖掘课程小组 沈浩老师

这个案例展示了如何利用KNIME对社交媒体数据进行情感分析。

案例中的数据抓取的是Slashdot网站首页内容,由FundaciónBarcelona Media4提供。Slashdot是1997年成立一家非常受欢迎的科技新闻站。Slashdot网站首页的主要内容就是网友发布的新闻以及网友在评论区展开的讨论。案例使用的数据共包含约41337条评论,这些评论主要是11000多名Slashdot用户对163篇政治报道的讨论。

用KNIME进行情感分析 | 上

图1

研究思路

我们的研究目的是区分不同用户的情感取向。我们将通过对用户撰写的评论和文章的词语进行分析、做出用户情感取向判断。也就是说,我们通过测量用户(非匿名)撰写的评论和文章时使用的正面的情感、态度、观点词汇的数量以及负面情感、态度和观点词汇的数量,来判定该用户情感取向。用户使用正面词汇越多,其情感取向偏向正面,反之亦然。

此处涉及到标记词汇极性的问题,在这里我们使用MPQA主观词库来标记词汇的极性。MPQA是一个公开的词库,其中包含了关于词汇极性的数据。

研究流程

用KNIME进行情感分析 | 上

图2

首先读取从Slashot上获取的数据,选取报道主题为“interviews”的评论,删除匿名文章和匿名评论。然后将剩下的非匿名评论转化为文档方便之后的分析。与此同时,另外一边首先读取MPQA主观词汇,提取出词汇和极性,并且拆分为正面词汇和负面词库方便之后的标记。最后,DictionaryTagger节点将每个情感标记到评论中每个词语上。

用KNIME进行情感分析 | 上

图3

现在所有评论中的词汇都被标记成了正面或负面,我们就可以开始计算工作。我们要计算每个评论中的正面或负面词汇数量和每个用户共使用的正面或负面词汇数量。通过user id我们可以整合每个用户不同评论中的正面词汇和负面词汇。在流程图中对应的是Documentscoring和User scoring。最后,我们为不同情感取向的用户标注颜色,整理数据并制成散点图。

结果展示

下图是用户使用词汇的散点图,纵坐标是正面词汇,横坐标是负面词汇。绿色的用户情感取向正面;灰色代表用户情感取向既不是正面,也不是负面;红色代表情感取向负面。

用KNIME进行情感分析 | 上

图4

左上角红箭头指的用户是Duc Ruby,他是情感取向最正面的用户,也是经常在Slashdot上发表评论的用户。他使用的正面词汇数量是51,负面词汇数量是10,我们用正面词汇数量减去负面词汇数量得出其情感指数是40,即情感取向最正面的用户。

右下角红箭头指的用户是whytakemine,他是情感取向最负面的用户,也是经常在Slashdot上发表评论的用户。他使用的正面词汇数量是16,负面词汇数量是25,我们用正面词汇数量减去负面词汇数量得出其情感指数是-9,即情感取向最负面的用户。

左下角圆圈部分代表了大部分中立用户,他们在Slashdot上发表的评论很少,这也是无法判断其情感取向的可能原因。

总体而言,本次案例介绍的是如何利用社交媒体UGC内容对用户进行情感分析。其实,情感分析只是对用户进行了归类,它主要还是用于后续的其他研究,如结合社会网络,对其中的Leader和Follower做进一步分析。

数据挖掘课程小组  沈雅婷 | 张帅祯 | 谭耀华

End.

转载请注明来自36大数据(36dsj.com):36大数据 » 用KNIME进行情感分析 | 上

爱盈利-运营小咖秀 始终坚持研究分享移动互联网App数据运营推广经验、策略、全案、渠道等纯干货知识内容;是广大App运营从业者的知识启蒙、成长指导、进阶学习的集聚平台;

评论

相关文章推荐

SELECT dw_posts.ID,dw_posts.post_title,dw_posts.post_content FROM dw_posts INNER JOIN dw_term_relationships ON (dw_posts.ID = dw_term_relationships.object_id) WHERE 1=1 AND(dw_term_relationships.term_taxonomy_id = 3413 ) AND dw_posts.post_type = 'post' AND (dw_posts.post_status = 'publish') GROUP BY dw_posts.ID ORDER BY RAND() LIMIT 0, 6

京ICP备15063977号-2 © 2012-2018 aiyingli.com. All Rights Reserved. 京公网安备 11010102003938号