行业报告 AI展会 数据标注 标注供求
数据标注数据集
主页 > 机器学习 正文

情感分析应用方向---自然语言处理

 已经到NLP的第八期,从今年三月自学以来,看过很多资料和有意思的算法。但是实际应用起来非常困难,不是算法太难,就是对数据要求太高,要不就是应用场景太复杂或者需要很多其他辅助的模块。我也关注了很多公众号,似懂非懂地看了些科技前沿新闻。看得新鲜,但是能用的很少。我一直期待有一个简便,普适性且应用范围广的小巧机器学习算法。相信大家也希望有一个容易上手,有应用潜力且容易装X的机器学习算法。NLP的SentimentAnalysis就是这样一个算法。

  在第一期也提到了,SentimentAnalysis情感分析是基于文本内容,分析其是正面的还是负面的。如果能保证一定的准确性,那么其应用范围其实非常广。如:

  电商平台的订单评价挖掘

  电影评论的评价挖掘

  社交媒体挖掘

  股票评论判断

  简单来说,就是输入一段文本,算法预测其是正面的还是负面的。假设大家的工作与客服,产品,设计,市场调研相关,想知道2018年7月用户的体验如何。这个时候NLP的SentimentAnalysis就能派上用场了。其实这个应用范围特别广,假设你是小米的产品经理,你想知道市面上对小米旗舰和对华为旗舰的看法。可能之前是要做用户调研,但是现在可以基于淘宝公开的订单评价去分析。

  那么接下来我大概讲下应用前景及

  客户评价的应用前景

  客户评价是一段文本,这一期将不再赘述基础的文本单词的处理和NaiveBayes和DeepNetwork的方法(可以参照本系列前几期)。

  首先,需要明确的是本系列前几期所做到的是,能够预测文本的情绪值。训练样本的来源是,当星级评价为4>5星时,为正面评价;当星级评价为1>2星时,为负面评价;

  其次,如果我们仅仅停留在预测文本整体的情绪值,那么在订单评价方面应用的价值并不大;因为我们已经能够通过星级知道;

  所以,我们需要更进一步文本挖掘,比如我们想知道小米的评价中,对于电池的看法。如果能在这个Aspect特征层面做出数据挖掘,那么其对产品改进,服务体验提升有很大的价值。

  下面是我查到的uber从facebook,twitter,news和市场调查得出的例子。大家可以看到,实际上Uber能够从成千上万的文本中分析出对于订单取消,付款,价格,安全及服务的满意度。当然这只是其中的一个结果汇总图。但是我们能够从汇总图获取很多信息,并且着力服务改进的方向。

  自然语言处理-第八期-情感分析应用方向

  实现上述例子,至少需要做到以下两件事情:

  1.特征提取.

  也就是提取用户提到的特征。如’小米的电池不耐用’。那么,我们不仅仅需要知道这个文本是负面的,我们还需要知道,他提到的是’电池’这个特征。当然人们表达的方式有很多种,有直接的有间接的。直接的可以讲’电池不好用’,间接的可以讲’用的时间很短’。那时间如何和电池联系起来呢?感觉是很难一件事;

  2.特征情感值赋予

  比如有一句话提到’外观还可以,但是就是电池差了点.’如何能准确的赋予特征的情感值呢?如果凭空想想,其实是很难的一个任务。

微信公众号

声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
SEM推广服务

Copyright©2005-2028 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注

扫码入群
扫码关注

微信公众号

返回顶部