产品说明书 #
集团监测模块主要服务于集团/品牌宣传部门,此模块包含集团总览、集团剖析两大功能,可查看了解集团/品牌宣传表现情况,以及辅助挑选投放合作媒体。
操作指引 #
从集团维度进行全网实时监测,基于集团相关的海量互联网公开数据,构建专业的声量、互动量计算模型,综合全面评估11个集团在网络上的影响力。
l 集团总览
l 集团剖析
数据说明 #
数据来源 #
l 集团监测:以社媒平台为主,包括微博、微信、新闻、论坛、问答、视频、小红书、短视频全网数据。
l 各阵地细分站点说明:
l 微博:新浪微博
l 微信:搜狗微信
l 新闻:覆盖今日头条、一点资讯、ZAKER新闻、百度新闻、新浪新闻、百度搜索、搜狗搜索等主流站点的新闻频道
l 论坛:覆盖汽车之家、懂车帝、太平洋汽车、爱卡汽车、百度贴吧、豆瓣、虎扑、什么值得买、数码之家、天涯论坛等各行业的主流论坛站点
l 短视频:抖音app、快手
l 视频网站:哔哩哔哩、腾讯视频、搜狐视频、优酷、土豆、爱奇艺、风行网、AcFun、PPTV聚力、芒果TV、华数、乐视、风换视频
l 问答:知乎、百度知道等问答社区
l 小红书:小红书
数据更新机制 #
l 集团监测
数据每天实时采集,数据将在T+2趋于稳定。如11月27日在系统可查看27日当天数据,26-27日数据持续更新,25日数据已经处理完毕,可用于分析。
名词解释及指标说明 #
1. 声量 #
数据源 |
声量 |
指标定义/说明 |
分析对象被提及的文本数量,若在同一条文本被提及多次,声量记1 |
微博 |
①原贴或内容命中关键词的记录数,内容包括自发内容和多层转发内容 ② BGC,即品牌官方账号发文(不管有无命中关键词) 计算逻辑:①+② |
微信 |
①命中关键词的微信文章数 ②BGC,即品牌官方账号发文(不管有无命中关键词) 计算逻辑:①+② |
论坛 |
命中关键词的主贴数和回帖数之和 |
问答 |
①命中关键词的问题数及其所有回答数 ②命中关键词的回答数量(当未命中问题时) 计算逻辑:先判断 ① ,如①=0,判断 ② ,再计算①+② |
新闻/博客 |
命中关键词的新闻主帖数 |
小红书笔记 |
①命中关键词的笔记数 ②BGC,即品牌官方账号发文(不管有无命中关键词) 计算逻辑:①+② |
视频(不包括B站) |
视频标题或视频简介命中关键词的视频数 |
B站 |
①视频标题或视频简介命中关键词的视频数 ②BGC,即品牌官方账号发文(不管有无命中关键词) 计算逻辑:①+② |
短视频(不包含抖音) |
①视频标题或视频简介命中关键词的视频数 ②BGC,即品牌官方账号发文(不管有无命中关键词) 计算逻辑:①+② |
抖音APP |
①视频“内容”或“商品名称”命中关键词的视频数 ②BGC,即品牌官方账号发文(不管有无命中关键词) 计算逻辑:①+② |
2. 互动量 #
数据源 |
站点 |
互动量 |
微信 |
|
在看数 + 评论数 + 点赞数 |
微博 |
|
转发数 + 评论数 + 点赞数 |
新闻/博客 |
|
评论数+点赞数 |
小红书 |
|
评论数+点赞数+收藏数+转发数 |
短视频 |
|
分享数+评论数+点赞数 |
视频 |
B站 |
弹幕数+评论数+点赞数+投币数+收藏数+转发数 |
其他视频 |
评论数+点赞数 |
|
论坛 |
|
命中关键词的(主贴/回帖)的评论数+点赞数 |
问答 |
|
命中关键词的(问题/回帖)的评论数+点赞数(注:在个别阵地,点赞数=赞同数) |
3. 互动率 #
选定周期内品牌互动量与声量的比值。互动率 = 互动量 / 声量 * 100%。
4. 负面率 #
负面率 = 负面声量 / 总声量 * 100%。
5. 正面率 #
正面率 = 正面声量 / 总声量 * 100%。
6. SOV #
Share Of Voice,声量份额,当前品牌声量/所评估品牌总声量*100%。
7. SOE #
Share Of Engagement,互动量份额,当前品牌互动量/所评估品牌总互动量*100%。
8. NSR #
Net Sentiment Rate,净情感度,通过计算品牌在网上正面与负面评价比例来分析品牌在网上口碑。NSR=(正面情感值-负面情感值)/(正面情感值+负面情感值)*100%。
9. 品牌均值 #
所选品牌平均声量=当前时间周期下用户所选品牌声量总和÷所选品牌数量。所选品牌平均互动量、所选品牌平均互动率、所选品牌平均NSR计算逻辑类似。
10. BGC/PGC/UGC #
UGC(User generated Content):消费者、普通网民的发声
PGC(Professionally generated Content):专家、媒体、KOL的发声,内容专业度高
BGC(Brand Generated Content):品牌官方账号的发声
核心算法 #
1. 情感判断 #
用户通过发表内容表达自身情感时,主要包括正面、负面、中性三种倾向。数说基于自然语言处理及机器学习技术,深入挖掘用户不同情感的隐含特征,包括极致赞扬、粗鲁表达、特殊表情及符号折射的情感表达,并经过大量的情感标注数据,迭代优化情感判别模型。目前,数说情感判别模型准确率可达85%以上。
2. 水军及僵尸判别 #
自研⽔军识别算法,基于⼤量用户行为,通过机器学习算法提炼出60+个对水军判断有显著影响的特征,主要包含用户基础信息(如粉丝数和关注数的占比、收藏数和关注数的占比、发⽂数等)和微博内容信息(如午夜微博数、广告词、黑名单、新闻词等)。通过以上特征识别出微博水军用户后,结合业务需求对水军及僵尸进行过滤。
3. 智能三元组算法 #
智能三元组算法可弥补传统NLP分词算法分词缺乏关联性不足的问题,更直接地体现用户的反馈(见下图)。数说使用机器学习算法直接从文本中提取Feature-Sentiment-Polarity的组合,无需人工设置码表。使用深度学习、条件随机场模型量化用户对产品的口碑,能力达到业界领先,准确率可达85%以上。
4. 实体识别算法 #
通过深度学习(BERT)及人工数据标注,所孵化算法可以对品牌、品类、功效、成分、人群、场景等维度进行识别,可根据不同行业构建不同的维度分析,准确率超过80%,可实现大批量、高效、准确地构建标签。实体识别算法主要应用在实体词云功能中,展示品牌提及到的不同维度概念,从更细维度分析品牌推广内容和被提及的热度。
5. 声量类型识别 #
通过各个阵地对用户的官方认证等级及用户的粉丝量对声量类型划分为UGC、PGC、BGC。在品牌剖析、内容分析模块,支持用户查看不同类型的声量分布,剖析品牌官方发声、专家/媒体发声、网民发声对品牌社媒热度的贡献,以及不同群体舆论行为关联特征。
*判断准则:
l UGC(User generated Content):消费者、普通网民的发声
l PGC(Professionally generated Content):专家、媒体、KOL的发声,内容专业度高
l BGC(Brand Generated Content):品牌官方账号的发声
常见问题 #
1、刷新界面时,出现数据加载不出来?
答:建议清除浏览器缓存,重新登录系统试试
(具体步骤:1.首先我们需要打开谷歌浏览器–》2.打开后在谷歌浏览器的右上角找到三个小圆点的设置菜单–》3.进入到设置菜单后我们把鼠标放在更多工具按钮上,然后在选择清理清理缓存数据–》4.进入到清除缓存数据界面后我们可以选择需要清理的时间段,cookie,包括缓存的图片和文件)
2、IE或者其他的浏览器出现图表不显示或者不美观的样式问题
答:系统支持的浏览器为Chrome 70+版本、edge最新版本、火狐和Safari,最好用google浏览器去查看系统。
3、发现系统自动退出账号
答:如果登录一直没有操作页面,为了保证账号安全性,系统会在15分钟之后自动退出账号,到时重新登录即可。
4、筛选器选择不了品牌
答:一般筛选器会显示可选多少项,如果显示0项,需要将之前选择的清空,就可以选择了,见如下截图: