数据之美:挖掘分析赋予数据新生命(2)

  • 2016-02-03 11:06:00
  • 张辉

一次流量红包用户计费属性分析

流量红包是一种新型的营销方式。企业向公众发布微信公众号,二维码等信息,或者是嵌入到企业的APP中,由用户登录相应界面并提交手机号码,即可获得企业(赠送的流量红包。流量红包可以由企业自定义为不同的大小。企业可以通过流量红包促进商品的销售,增加公众对自己的关注度,而用户得到实用、实在的流量赠送,是一种双赢的营销策略。

我们对流量红包一次完整的业务流程通过威尔逊排名进行数据挖掘分析。

用户在前台点击红包,即视为一次业务流程的开始:

1

1. 执行脚本ant fetch_coverage,出现“BUILD SUCCESSFUL”提示信息,表示数据收集成功。

2. 补充说明:

运行时变更代码覆盖率工具会启动一个监听端口,用来后续收集信息(ctl)。这个端口是固定的,47653。如果应用是多进程的,需要线程数再开启端口。设置如下:

a.假定要开启的端口号为47651,则在shenjing_conf.properties文件中增加配置

b.在build.xml文件中增加配置

\

之后用户数据进入MDB,我们进行MDB数据挖掘统计

数据之美:挖掘分析赋予数据新生命(2)2

数据之美:挖掘分析赋予数据新生命(2)3

KPI的参数说明及计算步骤

Project Quality =∑( Rule Quantity × Rule Level Impact Factor × Project Level Impact Factor )

a)影响用户代码质量评估的因素主要有两方面:一是用户本身的属性,包括“用户规模、用户重要性”;二是扫描规则的权重,包括“修改结论、质量属性、稳健程度、缺陷级别及误报率”。分别为上述各因素设置相应的影响因子,具体说明如下:


影响因素 影响因子名称 影响因子数值 影响因子说明
用户属性 用户规模_影响因子 1.05 100万行代码及以上
1 10万行-100万行代码
0.95 10万行代码及以下
用户重要性_影响因子 1.05 核心用户
1 重要用户
0.95 普通用户
扫描规则 修改结论_影响因子 1 需修改
0 无需修改
质量属性_影响因子 4 正确性
1 安全性
0.1 可维护性
稳健程度_影响因子 1 True。需依据用户定位调整其影响(主要针对“安全性”的规则)
0 False。不需依据用户定位调整其影响
受众 1.7 外网开放用户
1 内网开放用户
缺陷级别_影响因子 1.4 致命
1.2 严重
1 一般
0.8 轻微
误报率 —— 依据用户扫描结果统计该规则的误报比率
 

b)KPI的计算步骤如下:

(1)设置该用户的“用户规模、用户重要性”参数

(2)统计代码扫描得到的代码问题类别、该类别的问题数量,代码行数,修改结论(开发人员未修改之前均默认为1)

(3)计算单个问题的分数:

单个问题的分数=修改结论_影响因子*质量属性_影响因子*缺陷级别_影响因子*(1-误报率)*IF(稳健程度_影响因子=1,用户受众_影响因子,1)

(4)计算该类别问题的分数:

该类别问题的分数=单个问题的分数*该类别问题的数量

*(5)计算该用户问题的分数(每万行代码):

该用户问题的分数=sum(该类别问题的分数)/ (该用户的代码行数 / 10000)

*(6)计算该用户的标准化分数:

该用户问题的标准化分数=该用户问题的分数*用户规模_影响因子*用户重要性_影响因子

*说明:(5)得到的用户问题分数,主要用于该用户自身不同轮次代码扫描的比较,例:XX用户第2轮代码扫描的用户问题分数低于第1轮扫描的分数,说明XX用户第2轮代码质量优于第1轮代码质量;(6)得到的用户标准化分数,主要用于不同用户之间代码质量的横向比较,因此(6)在(5)的基础上剔除了用户规模、用户重要性的差异对最终结果的影响,以保证用户横向比较的效度。

下一讲进行对用户流量红包话单文件解析、挖掘分析:


数据之美:挖掘分析赋予数据新生命(2)4

本文也参考了张燕的云化BOSS详单http://www.shsnc.cn/show-109-930-1.html

加入架构师联盟

加入架构师联盟

友情连接

新炬网络

推荐阅读