创建分析表,搜集数据 这一步基本是最花时间的,这时候就是考量你的数据平台、数据仓库的时候了,仓库集成的好,平台易用的话时间应该不用太长。
create table xx_user_analyze (
user_id bigint (20) default null,
is_reserve smallint (6) not null default '0',
is_view smallint (6) not null default '0',
view_cnt int (11) not null default '0',
amt double not null default '0',
mb_amt double not null default '0',
mb_cnt int (11) not null default '0',
xx_mb_cnt int (11) not null default '0',
xx_mb_amt double not null default '0',
amt_2016 double not null default '0',
mb_amt_2016 double not null default '0',
mb_cnt_2016 int (11) not null default '0',
xx_mb_cnt_2016 int (11) not null default '0',
xx_mb_amt_2016 double not null default '0',
first_pur_time datetime default null,
last_pur_time datetime default null,
last_pur_time_seg decimal (10, 2) default null,
user_level int (11) not null default '0',
use_model int (11) not null default '0',
key idx_user_id (user_id)
) engine = innodb default charset = utf8;
第四步数据分析:我是把数据导入到superset/caravel进行分析的(这个工具个人有篇文章介绍过,非常不错的一个数据探查、数据分析工具再次推荐下),其实用excel也非常好,只是对excel的有些处理不是很擅长。