凯时真人

联系方式 Contact

凯时真人: 天气在线(北京)气象科技有限公司

凯时真人: 地址(zhi):北京市海淀区海淀西大(da)街(jie)36号9层

凯时真人(ren): 电话:010-58995339

凯时真人(ren): 手机:13701329187

凯时真人: 传真:010-58995339

凯(kai)时真人(ren): 网址:

搜索 Search

天气驱动行业销售大数据

 2015-09-03 10:41:53  点击:

摘要(yao):自(zi)建(jian)国(guo)(guo)以来我国(guo)(guo)的(de)(de)(de)(de)气(qi)(qi)(qi)(qi)象(xiang)(xiang)系统(tong)(tong)(tong)已经十分(fen)完备,2015年中(zhong)国(guo)(guo)气(qi)(qi)(qi)(qi)象(xiang)(xiang)局发布27号令后使(shi)得(de)(de)气(qi)(qi)(qi)(qi)象(xiang)(xiang)数(shu)据(ju)(ju)(ju)(ju)迈向开放(fang)数(shu)据(ju)(ju)(ju)(ju)(Open Data)新阶段(duan),行(xing)(xing)(xing)(xing)业(ye)(ye)与(yu)公众可以使(shi)用海(hai)量(liang)气(qi)(qi)(qi)(qi)象(xiang)(xiang)数(shu)据(ju)(ju)(ju)(ju)助力企业(ye)(ye),目前(qian)行(xing)(xing)(xing)(xing)业(ye)(ye)数(shu)据(ju)(ju)(ju)(ju)和(he)海(hai)量(liang)气(qi)(qi)(qi)(qi)象(xiang)(xiang)数(shu)据(ju)(ju)(ju)(ju)还没有(you)得(de)(de)到完全应用。本文主要(yao)研究气(qi)(qi)(qi)(qi)象(xiang)(xiang)数(shu)据(ju)(ju)(ju)(ju)对销(xiao)售(shou)的(de)(de)(de)(de)影响,进而(er)利用气(qi)(qi)(qi)(qi)象(xiang)(xiang)数(shu)据(ju)(ju)(ju)(ju)特性完成天(tian)气(qi)(qi)(qi)(qi)驱(qu)动行(xing)(xing)(xing)(xing)业(ye)(ye)销(xiao)售(shou)的(de)(de)(de)(de)预(yu)测。我们(men)以两个零售(shou)行(xing)(xing)(xing)(xing)业(ye)(ye)的(de)(de)(de)(de)销(xiao)售(shou)数(shu)据(ju)(ju)(ju)(ju)为(wei)例,结合气(qi)(qi)(qi)(qi)象(xiang)(xiang)局提供的(de)(de)(de)(de)天(tian)气(qi)(qi)(qi)(qi)数(shu)据(ju)(ju)(ju)(ju)进行(xing)(xing)(xing)(xing)分(fen)析。同时,我们(men)在分(fen)析中(zhong)加(jia)入(ru)了(le)经济因素,如上证(zheng)指(zhi)数(shu)和(he)CPI数(shu)据(ju)(ju)(ju)(ju)来提供外部环境支持。与(yu)传统(tong)(tong)(tong)的(de)(de)(de)(de)预(yu)测不同,在气(qi)(qi)(qi)(qi)象(xiang)(xiang)数(shu)据(ju)(ju)(ju)(ju)中(zhong),我们(men)不仅知道目前(qian)时间点的(de)(de)(de)(de)数(shu)据(ju)(ju)(ju)(ju),也有(you)目前(qian)公众唾手(shou)可得(de)(de)的(de)(de)(de)(de)未(wei)来七天(tian)精确(que)(que)天(tian)气(qi)(qi)(qi)(qi)预(yu)报。我们(men)采(cai)用目前(qian)流行(xing)(xing)(xing)(xing)的(de)(de)(de)(de)算法随(sui)机森林(lin)来建(jian)模,得(de)(de)到了(le)很好的(de)(de)(de)(de)泛化结果。我们(men)的(de)(de)(de)(de)预(yu)测模型可以解(jie)决销(xiao)售(shou)行(xing)(xing)(xing)(xing)业(ye)(ye)传统(tong)(tong)(tong)通过从业(ye)(ye)人员(yuan)的(de)(de)(de)(de)主观判断进行(xing)(xing)(xing)(xing)销(xiao)售(shou)预(yu)测的(de)(de)(de)(de)局限,利用实现更加(jia)精确(que)(que)可靠(kao)的(de)(de)(de)(de)指(zhi)导。

一、业务介绍

天气一直是指导人们生活的重要因素,德国知名的经济议题观察家弗里德黑姆˙施瓦茨(Friedhelm Schwarz)发表的著作《气候经济学》[1]提到地球上有80%的经济活动都是由于天气因素影响甚至决定的,如:农作物受寒害影响收成及市场价格、凉夏造成冰品销售下降、暖冬缩短羽绒服销售时间、出行航班受天气影响延误以及所有的户外活动等。目前我国(除西部部分人口稀少的区域)的气象系统已经十分完善,气象观测网络从在轨卫星、雷达、高空气球、地面观测站点(降水、风速、风向、相对湿度、大气压力、气温)到地下的农业观测站(土壤墒情:土表下的温度、湿度等),民众可以通过过互联网或智能手机直接了解天气预报。目前积累起来的气象数据量也十分庞大(每年以PB等级的速度增长),但是目前这些数据还没有得到充分的应用。下面我们将阐述利用行业数据和气象数据进行销售预测、使用天气规划营销活动的全过程。

在销售(shou)领域,气(qi)(qi)象一直是(shi)一个(ge)十分(fen)重(zhong)要的(de)(de)(de)影响因(yin)(yin)素(su)。人们(men)根据(ju)天(tian)气(qi)(qi)来(lai)(lai)情(qing)况来(lai)(lai)决(jue)定购买的(de)(de)(de)衣(yi)服,所(suo)吃的(de)(de)(de)食(shi)物,甚至是(shi)饮(yin)用(yong)(yong)的(de)(de)(de)饮(yin)品,特(te)别是(shi)对于酒精性饮(yin)料和羽绒服非常直观受天(tian)气(qi)(qi)影响的(de)(de)(de)零售(shou)商品,天(tian)气(qi)(qi)对其销量起了(le)重(zhong)要作用(yong)(yong)。因(yin)(yin)此相关从业人员(yuan)会(hui)十分(fen)关注天(tian)气(qi)(qi)预报(bao),并根据(ju)天(tian)气(qi)(qi)来(lai)(lai)进行(xing)(xing)(xing)产(chan)品设计、营销方案(an)、采购与销售(shou)等(deng)行(xing)(xing)(xing)为的(de)(de)(de)决(jue)策。但是(shi)这种做(zuo)法只(zhi)是(shi)根据(ju)从业人员(yuan)的(de)(de)(de)经验进行(xing)(xing)(xing)判断,结果(guo)十分(fen)主观,容易导致偏差而做(zuo)出错误的(de)(de)(de)产(chan)销计划(hua)(SOP: Sales & Operation Planning),因(yin)(yin)此如何(he)利用(yong)(yong)行(xing)(xing)(xing)业数据(ju)、气(qi)(qi)象数据(ju)与其他(ta)公众数据(ju)进行(xing)(xing)(xing)精确的(de)(de)(de)数字化销售(shou)预测是(shi)行(xing)(xing)(xing)业研(yan)究的(de)(de)(de)热点,而业务(wu)受天(tian)气(qi)(qi)等(deng)外部环(huan)境因(yin)(yin)素(su)驱动(dong)的(de)(de)(de)关联性与因(yin)(yin)果(guo)性研(yan)究落成精准营销也(ye)是(shi)本文(wen)强(qiang)调(diao)的(de)(de)(de)重(zhong)点。

气(qi)(qi)(qi)象(xiang)的(de)(de)(de)(de)观(guan)(guan)测(ce)体(ti)系(xi)是由(you)庞大(da)的(de)(de)(de)(de)物联网(IOT: Internet of Things)构架(jia)而成,每分(fen)(fen)钟(zhong)都(dou)在监测(ce)相(xiang)关天(tian)气(qi)(qi)(qi)要素(风(feng)速、风(feng)向、温度(du)(du)(du)、相(xiang)对湿度(du)(du)(du)、大(da)气(qi)(qi)(qi)压力(li)、降水(shui)等(deng)(deng)),协同(tong)全世界(jie)各(ge)国的(de)(de)(de)(de)观(guan)(guan)测(ce)网络,同(tong)时(shi)(shi)(shi)结合地球(qiu)科学、大(da)气(qi)(qi)(qi)物理、流体(ti)力(li)学等(deng)(deng)专业(ye)知识,通过大(da)型计算机技(ji)术(shu)完成数(shu)(shu)值天(tian)气(qi)(qi)(qi)预(yu)报(Numerical Weather Prediction)。目前(qian)的(de)(de)(de)(de)预(yu)报模式(shi)提供给公众(zhong)的(de)(de)(de)(de)时(shi)(shi)(shi)间长度(du)(du)(du)为(wei)15天(tian),48小时(shi)(shi)(shi)内(nei)为(wei)逐小时(shi)(shi)(shi)预(yu)报,后续为(wei)逐日预(yu)报。由(you)于观(guan)(guan)测(ce)体(ti)系(xi)的(de)(de)(de)(de)完备以(yi)及(ji)计算技(ji)术(shu)能力(li)的(de)(de)(de)(de)大(da)幅提升,预(yu)报的(de)(de)(de)(de)精细度(du)(du)(du)也已(yi)经达到平(ping)方(fang)公里涵盖以(yi)及(ji)分(fen)(fen)钟(zhong)级别,天(tian)气(qi)(qi)(qi)预(yu)报在一定的(de)(de)(de)(de)时(shi)(shi)(shi)间周期(qi)内(nei)已(yi)经相(xiang)当成熟且具有高准(zhun)确度(du)(du)(du)。我们透(tou)过行业(ye)数(shu)(shu)据(ju)与气(qi)(qi)(qi)象(xiang)历(li)史数(shu)(shu)据(ju)进行相(xiang)关性(xing)(xing)分(fen)(fen)析确立结果后,根据(ju)业(ye)务影(ying)响关系(xi)、数(shu)(shu)据(ju)同(tong)比影(ying)响等(deng)(deng)特性(xing)(xing),低风(feng)险(xian)地进行因果性(xing)(xing)验证(zheng)。天(tian)气(qi)(qi)(qi)数(shu)(shu)据(ju)有可靠的(de)(de)(de)(de)预(yu)报准(zhun)确度(du)(du)(du),是气(qi)(qi)(qi)象(xiang)数(shu)(shu)据(ju)可以(yi)作(zuo)为(wei)天(tian)气(qi)(qi)(qi)驱动(dong)行业(ye)大(da)的(de)(de)(de)(de)最大(da)特点。

本文主要研究两项容易受天气因素驱动(影响)的销售预测问题,业务形态特别选取B2B(Business to Business)与B2C(Business to Customer)两种目前多数的业务类型:酒精性饮料的渠道销售预测以及电商平台的羽绒服销量预测。酒精性饮料的销量由很多因素影响,Lee et al.[2]和Rojas et al.[3]研究了广告对酒精性饮料销量的影响,Voleti et al.[4]和Empen et al.[5]研究了品牌资产对于酒精性饮料销量的影响。而在酒精性饮料行业中,还有一个公认对酒精性饮料销量影响极大的指标:天气。2015年我国酒精性饮料行业整体销量下滑,很多人都归因于2015年整体气温偏低的。一般酒精性饮料销量呈现季节性变化,天气寒冷的时候消费者对于酒精性饮料的需求会下降,销量会比较低;而在天气炎热的时候,酒精性饮料的销量会明显增高;本项目不考虑终端零售数据,仅研究酒精性饮料的渠道销售情况是否受天气所驱动,也就是各阶层的渠道商实际销售情况是否受天气影响。

对于羽绒服来说,天气的影响更加明显。从生活经验来看,人们主要是在冬天购买羽绒服,而夏天基本上不会有商家出售羽绒服。中国气象局公共气象服务中心和凡客诚品等公司合作利用气象数据进行羽绒服销量的研究,仅利用平均温度的三次多项式方程就得到了比较准确的结果(刘一伶等[6]),这表明天气的确对羽绒服的销量有十分重要的影响。

在(zai)(zai)不(bu)同的地(di)区(qu)(qu),天气(qi)对销量(liang)的影(ying)响也(ye)有(you)明显(xian)区(qu)(qu)别。在(zai)(zai)中国北方(fang)(fang)(fang)地(di)区(qu)(qu),四季很明显(xian),换季时时间间隔比(bi)较分(fen)明,因此人(ren)们能快速地(di)根据气(qi)温(wen)变(bian)化进行(xing)反应。中国南方(fang)(fang)(fang)地(di)区(qu)(qu)的换季却十(shi)分(fen)反复(fu),经常会(hui)(hui)出现冬天穿夏装的情况,整体湿度也(ye)偏高,因此人(ren)们根据季节(jie)变(bian)化和(he)气(qi)温(wen)变(bian)化进行(xing)的反应会(hui)(hui)和(he)北方(fang)(fang)(fang)有(you)很大(da)差别。本文在(zai)(zai)研究天气(qi)对销量(liang)的影(ying)响时,会(hui)(hui)分(fen)城市(shi)进行(xing)分(fen)析(xi),发(fa)现不(bu)同城市(shi)中天气(qi)对销量(liang)的影(ying)响规律。

 

二、数据描述

(一)酒精性饮料销售数据描述

我(wo)们的(de)(de)(de)(de)酒精性(xing)(xing)饮(yin)料(liao)销(xiao)(xiao)售(shou)(shou)数(shu)据(ju)(ju)来源于某知(zhi)名酒精性(xing)(xing)饮(yin)料(liao)公(gong)司渠(qu)道(dao)销(xiao)(xiao)售(shou)(shou)数(shu)据(ju)(ju),采集来源为(wei)ERP(Enterprise Resource Planning)系统的(de)(de)(de)(de)一级(ji)渠(qu)道(dao)销(xiao)(xiao)售(shou)(shou)数(shu)据(ju)(ju):销(xiao)(xiao)售(shou)(shou)订单(dan)(Sales Order)与对应(ying)的(de)(de)(de)(de)提货(huo)单(dan)(Delivery Note)以及(ji)经(jing)(jing)(jing)销(xiao)(xiao)商Go-To-Market系统的(de)(de)(de)(de)销(xiao)(xiao)售(shou)(shou)二(er)级(ji)渠(qu)道(dao)数(shu)据(ju)(ju)。数(shu)据(ju)(ju)为(wei)2013年至2015年五个经(jing)(jing)(jing)销(xiao)(xiao)商位在(zai)城(cheng)(cheng)市(shi)(shi)(shi)G、城(cheng)(cheng)市(shi)(shi)(shi)S、城(cheng)(cheng)市(shi)(shi)(shi)H、城(cheng)(cheng)市(shi)(shi)(shi)Z、城(cheng)(cheng)市(shi)(shi)(shi)W的(de)(de)(de)(de)销(xiao)(xiao)售(shou)(shou)数(shu)据(ju)(ju);第一部分的(de)(de)(de)(de)一级(ji)渠(qu)道(dao)销(xiao)(xiao)售(shou)(shou)数(shu)据(ju)(ju)是从工厂到(dao)(dao)经(jing)(jing)(jing)销(xiao)(xiao)商的(de)(de)(de)(de)数(shu)据(ju)(ju),第二(er)部分的(de)(de)(de)(de)二(er)级(ji)渠(qu)道(dao)销(xiao)(xiao)售(shou)(shou)数(shu)据(ju)(ju)是从经(jing)(jing)(jing)销(xiao)(xiao)商到(dao)(dao)售(shou)(shou)点(dian)的(de)(de)(de)(de)数(shu)据(ju)(ju)。工厂指的(de)(de)(de)(de)是酒精性(xing)(xing)饮(yin)料(liao)的(de)(de)(de)(de)生(sheng)产工厂,该酒精性(xing)(xing)饮(yin)料(liao)公(gong)司在(zai)不(bu)同的(de)(de)(de)(de)城(cheng)(cheng)市(shi)(shi)(shi)均有经(jing)(jing)(jing)销(xiao)(xiao)商(渠(qu)道(dao)商),分为(wei)高档、中高档、中档、低挡四个等(deng)级(ji),不(bu)同的(de)(de)(de)(de)经(jing)(jing)(jing)销(xiao)(xiao)商会根(gen)据(ju)(ju)售(shou)(shou)点(dian)的(de)(de)(de)(de)需求要求工厂供货(huo)。二(er)级(ji)渠(qu)道(dao)售(shou)(shou)点(dian)一般是酒吧(ba)、KTV、餐饮(yin)、零售(shou)(shou)等(deng)。

从工厂到(dao)经销(xiao)(xiao)商的(de)(de)(de)(de)(de)数(shu)据(ju)也就是(shi)(shi)(shi)一(yi)(yi)(yi)级渠(qu)(qu)道(dao)(dao)(dao)销(xiao)(xiao)售(shou)(shou)数(shu)据(ju),数(shu)据(ju)中(zhong)的(de)(de)(de)(de)(de)字(zi)段见表1。客(ke)户(hu)所使用的(de)(de)(de)(de)(de)ERP系(xi)统提供多(duo)(duo)项业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)进(jin)行(xing)记录区(qu)(qu)分(fen)出不(bu)同业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)意(yi)义:订(ding)(ding)(ding)单(dan)(dan)(dan)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)(Order Date)、需(xu)(xu)求(qiu)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)(Requirement Date)、订(ding)(ding)(ding)单(dan)(dan)(dan)释放日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)(Order Released Date)、发(fa)货(huo)(huo)(huo)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)(Shipping Date)、交(jiao)货(huo)(huo)(huo)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)(Post Good Issue Date),交(jiao)易数(shu)据(ju)皆以(yi)日(ri)(ri)(ri)(ri)为(wei)单(dan)(dan)(dan)位,明确各(ge)个交(jiao)易日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)数(shu)据(ju)在(zai)(zai)各(ge)地区(qu)(qu)实际(ji)(ji)(ji)进(jin)行(xing)业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)录入的(de)(de)(de)(de)(de)商业(ye)(ye)(ye)意(yi)义是(shi)(shi)(shi)对业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)数(shu)据(ju)描述理(li)解的(de)(de)(de)(de)(de)第一(yi)(yi)(yi)步;(1)订(ding)(ding)(ding)单(dan)(dan)(dan)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi),业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)建立订(ding)(ding)(ding)单(dan)(dan)(dan)时(shi)客(ke)户(hu)ERP系(xi)统的(de)(de)(de)(de)(de)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi);(2)需(xu)(xu)求(qiu)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi),一(yi)(yi)(yi)级渠(qu)(qu)道(dao)(dao)(dao)商根据(ju)库存与销(xiao)(xiao)售(shou)(shou)预测的(de)(de)(de)(de)(de)需(xu)(xu)要到(dao)货(huo)(huo)(huo)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi),但目前此字(zi)段没有(you)(you)严格要求(qiu)键入实际(ji)(ji)(ji)需(xu)(xu)求(qiu)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi);(3)订(ding)(ding)(ding)单(dan)(dan)(dan)释放日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi):在(zai)(zai)客(ke)户(hu)流程(cheng)中(zhong)更多(duo)(duo)的(de)(de)(de)(de)(de)是(shi)(shi)(shi)指客(ke)户(hu)账务(wu)(wu)(wu)(wu)信用额(e)度(du)满足;(4)出货(huo)(huo)(huo)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi):指从工厂到(dao)达(da)一(yi)(yi)(yi)级渠(qu)(qu)道(dao)(dao)(dao)经销(xiao)(xiao)商的(de)(de)(de)(de)(de)时(shi)间(jian),在(zai)(zai)大(da)多(duo)(duo)数(shu)的(de)(de)(de)(de)(de)运输时(shi)间(jian)都在(zai)(zai)一(yi)(yi)(yi)天(tian)以(yi)内;(5)交(jiao)货(huo)(huo)(huo)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi):在(zai)(zai)业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)流程(cheng)中(zhong)是(shi)(shi)(shi)用以(yi)界定『货(huo)(huo)(huo)权(quan)』状态的(de)(de)(de)(de)(de)时(shi)间(jian)点,在(zai)(zai)本项目数(shu)据(ju)多(duo)(duo)与出货(huo)(huo)(huo)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)字(zi)段相同。根据(ju)业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)定义应该是(shi)(shi)(shi)客(ke)户(hu)需(xu)(xu)求(qiu)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)(Requirement Date)将会(hui)是(shi)(shi)(shi)天(tian)气(qi)(qi)驱动业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)关(guan)系(xi)中(zhong)最强的(de)(de)(de)(de)(de)字(zi)段,但所取得(de)的(de)(de)(de)(de)(de)数(shu)据(ju)理(li)解发(fa)货(huo)(huo)(huo)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)(Shipping Date)更接近(jin)客(ke)户(hu)的(de)(de)(de)(de)(de)实际(ji)(ji)(ji)需(xu)(xu)要的(de)(de)(de)(de)(de)实际(ji)(ji)(ji)时(shi)间(jian);由(you)于(yu)(yu)客(ke)户(hu)的(de)(de)(de)(de)(de)业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)流程(cheng)录入时(shi)没有(you)(you)强制(zhi)所有(you)(you)订(ding)(ding)(ding)单(dan)(dan)(dan)严格要求(qiu)在(zai)(zai)ERP系(xi)统建立订(ding)(ding)(ding)单(dan)(dan)(dan)的(de)(de)(de)(de)(de)相关(guan)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)字(zi)段,在(zai)(zai)清洗(xi)数(shu)据(ju)时(shi)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)的(de)(de)(de)(de)(de)选择上与业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)单(dan)(dan)(dan)位从实际(ji)(ji)(ji)业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)流程(cheng)与数(shu)据(ju)结(jie)果来选取最能真实呈现天(tian)气(qi)(qi)驱动业(ye)(ye)(ye)务(wu)(wu)(wu)(wu)的(de)(de)(de)(de)(de)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)字(zi)段。经过分(fen)析,在(zai)(zai)实际(ji)(ji)(ji)发(fa)货(huo)(huo)(huo)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)下(xia)销(xiao)(xiao)量(liang)和(he)天(tian)气(qi)(qi)的(de)(de)(de)(de)(de)相关(guan)度(du)也比较高,所以(yi)下(xia)面均(jun)采用实际(ji)(ji)(ji)发(fa)货(huo)(huo)(huo)日(ri)(ri)(ri)(ri)期(qi)(qi)(qi)(qi)(qi)作为(wei)时(shi)间(jian)基准。对于(yu)(yu)每个产(chan)品(pin),其容量(liang)会(hui)有(you)(you)很(hen)大(da)不(bu)同,有(you)(you)些(xie)(xie)是(shi)(shi)(shi)罐装的(de)(de)(de)(de)(de),有(you)(you)些(xie)(xie)是(shi)(shi)(shi)桶(tong)装的(de)(de)(de)(de)(de),在(zai)(zai)饮品(pin)行(xing)业(ye)(ye)(ye)中(zhong)采用物品(pin)体积来衡(heng)量(liang)销(xiao)(xiao)量(liang)的(de)(de)(de)(de)(de)多(duo)(duo)少,销(xiao)(xiao)售(shou)(shou)数(shu)量(liang)(瓶、罐)则为(wei)辅助说明销(xiao)(xiao)售(shou)(shou)趋势。

表(biao)1 一级(ji)渠道销(xiao)售数据的(de)字段描(miao)述

数(shu)据 一级渠道销售数据(仅列出最终使用字段)
Id 字段名(ming)Field name 字(zi)段说明 备注说明(ming)
1 城市 销售城市;一级渠道所在城市 城市G、城市S、城市H、城市Z、城市W
2 产品 酒精性饮料产品描述 包括了品牌、子品牌、容量、包装等内容
3 订单日期(Order Date)需求日期(Requirement Date)

释放日(ri)期(Released Date)

发货日期(qi)(Shipping Date)

交货(huo)日期(PGI Date)

下单日期客户需要日期

订单释放日期(qi)

发货离厂(chang)日期

交货日期

2013年至2015年共计三年
4 交货单数量发货数量 实际发货数量 单位:件
5 体积 酒精性饮料的容量 饮品行业计量单位单位:百升

从一级(ji)渠(qu)(qu)道(dao)(经销商(shang))到二级(ji)渠(qu)(qu)道(dao)数(shu)(shu)(shu)据(ju)(ju)的(de)(de)(de)字(zi)段见表(biao)2。和一级(ji)渠(qu)(qu)道(dao)数(shu)(shu)(shu)据(ju)(ju)相(xiang)同(tong)的(de)(de)(de)是(shi)(shi),该数(shu)(shu)(shu)据(ju)(ju)虽然不(bu)记录(lu)在(zai)(zai)(zai)(zai)ERP系统(tong),而(er)记录(lu)在(zai)(zai)(zai)(zai)渠(qu)(qu)道(dao)商(shang)的(de)(de)(de)GO-TO-MARKET系统(tong)中,也定(ding)义有不(bu)同(tong)业(ye)务意义的(de)(de)(de)日(ri)期(qi)系统(tong)审核(he)日(ri)期(qi)(Audit Date)与(yu)发货(huo)日(ri)期(qi)(Shipping Date),两个日(ri)期(qi)在(zai)(zai)(zai)(zai)数(shu)(shu)(shu)据(ju)(ju)上(shang)几乎一致,而(er)订单日(ri)期(qi)(Order Date)一般是(shi)(shi)在(zai)(zai)(zai)(zai)月底记录(lu)(渠(qu)(qu)道(dao)销售返利(li)模式特性(xing)),所以该日(ri)期(qi)并不(bu)能准(zhun)(zhun)确反(fan)映天气(qi)驱动的(de)(de)(de)实际日(ri)期(qi),我(wo)们同(tong)样采用发货(huo)日(ri)期(qi)作为时间基准(zhun)(zhun)。对(dui)销量(liang)自然箱、销量(liang)百(bai)(bai)升、销量(liang)标(biao)准(zhun)(zhun)箱等行(xing)业(ye)特殊性(xing)记录(lu),在(zai)(zai)(zai)(zai)与(yu)合作业(ye)务方交流后,与(yu)一级(ji)渠(qu)(qu)道(dao)数(shu)(shu)(shu)据(ju)(ju)相(xiang)同(tong),选用销量(liang)百(bai)(bai)升。

表(biao)2 酒精性饮料(liao)二级渠道数据的字段(duan)描(miao)述(shu)

数(shu)据(ju) 二级渠道销售数据(仅列出最终使用字段)
Id 字段名Field name 字段说明(ming) 备(bei)注说明(ming)
1 auditdateorderdate

shipdate

系统审核日期订单日期

发货日期

2013年1月1日到2015年11月30日
2 城市 二级渠道所在城市 城市G、城市S、城市H、城市Z、城市W
3 渠道类型 二级渠道类型 夜店、KTV、酒吧等;高端餐饮;普通餐饮;零售商;
4 品牌家族 标注品牌所属的家族名称 一个系列的大品牌
5 子品牌 品牌细分 品牌的细分
6 出货体积 酒精性饮料的容量(单位:百升) 饮品行业计量单位

酒精性饮料属(shu)于快速消费品(FMCG:Fast Moving Consumer Goods),价格的变(bian)更(geng)、促销(xiao)方(fang)案、返(fan)利活动、新(xin)品上市等都会影响销(xiao)售的变(bian)化,导致(zhi)无法真实分析挖(wa)掘出(chu)天(tian)气(qi)驱动行业(ye)的真实情况。业(ye)务(wu)方(fang)提供(gong)了(le)其他方(fang)面的数据,包括含税价格和促销(xiao)信息。具(ju)体见表3。

表3 酒(jiu)精性饮料(liao)其他数据的字段描述

数(shu)据 其他影响销售数据
Id 字段名Field name 字段说明 备注说明
1. 日期 某个价格的期限 每一个产品的价格
2. 价格 每百升物料的月销售含税价
3. MonthStart Date

End Date

价格或促销活动月份与时间段
4. 促销分类 促销类别 22类

我们分别(bie)对一(yi)级(ji)渠道(dao)销(xiao)(xiao)(xiao)(xiao)售(shou)数据(ju)以及二级(ji)渠道(dao)销(xiao)(xiao)(xiao)(xiao)售(shou)数据(ju)进(jin)(jin)行整合,在(zai)某(mou)一(yi)个(ge)日(ri)期下,有(you)不同(tong)城市不同(tong)品牌的(de)(de)销(xiao)(xiao)(xiao)(xiao)售(shou)数据(ju),如果某(mou)个(ge)城市的(de)(de)某(mou)个(ge)品牌在(zai)某(mou)天(tian)无(wu)销(xiao)(xiao)(xiao)(xiao)售(shou)数据(ju),我们认为其销(xiao)(xiao)(xiao)(xiao)售(shou)额为0。同(tong)时由于(yu)按周(zhou)的(de)(de)销(xiao)(xiao)(xiao)(xiao)量(liang)比较稳定,规律比较明显,我们以周(zhou)为单位进(jin)(jin)行分析,销(xiao)(xiao)(xiao)(xiao)量(liang)为一(yi)周(zhou)的(de)(de)销(xiao)(xiao)(xiao)(xiao)量(liang)加总,价格为一(yi)周(zhou)的(de)(de)平均。

(二)羽绒服销售数据描述

羽(yu)绒服销售(shou)数据(ju)(ju)来自电商平台交易记录(销售(shou)数据(ju)(ju)不区分公司(si)与相关品牌),时间长度从(cong)2011年到2013年,包括了(le)全国275个(ge)城市(shi)(shi)。我们(men)提(ti)取出和(he)酒精性饮料数据(ju)(ju)中(zhong)匹配的(de)五(wu)个(ge)城市(shi)(shi)来分析,同时加入一个(ge)北(bei)方城市(shi)(shi):城市(shi)(shi)Q。数据(ju)(ju)中(zhong)除(chu)了(le)日期和(he)城市(shi)(shi)两个(ge)字段之外,还有销售(shou)总金额和(he)销售(shou)总件(jian)数。表4总结了(le)六个(ge)城市(shi)(shi)的(de)数据(ju)(ju)量(liang)(Observation)。

表4 羽绒服销量数(shu)据五个城市的数(shu)据量

城市 Observation
城市G 1096
城市S 1100
城市H 1096
城市Z 1099
城市W 1100
城市Q 1079

从2011年1月1日(ri)到2013年12月31日(ri)共1096天(tian),城(cheng)(cheng)(cheng)市S、城(cheng)(cheng)(cheng)市Z、城(cheng)(cheng)(cheng)市W数(shu)(shu)(shu)据(ju)(ju)(ju)中(zhong)多出来的(de)数(shu)(shu)(shu)据(ju)(ju)(ju)量是由于(yu)某一天(tian)的(de)销售(shou)量有两(liang)条记录导(dao)致的(de),我(wo)们(men)把这些(xie)数(shu)(shu)(shu)据(ju)(ju)(ju)按(an)天(tian)合并。而城(cheng)(cheng)(cheng)市Q的(de)某些(xie)天(tian)没(mei)有数(shu)(shu)(shu)据(ju)(ju)(ju),我(wo)们(men)认(ren)为(wei)(wei)其销量为(wei)(wei)0,气(qi)象数(shu)(shu)(shu)据(ju)(ju)(ju)则(ze)取相应(ying)时间段与(yu)(yu)观测城(cheng)(cheng)(cheng)市的(de)数(shu)(shu)(shu)据(ju)(ju)(ju)。与(yu)(yu)酒精性(xing)饮料数(shu)(shu)(shu)据(ju)(ju)(ju)一样按(an)照(zhao)日(ri)粒度进行(xing)整理,同(tong)时将一周销量加总作为(wei)(wei)周销量数(shu)(shu)(shu)据(ju)(ju)(ju),按(an)两(liang)种时间维度进行(xing)分析。

(三)天气数据描述

快速消(xiao)费品的(de)(de)(de)(de)(de)(de)酒精(jing)性饮料以(yi)(yi)及(ji)功能服饰类的(de)(de)(de)(de)(de)(de)羽绒服,业务(wu)数(shu)(shu)(shu)据(ju)(ju)的(de)(de)(de)(de)(de)(de)最(zui)小(xiao)时间(jian)颗粒度(du)为(wei)天,而(er)天气(qi)(qi)观测数(shu)(shu)(shu)据(ju)(ju)最(zui)小(xiao)时间(jian)颗粒度(du)为(wei)分(fen)钟级(ji)。从公众气(qi)(qi)象信息的(de)(de)(de)(de)(de)(de)获取(qu)、消(xiao)费购物的(de)(de)(de)(de)(de)(de)习惯(guan)以(yi)(yi)及(ji)气(qi)(qi)象数(shu)(shu)(shu)据(ju)(ju)日为(wei)单位的(de)(de)(de)(de)(de)(de)观测数(shu)(shu)(shu)据(ju)(ju)特性出发(fa),主要以(yi)(yi)日作为(wei)天气(qi)(qi)驱动消(xiao)费的(de)(de)(de)(de)(de)(de)最(zui)小(xiao)时间(jian)基础(chu)(chu)单位,使(shi)用的(de)(de)(de)(de)(de)(de)相关气(qi)(qi)象数(shu)(shu)(shu)据(ju)(ju)如表5。需要注(zhu)意的(de)(de)(de)(de)(de)(de)是,气(qi)(qi)象数(shu)(shu)(shu)据(ju)(ju)可能会因为(wei)设备故障或是其他因素影(ying)响造成缺测情况,我们(men)所选的(de)(de)(de)(de)(de)(de)都为(wei)国家级(ji)观测站,避(bi)免缺测导致的(de)(de)(de)(de)(de)(de)数(shu)(shu)(shu)据(ju)(ju)质量(liang)问题,而(er)在采(cai)取(qu)以(yi)(yi)周(zhou)为(wei)时间(jian)基础(chu)(chu)单位进(jin)行(xing)分(fen)析时,以(yi)(yi)周(zhou)天气(qi)(qi)数(shu)(shu)(shu)据(ju)(ju)记录(lu)的(de)(de)(de)(de)(de)(de)分(fen)位数(shu)(shu)(shu)为(wei)基础(chu)(chu)。

表5 日观测(ce)气(qi)象数据要素

数据 气象数据要素(日)
Id 字段名Field name 字段说明 备注说明
1 SiteId 台站编号 根据观测台站所在位置可以明确所在地(对应到行政区,如北京市东城区)
2 Day 观测日期
3 PressureAverage 日均大气压力 (单位:MPA)
4 PressureMax 日最大大气压力 (单位:MPA)
5 PressureMin 日最小大气压力 (单位:MPA)
6 TemperatureAverage 日平均气温 (单位:℃)
7 TemperatureMax 日最高气温 (单位:℃)
8 TemperatureMin 日最低气温 (单位:℃)
9 RelativeHumidityAverage 日平均相对湿度 (单位:℃)
10 RelativeHumidityMin 日最小相对湿度 (单位:%)
11 Precipitation20_8 前一日20时至当日8时的各时段降水量的累加值 (单位:mm)
12 Precipitation8_20 由当日08时至当日20时的各时段降水量的累加值 (单位:mm)
13 Precipitation20_20 由前一日20时至当日20时的各时段降水量的累加值 (单位:mm)
14 EvaporationSmall 日最小蒸发量 (单位:mm)
15 EvaporationLarge 日最大蒸发量 (单位:mm)
16 WindSpeedAverage 平均风速 (单位: m/s)
17 WindSpeedMax 最大风速 (单位: m/s)
18 WindSpeedMaxDirection 最大风速的风向 (度)
19 WindSpeedExtreme 极大风速 (单位: m/s)
20 WindSpeedExtremeDirection 极大风速的风向 (度:角度)
21 SunshineHour 日照时长 (单位:小时)
22 SurfaceTemperatureAverage 日地表均温 (单位:℃)
23 SurfaceTemperatureMax 日地表最高温 (单位:℃)
24 SurfaceTemperatureMin 日地表最低温 (单位:℃)

气(qi)象(xiang)的(de)(de)数(shu)据分(fen)(fen)析,除(chu)了以(yi)日(ri)(ri)值作为分(fen)(fen)析要(yao)点外,还(hai)有其他几个特性(xing)也是在进行天气(qi)驱动(dong)行业分(fen)(fen)析时需要(yao)考量的(de)(de),如:连(lian)续(xu)几日(ri)(ri)高(gao)(gao)于(yu)(yu)35℃高(gao)(gao)温、连(lian)续(xu)几日(ri)(ri)降(jiang)雨(yu)、连(lian)续(xu)几日(ri)(ri)低于(yu)(yu)10℃、日(ri)(ri)夜(ye)温差(cha)超过20℃,等天气(qi)要(yao)素(su)(su)模式(pattern)类型(xing)的(de)(de)组合都是天气(qi)驱动(dong)行业的(de)(de)要(yao)素(su)(su),所(suo)以(yi)除(chu)了表5的(de)(de)天气(qi)要(yao)素(su)(su)外还(hai)要(yao)设计多种(zhong)天气(qi)要(yao)素(su)(su)模式(pattern)。

天气(qi)上的(de)重大(da)事件,如台(tai)风(feng)(feng)也(ye)会(hui)对酒精(jing)性饮(yin)料(liao)销量产(chan)生影(ying)(ying)响(xiang),所(suo)以我们也(ye)将受影(ying)(ying)响(xiang)的(de)时间(jian)、台(tai)风(feng)(feng)等级加入(ru)在气(qi)象数据中(台(tai)风(feng)(feng)主要(yao)反映在天气(qi)要(yao)素的(de)风(feng)(feng)速、降雨(yu)等)。

公众目前获取最长的天(tian)气(qi)(qi)预(yu)报(bao)为(wei)15天(tian),羽绒(rong)服以(yi)及酒精性饮料的数(shu)据都(dou)自2011年与2013年开始,当时公众所(suo)获取的天(tian)气(qi)(qi)预(yu)报(bao)数(shu)据多(duo)为(wei)7天(tian),所(suo)以(yi)在数(shu)据清洗拟合(he)也(ye)会(hui)进行多(duo)种时间窗的平移,以(yi)确定(ding)业务数(shu)据是(shi)受当日(ri)实际感(gan)受的驱动,还是(shi)天(tian)气(qi)(qi)预(yu)报(bao)的提前反应(ying)。

(四)补充数据描述

除了合(he)作方提供的(de)(de)销(xiao)售数(shu)(shu)(shu)据(ju)和(he)气象(xiang)(xiang)局(ju)的(de)(de)数(shu)(shu)(shu)据(ju),还要考(kao)虑其他能(neng)够量(liang)(liang)(liang)化并获取的(de)(de)可能(neng)影(ying)响(xiang)销(xiao)量(liang)(liang)(liang)的(de)(de)数(shu)(shu)(shu)据(ju)。消费(fei)者的(de)(de)需求也可能(neng)受经济因(yin)素(su)的(de)(de)影(ying)响(xiang),因(yin)此我(wo)(wo)(wo)们抓取了数(shu)(shu)(shu)据(ju)时(shi)间段内(nei)的(de)(de)上证指数(shu)(shu)(shu)和(he)居民(min)消费(fei)价(jia)格(ge)指数(shu)(shu)(shu)(Consumer Price Index,CPI)。由于周末(mo)收(shou)盘,在(zai)周末(mo)没(mei)有上证指数(shu)(shu)(shu)数(shu)(shu)(shu)据(ju),周末(mo)的(de)(de)上证指数(shu)(shu)(shu)我(wo)(wo)(wo)们用(yong)周五的(de)(de)来填补(bu)。而我(wo)(wo)(wo)们能(neng)获得的(de)(de)CPI数(shu)(shu)(shu)据(ju)是(shi)一(yi)个(ge)月统(tong)计一(yi)次,因(yin)此在(zai)某一(yi)个(ge)月内(nei),我(wo)(wo)(wo)们统(tong)一(yi)用(yong)一(yi)个(ge)CPI数(shu)(shu)(shu)值。除此之外,对于酒精性(xing)饮料销(xiao)售来说,在(zai)有重(zhong)大赛事(shi)时(shi),如(ru)世(shi)界杯等,酒精性(xing)饮料销(xiao)量(liang)(liang)(liang)会显著上升(sheng),因(yin)此我(wo)(wo)(wo)们查找了数(shu)(shu)(shu)据(ju)时(shi)间段内(nei)可能(neng)会影(ying)响(xiang)到酒精性(xing)饮料销(xiao)量(liang)(liang)(liang)的(de)(de)重(zhong)大事(shi)件加(jia)入(ru)(ru)数(shu)(shu)(shu)据(ju)中。加(jia)入(ru)(ru)event变(bian)量(liang)(liang)(liang),如(ru)果当(dang)天(tian)有重(zhong)大事(shi)件,event为(wei)(wei)1,否(fou)则为(wei)(wei)0。在(zai)法(fa)定假(jia)日时(shi),售点(dian)和(he)经销(xiao)商一(yi)般会提前存货(huo),因(yin)此公司的(de)(de)销(xiao)量(liang)(liang)(liang)会增加(jia),我(wo)(wo)(wo)们把这个(ge)因(yin)素(su)也考(kao)虑进去,在(zai)数(shu)(shu)(shu)据(ju)中增加(jia)holiday变(bian)量(liang)(liang)(liang),假(jia)如(ru)当(dang)天(tian)是(shi)法(fa)定假(jia)日标(biao)记为(wei)(wei)1,否(fou)则标(biao)记为(wei)(wei)0。同样,月末(mo)也会出现(xian)囤货(huo)的(de)(de)现(xian)象(xiang)(xiang),与法(fa)定假(jia)期一(yi)样,我(wo)(wo)(wo)们将月末(mo)标(biao)记为(wei)(wei)1,否(fou)则标(biao)记为(wei)(wei)0。

 

三、数据建模

为了找到所有气(qi)象要素(su)中真正(zheng)影响(xiang)销量(liang)的(de)要素(su),我们利用(yong)皮(pi)尔森(Pearson)相关(guan)性进(jin)行检(jian)验(yan),发现平均温度(du)是与(yu)酒精性饮料销量(liang)以(yi)及(ji)羽绒(rong)服(fu)销量(liang)关(guan)系最大(da)的(de)要素(su)。因(yin)此(ci)在描述性分(fen)析部分(fen),我们用(yong)平均气(qi)温来探索销量(liang)与(yu)天气(qi)之间的(de)关(guan)系。

(一)酒精性饮料数据的建模

(1)描述性(xing)分析

图1展(zhan)(zhan)示(shi)了(le)一(yi)级(ji)渠道(dao)的销量(liang)按月(yue)份(fen)的分(fen)布情况(纵(zong)轴(zhou)实际销售体积涉及商(shang)业(ye)秘密不予展(zhan)(zhan)示(shi),仅用(yong)于(yu)说明(ming)趋(qu)势),不同(tong)颜色代表不同(tong)年份(fen),横坐标(biao)代表月(yue)份(fen)、纵(zong)坐标(biao)代表百升的销量(liang)。城(cheng)(cheng)市(shi)(shi)(shi)(shi)G和城(cheng)(cheng)市(shi)(shi)(shi)(shi)S是两个(ge)销量(liang)大城(cheng)(cheng)市(shi)(shi)(shi)(shi);夏天的销量(liang)有(you)明(ming)显的增(zeng)高(gao),而当天气转(zhuan)冷的时(shi)候销量(liang)会下(xia)降;在(zai)城(cheng)(cheng)市(shi)(shi)(shi)(shi)G,销量(liang)在(zai)逐年上升,但是在(zai)城(cheng)(cheng)市(shi)(shi)(shi)(shi)S、城(cheng)(cheng)市(shi)(shi)(shi)(shi)Z、城(cheng)(cheng)市(shi)(shi)(shi)(shi)H、城(cheng)(cheng)市(shi)(shi)(shi)(shi)W这四个(ge)城(cheng)(cheng)市(shi)(shi)(shi)(shi)却没有(you)这样的趋(qu)势;城(cheng)(cheng)市(shi)(shi)(shi)(shi)S、城(cheng)(cheng)市(shi)(shi)(shi)(shi)Z、城(cheng)(cheng)市(shi)(shi)(shi)(shi)H、城(cheng)(cheng)市(shi)(shi)(shi)(shi)W这四个(ge)城(cheng)(cheng)市(shi)(shi)(shi)(shi)七八月(yue)之后的销量(liang)均出现了(le)急速下(xia)降。图2展(zhan)(zhan)示(shi)了(le)二级(ji)渠道(dao)的销量(liang)按月(yue)份(fen)的分(fen)布情况(纵(zong)轴(zhou)实际销售体积涉及商(shang)业(ye)秘密不予展(zhan)(zhan)示(shi),仅用(yong)于(yu)说明(ming)趋(qu)势),其趋(qu)势与一(yi)级(ji)渠道(dao)一(yi)样,也呈现出季(ji)节的周期性变化。

从销(xiao)(xiao)量(liang)按月份的(de)(de)(de)趋(qu)势(shi)来看,销(xiao)(xiao)量(liang)确实(shi)与天(tian)气(qi)有(you)一(yi)定的(de)(de)(de)关系。我们在分析的(de)(de)(de)时(shi)候分别(bie)(bie)以(yi)天(tian)(销(xiao)(xiao)售(shou)日与当(dang)日天(tian)气(qi)数(shu)(shu)(shu)据,以(yi)及销(xiao)(xiao)售(shou)日数(shu)(shu)(shu)据分别(bie)(bie)平滑(hua)1天(tian)到7天(tian);区分是(shi)(shi)受当(dang)时(shi)天(tian)气(qi)感受的(de)(de)(de)影响,还(hai)是(shi)(shi)接收天(tian)气(qi)预报(bao)后所做的(de)(de)(de)反应(ying))还(hai)有(you)周(zhou)(zhou)(zhou)(采(cai)用周(zhou)(zhou)(zhou)天(tian)气(qi)要素的(de)(de)(de)分位数(shu)(shu)(shu)),最终是(shi)(shi)以(yi)周(zhou)(zhou)(zhou)为(wei)(wei)单位进行预测(ce)的(de)(de)(de),因此下面我们按周(zhou)(zhou)(zhou)对销(xiao)(xiao)量(liang)和(he)天(tian)气(qi)进行描述(shu)。图3和(he)图 4分别(bie)(bie)为(wei)(wei)二级(ji)(ji)渠道和(he)一(yi)级(ji)(ji)渠道的(de)(de)(de)销(xiao)(xiao)量(liang)和(he)天(tian)气(qi)按周(zhou)(zhou)(zhou)的(de)(de)(de)趋(qu)势(shi),横轴为(wei)(wei)周(zhou)(zhou)(zhou),左边(bian)纵(zong)轴为(wei)(wei)销(xiao)(xiao)量(liang),右边(bian)纵(zong)轴为(wei)(wei)平均气(qi)温。出现(xian)的(de)(de)(de)负(fu)值销(xiao)(xiao)量(liang)表示这(zhei)一(yi)周(zhou)(zhou)(zhou)有(you)退货的(de)(de)(de)情(qing)况,而(er)且退货数(shu)(shu)(shu)量(liang)要比(bi)订货数(shu)(shu)(shu)量(liang)高,在销(xiao)(xiao)量(liang)比(bi)较低(di)的(de)(de)(de)城(cheng)(cheng)市(shi)会出现(xian)这(zhei)样的(de)(de)(de)现(xian)象(xiang)。在城(cheng)(cheng)市(shi)G,销(xiao)(xiao)量(liang)和(he)天(tian)气(qi)的(de)(de)(de)趋(qu)势(shi)比(bi)较明(ming)显,而(er)城(cheng)(cheng)市(shi)S会出现(xian)一(yi)些异(yi)常情(qing)况,城(cheng)(cheng)市(shi)H、城(cheng)(cheng)市(shi)W、城(cheng)(cheng)市(shi)Z的(de)(de)(de)趋(qu)势(shi)比(bi)较弱,特别(bie)(bie)是(shi)(shi)城(cheng)(cheng)市(shi)W,其(qi)销(xiao)(xiao)量(liang)整体偏(pian)低(di),就算气(qi)温有(you)明(ming)显的(de)(de)(de)上(shang)升(sheng),其(qi)销(xiao)(xiao)量(liang)也没有(you)增长。

城市G
 city1
城市S 城市Z
city2 city3
城市H 城市W
city4 city5

图1 一(yi)级渠道(dao)销量按月(yue)趋势

城市G
city6
城市S 城市Z
city7 city8
城市H 城市W
city9 city10

图2 二级渠道销量(liang)按(an)月趋势

城市G
city11
城市S 城市Z
city12 city13
城市H 城市W
city14 city15

图3 一级渠道销量与平均(jun)气(qi)温按周(zhou)趋势(橘色(se)曲线(xian)为(wei)天气(qi)平均(jun)温度(du)要素(su),蓝色(se)曲线(xian)为(wei)销量)

 

城市G
city16
城市S 城市Z
city17 city18
城市H 城市W
city19 city20

图(tu)4 二级渠(qu)道(dao)销量与平均气温按周趋(qu)势(shi)(橘色曲线为天气平均温度要素,蓝色曲线为销量)

 

(2)模型设(she)定

时(shi)间(jian)序列(lie)数(shu)(shu)据一般由长期趋(qu)(qu)势(shi)(shi)、季(ji)(ji)(ji)节变(bian)(bian)动(dong)(dong)、循(xun)环变(bian)(bian)动(dong)(dong)、不(bu)(bu)规则变(bian)(bian)动(dong)(dong)四个(ge)部(bu)(bu)分(fen)组成。其中长期趋(qu)(qu)势(shi)(shi)指的(de)是随着(zhe)时(shi)间(jian)的(de)变(bian)(bian)化(hua)(hua);季(ji)(ji)(ji)节变(bian)(bian)动(dong)(dong)指随着(zhe)季(ji)(ji)(ji)节变(bian)(bian)化(hua)(hua)的(de)周(zhou)期性变(bian)(bian)动(dong)(dong);循(xun)环变(bian)(bian)动(dong)(dong)指以若干年为(wei)(wei)单(dan)位的(de)变(bian)(bian)化(hua)(hua);不(bu)(bu)规则变(bian)(bian)动(dong)(dong)是随机变(bian)(bian)化(hua)(hua)导致(zhi)的(de)波(bo)动(dong)(dong)。本(ben)文(wen)的(de)数(shu)(shu)据时(shi)间(jian)间(jian)隔(ge)均为(wei)(wei)3年左右,所以不(bu)(bu)存在(zai)循(xun)环变(bian)(bian)动(dong)(dong)项。我们把数(shu)(shu)据分(fen)解(jie)(jie)为(wei)(wei)趋(qu)(qu)势(shi)(shi)项、季(ji)(ji)(ji)节项和(he)随机波(bo)动(dong)(dong)项,以二级渠道销(xiao)售数(shu)(shu)据为(wei)(wei)例(li),分(fen)解(jie)(jie)情况如图(tu)5(纵轴实际(ji)销(xiao)售体积(ji)涉及商业秘密不(bu)(bu)予展示,仅用于说明(ming)趋(qu)(qu)势(shi)(shi))。分(fen)解(jie)(jie)之(zhi)后,虽(sui)然由于目(mu)前数(shu)(shu)据中还有(you)很(hen)多没有(you)测(ce)量出来的(de)因素,白噪(zao)声部(bu)(bu)分(fen)不(bu)(bu)是完全(quan)由随机波(bo)动(dong)(dong)影响(xiang)的(de),但是季(ji)(ji)(ji)节项按季(ji)(ji)(ji)节的(de)周(zhou)期趋(qu)(qu)势(shi)(shi)更加(jia)明(ming)显了,而趋(qu)(qu)势(shi)(shi)项随着(zhe)时(shi)间(jian)的(de)变(bian)(bian)化(hua)(hua)呈现一定的(de)波(bo)动(dong)(dong)。我们对(dui)分(fen)解(jie)(jie)出的(de)季(ji)(ji)(ji)节项和(he)趋(qu)(qu)势(shi)(shi)项分(fen)别(bie)进行预测(ce)。

对于季节项部分,我们采用随机森林进行预测。随机森林由2001年被Breiman 提出[7],是一种基于树的集成学习算法。Fernandez-Delgado et al. [8] 在121份数据集上进行了测试,证明随机森林是在支持向量机、神经网络等机器学习算法中表现得最好的一个算法。对于我们的数据来说,很难看出天气变化对销量的影响呈现特定的函数关系,因此我们选用随机森林这种不需要模型假设的非参数方法进行预测。

对于(yu)趋(qu)势项部(bu)分(fen),我(wo)们采用三次样条进(jin)行预(yu)测。由(you)于(yu)不同城(cheng)市随着时间变化(hua)的(de)趋(qu)势差别很大(da),利用三次样条,我(wo)们可以拟合不同形状的(de)趋(qu)势变化(hua)。

基于公众可以便(bian)利(li)的(de)(de)(de)获取气(qi)象局提供的(de)(de)(de)7天(tian)(tian)(最(zui)多(duo)15天(tian)(tian))天(tian)(tian)气(qi)预(yu)报前提,与(yu)以往的(de)(de)(de)销(xiao)售预(yu)测不同(tong)(tong),我(wo)们(men)可以利(li)用(yong)未来的(de)(de)(de)天(tian)(tian)气(qi)进行(xing)预(yu)测。同(tong)(tong)时(shi),呈季节(jie)变化的(de)(de)(de)销(xiao)量(liang)不仅受到(dao)了天(tian)(tian)气(qi)和(he)经(jing)济(ji)因素(su)的(de)(de)(de)影响,上(shang)一年同(tong)(tong)一个时(shi)间点(dian)的(de)(de)(de)销(xiao)量(liang)和(he)上(shang)一周的(de)(de)(de)销(xiao)量(liang)也(ye)与(yu)当(dang)前时(shi)间点(dian)的(de)(de)(de)销(xiao)量(liang)有关系(xi),因此我(wo)们(men)把(ba)同(tong)(tong)比(bi)销(xiao)量(liang)和(he)环比(bi)销(xiao)量(liang)也(ye)放入模型中。除此之外,为了考虑经(jing)济(ji)环境(jing)的(de)(de)(de)影响,我(wo)们(men)加入了上(shang)证指数和(he)CPI。

(3)模(mo)型结(jie)果

我们从数据中剔除出最后三个月的(de)数据来做测(ce)试集,剩(sheng)下的(de)部(bu)分(fen)均为(wei)学习集。通过(guo)真实值(zhi)与(yu)预测(ce)值(zhi)之(zhi)间的(de)误(wu)差(cha)(cha)的(de)绝对值(zhi)占真实值(zhi)的(de)百分(fen)比来衡(heng)量预测(ce)误(wu)差(cha)(cha),预测(ce)误(wu)差(cha)(cha)总(zong)结见(jian)表6:

表6 酒精性饮(yin)料销量的预测误(wu)差

城市 预测误差
一级渠道 二级渠道
城市G 0.1133 0.1203
城市S 0.2808 0.2228
城市H 0.2821 0.3046
城市Z 0.4103 0.1454
城市W 0.4457 0.1988

城(cheng)市(shi)G的(de)预(yu)测(ce)效(xiao)果(guo)是最好的(de),城(cheng)市(shi)S次之(zhi)。在所有天气(qi)要素中(风、温度(du)、相对湿度(du)、大(da)气(qi)压力、降(jiang)雨),温度(du)要素与(yu)销售量(liang)相关性最高,但是在图(tu)(tu)3和图(tu)(tu)4中,仅城(cheng)市(shi)G可以看到销量(liang)和天气(qi)的(de)气(qi)温要素走势比(bi)(bi)较(jiao)一致,而(er)其(qi)他城(cheng)市(shi)会出现气(qi)温上升,销量(liang)反而(er)下滑的(de)情况(kuang),而(er)且城(cheng)市(shi)G的(de)销量(liang)波动(dong)趋(qu)势也比(bi)(bi)较(jiao)平稳。

城市G
city21
城市S
city22
城市Z
city23
城市H
city24
城市W
city25

图5 二级渠道销量分解情(qing)况

 

(二)羽绒服数据建模

(1)描述性分析

图(tu)6和(he)图(tu)7分别为(wei)羽绒服(fu)销(xiao)(xiao)(xiao)量(liang)(liang)与天气(qi)之间的(de)趋(qu)(qu)势(shi)(shi)变化图(tu)。虽(sui)然(ran)不(bu)同城(cheng)市(shi)之间趋(qu)(qu)势(shi)(shi)有差别,但是(shi)基本上都呈现(xian)当气(qi)温开始下降的(de)时候(hou),销(xiao)(xiao)(xiao)量(liang)(liang)开始上升(sheng)的(de)趋(qu)(qu)势(shi)(shi)。同时,不(bu)管是(shi)按销(xiao)(xiao)(xiao)量(liang)(liang)金额还是(shi)销(xiao)(xiao)(xiao)量(liang)(liang)件(jian)数(shu)都呈现(xian)逐年(nian)上升(sheng)的(de)情(qing)况。但是(shi)对于(yu)城(cheng)市(shi)S来说,虽(sui)然(ran)每年(nian)的(de)销(xiao)(xiao)(xiao)量(liang)(liang)金额都在上升(sheng),但是(shi)销(xiao)(xiao)(xiao)量(liang)(liang)件(jian)数(shu)却仅(jin)在11年(nian)冬季出现(xian)了一个(ge)高峰后就急剧降低,需要进(jin)一步结(jie)合其他数(shu)据进(jin)行探讨(tao)或是(shi)测试。

表7展示(shi)了销(xiao)(xiao)量(liang)与(yu)平均气(qi)温之(zhi)间(jian)的(de)皮尔森(Pearson)相(xiang)关(guan)度。除了城市S的(de)销(xiao)(xiao)量(liang)件数出现了异常之(zhi)外,平均气(qi)温与(yu)销(xiao)(xiao)量(liang)之(zhi)间(jian)呈现负(fu)相(xiang)关(guan),这表明(ming)随着气(qi)温下降,羽绒服的(de)销(xiao)(xiao)量(liang)会上(shang)升,同时,相(xiang)关(guan)度均在0.3左右,说(shuo)明(ming)气(qi)温与(yu)销(xiao)(xiao)量(liang)之(zhi)间(jian)有比较强的(de)关(guan)系。

表7 销量与平均气温之间的皮尔森(PEARSON)相关系数

城市 销(xiao)量(成(cheng)交价格:元) 销(xiao)量(件)
城市G -0.3980 -0.3332
城市S -0.3188 -0.0008
城市H -0.3267 -0.2888
城市Z -0.3043 -0.2828
城市W -0.3319 -0.2999
城市Q -0.2283 -0.2185

 

城市G
city26
城市S
city27
城市H
city28
城市Z
city29
城市W
city30
城市Q
city31

图6 销(xiao)量(liang)(元(yuan))与平均气温的(de)变化(hua)趋(qu)势(红色(se)曲线(xian)为天(tian)气,蓝色(se)曲线(xian)为销(xiao)量(liang))

城市G
city32
城市S
city33
城市H
city34
城市Z
city35
城市W
city36
城市Q
city37

图7 销量(liang)(件(jian))与平均气温的变化趋势(红色曲(qu)线(xian)(xian)为天气,绿色曲(qu)线(xian)(xian)为销量(liang))

(2)模(mo)型设(she)定

和(he)酒(jiu)精性(xing)饮料数据(ju)一样,我(wo)们(men)同样将数据(ju)分解为趋(qu)势项(xiang)(xiang)、季(ji)(ji)节项(xiang)(xiang)和(he)随机波动项(xiang)(xiang)。对(dui)于(yu)趋(qu)势项(xiang)(xiang)我(wo)们(men)依旧采用(yong)(yong)三(san)次样条去拟合,而(er)对(dui)于(yu)季(ji)(ji)节项(xiang)(xiang),由(you)于(yu)我(wo)们(men)仅用(yong)(yong)皮(pi)尔森(sen)(PEARSON)相关(guan)系数就已经可以(yi)测量到平均气(qi)温(wen)与销量之间(jian)很强(qiang)的相关(guan)度,因(yin)此(ci)我(wo)们(men)用(yong)(yong)线性(xing)回归来进(jin)行预(yu)测。同样,我(wo)们(men)在(zai)模(mo)型中加(jia)(jia)入了环比销量和(he)同比销量。而(er)从图6和(he)7 中,可以(yi)看出,一般在(zai)气(qi)温(wen)达到峰(feng)值后的两个星(xing)期,销量达到峰(feng)值,因(yin)此(ci)我(wo)们(men)在(zai)模(mo)型中加(jia)(jia)入比当前时间(jian)点提(ti)前两个星(xing)期的天气(qi)因(yin)素。

(3)模型(xing)结(jie)果(guo)

和酒精性饮料(liao)数(shu)据一样(yang),我们剔除出最后三个月的(de)数(shu)据来做测(ce)试集(ji),剩下的(de)部分(fen)均(jun)为(wei)学习集(ji)。通过真实值(zhi)与(yu)预(yu)测(ce)值(zhi)之(zhi)间的(de)误(wu)(wu)差的(de)绝对值(zhi)占真实值(zhi)的(de)百分(fen)比来衡量预(yu)测(ce)误(wu)(wu)差。表8展示了(le)羽绒服数(shu)据的(de)预(yu)测(ce)误(wu)(wu)差,很明显,除了(le)城市(shi)S的(de)销(xiao)量件数(shu)之(zhi)外,其(qi)他部分(fen)的(de)预(yu)测(ce)效果都很好(hao),说明天气对羽绒服销(xiao)量的(de)影响(xiang)的(de)确十(shi)分(fen)大(da)。

表8 羽绒(rong)服数据销量预测(ce)结果

城市 预测误差
销量(元) 销量(件)
城市G 0.0578 0.1000
城市S 0.0452 0.1537
城市H 0.0541 0.0885
城市Z 0.0527 0.0855
城市W 0.0433 0.0673
城市Q 0.0378 0.0664

 

四、业务实施

(Data  Driven)的落地实施过(guo)程中,我们与企业的首要(yao)目标是(shi)明确(que)我们要(yao)解决的商(shang)业问题(Business Question)并进(jin)一步了解透过(guo)数据进(jin)行分析(xi)挖掘解决问题的可(ke)能。

我们(men)与企(qi)业(ye)合作在设(she)定商(shang)(shang)业(ye)问题过程中,发现企(qi)业(ye)对于开始数(shu)据(ju)分析(xi)业(ye)务的商(shang)(shang)业(ye)问题更多集中在可快(kuai)速简单量化成(cheng)绩的销(xiao)售业(ye)务(商(shang)(shang)品或(huo)服务的销(xiao)售成(cheng)果)与营销(xiao)业(ye)务(促销(xiao)活动(dong)、广告投放等),实施全程采取了天(tian)气驱动(dong)业(ye)务分析(xi)框架(jia)(Weather Driven Analysis Framework)如(ru)图8。

city38

图8 天气驱动业(ye)务分析框架

本文探讨的酒(jiu)精(jing)性饮料以(yi)及羽绒服(fu)的商(shang)业问(wen)题:销(xiao)(xiao)(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测(ce)(ce)以(yi)及支持(chi)精(jing)准营销(xiao)(xiao)(xiao)。天(tian)气(qi)(qi)(qi)驱(qu)动项(xiang)目(mu)交付的是(1)可以(yi)实时运(yun)行可视化销(xiao)(xiao)(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测(ce)(ce)模型(xing)与(2)持(chi)续的精(jing)细化天(tian)气(qi)(qi)(qi)预(yu)(yu)(yu)测(ce)(ce)数(shu)(shu)据支持(chi),示(shi)(shi)意(yi)画面如图9(因商(shang)业秘(mi)密(mi),仅提(ti)供(gong)系(xi)统示(shi)(shi)意(yi)画面);我们(men)也(ye)称(cheng)此为(wei)天(tian)气(qi)(qi)(qi)驱(qu)动销(xiao)(xiao)(xiao)售(shou)(shou)(shou)仪(yi)表板(ban)(Dashboard)。客户接(jie)(jie)入天(tian)气(qi)(qi)(qi)预(yu)(yu)(yu)测(ce)(ce)数(shu)(shu)据后、同(tong)时将(jiang)假日、价格(ge)、促销(xiao)(xiao)(xiao)等(deng)因子由ERP同(tong)步接(jie)(jie)入,天(tian)气(qi)(qi)(qi)驱(qu)动销(xiao)(xiao)(xiao)售(shou)(shou)(shou)仪(yi)表板(ban)实时显示(shi)(shi)最新的销(xiao)(xiao)(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测(ce)(ce)数(shu)(shu)字,输出内容包括:城(cheng)市、总销(xiao)(xiao)(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测(ce)(ce)量(liang)、各品牌销(xiao)(xiao)(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测(ce)(ce)量(liang)、各渠(qu)道销(xiao)(xiao)(xiao)售(shou)(shou)(shou)预(yu)(yu)(yu)测(ce)(ce)量(liang)以(yi)及相关的天(tian)气(qi)(qi)(qi)数(shu)(shu)据与预(yu)(yu)(yu)警信息。

city39

图9 天气驱动业(ye)务销售预测示意画(hua)面(mian)

由经验判断开始(shi)使用(yong)更多的数(shu)据与(yu)(yu)采用(yong)大数(shu)据相(xiang)关(guan)技术开始(shi)数(shu)据驱动(Data Driven)经营企(qi)业,天气驱动销售让企(qi)业做出(chu)下列(lie)举(ju)措(cuo)变(bian)化与(yu)(yu)趋势:

  1. 企业的产销计划(SOP: Sales & Operation Planning)得到定量的科学化预测支持。
  2. 公司经营与渠道商开始了解天气预报与影响,根据数据进行采购与销售。
  3. 开始天气相关的营销活动(Campaign)。
  4. 根据天气因果性,开始思索如何精确的投放广告(根据目前天气预报的时长准确程度,还无法应对目前传统广告采购规则,但移动广告则非常有机会)。
  5. 电商平台根据各地天气变化预报,调整推送受天气驱动商品。

 

五、总结讨论

本(ben)文通过公共数(shu)(shu)据(ju)(ju)(ju)(气象数(shu)(shu)据(ju)(ju)(ju))结合行业(ye)(ye)数(shu)(shu)据(ju)(ju)(ju)实际探(tan)讨(tao)两种不同交易形态的(de)业(ye)(ye)务:B2B与(yu)B2C,完(wan)成通过实际交易数(shu)(shu)据(ju)(ju)(ju)与(yu)天气数(shu)(shu)据(ju)(ju)(ju)分析(xi)挖掘相关性与(yu)因(yin)果性实现(xian)天气驱动(Weather Driven)的(de)实践,促使数(shu)(shu)据(ju)(ju)(ju)驱动(Data Driven)能够真实落地协助(zhu)行业(ye)(ye)在(zai)(zai)同质(zhi)化非常严重的(de)产业(ye)(ye)环境中(zhong)快速(su)回应挑(tiao)战(zhan);但在(zai)(zai)大环境下(xia),企(qi)业(ye)(ye)对于(yu)开始数(shu)(shu)据(ju)(ju)(ju)驱动业(ye)(ye)务管理(li),总是希望(wang)以(yi)最低的(de)投入让(rang)现(xian)有(you)的(de)资料(liao)、数(shu)(shu)据(ju)(ju)(ju)、IT等(deng)资源以(yi)最低成本(ben)、低风(feng)险(xian)又(you)有(you)效(xiao)的(de)方(fang)式完(wan)成数(shu)(shu)据(ju)(ju)(ju)驱动的(de)企(qi)业(ye)(ye)经(jing)营,造(zao)成执行者(zhe)必(bi)须面(mian)对以(yi)有(you)限(xian)资源追求极(ji)大化成效(xiao)的(de)挑(tiao)战(zhan),也造(zao)就企(qi)业(ye)(ye)开始数(shu)(shu)据(ju)(ju)(ju)驱动业(ye)(ye)务管理(li)变革(ge)上的(de)风(feng)险(xian)。

天气(qi)虽然影响众多行业(ye),但(dan)是(shi)天气(qi)终究仅(jin)是(shi)一项影响因子;我们进(jin)(jin)行天气(qi)驱(qu)动业(ye)务分析(xi)业(ye)务实(shi)践(jian)中,天气(qi)驱(qu)动销售(shou)以快(kuai)速(su)消(xiao)费(fei)品(pin)(FMCG)行业(ye)销售(shou)数据+天气(qi)数据的效果反(fan)馈最佳,主要(yao)(yao)是(shi)因消(xiao)费(fei)者可以用低成本抵抗天气(qi)带来的影响,本文所提及的酒精性饮料快(kuai)速(su)消(xiao)费(fei)品(pin)的实(shi)际案例。其他像(xiang)是(shi)大气(qi)污(wu)染预报、医疗保健(Healthcare)、农林渔牧也有相当正面的反(fan)馈;但(dan)是(shi)对(dui)于需要(yao)(yao)产品(pin)生命周期(qi)较长、售(shou)价较高、品(pin)牌占比较重的行业(ye)或(huo)领域则需要(yao)(yao)更进(jin)(jin)一步的探讨。

在快速消费品(pin)的(de)天气驱动销售虽(sui)然可(ke)以(yi)(yi)(yi)得到很好的(de)效(xiao)果(guo),又(you)可(ke)以(yi)(yi)(yi)细分为不同的(de)区域(yu)(市(shi)(shi)场),以(yi)(yi)(yi)酒(jiu)(jiu)精性(xing)(xing)饮料(liao)为例,在城市(shi)(shi)G与(yu)(yu)(yu)城市(shi)(shi)S两(liang)个(ge)城市(shi)(shi)该品(pin)牌已经非常(chang)成(cheng)熟,最终得到的(de)预测(ce)准(zhun)确性(xing)(xing)也非常(chang)高,可(ke)是在城市(shi)(shi)W对该品(pin)牌还属于新兴市(shi)(shi)场(Emerging Market)与(yu)(yu)(yu)天气的(de)相关性(xing)(xing)远低(di)于该酒(jiu)(jiu)精性(xing)(xing)饮料(liao)口碑(bei)、品(pin)牌认知与(yu)(yu)(yu)当地口味喜好等因素的(de)影响。羽绒(rong)服的(de)数(shu)据结果(guo)同样说明了类似的(de)结论,特别呈现在羽绒(rong)服的(de)功(gong)能性(xing)(xing)与(yu)(yu)(yu)服饰特性(xing)(xing)上,例如在城市(shi)(shi)Q这样冬天非常(chang)寒冷的(de)区域(yu)就会更重视功(gong)能性(xing)(xing),而像是城市(shi)(shi)G地区消费者(zhe)更注重的(de)是服『饰』的(de)功(gong)能。

从天气驱动(dong)(dong)销售角度来看数据采集:酒(jiu)精性(xing)饮料项目(mu)的(de)(de)数据来源于ERP以及渠(qu)道商的(de)(de)GO-TO-MARKET销售数据,有两项特(te)点(dian):(1)国内企业(ye)的(de)(de)ERP系统主要追求的(de)(de)目(mu)标(biao)是(shi)财务(wu)记(ji)账导向(以符合会计准则(ze)的(de)(de)记(ji)录(lu)为(wei)依据),可信(xin)的(de)(de)是(shi)交易(yi)(yi)数量(liang)与金额(e)的(de)(de)正(zheng)确,但无法记(ji)录(lu)真(zhen)实(shi)的(de)(de)交易(yi)(yi)时间(jian);(2)渠(qu)道商的(de)(de)GO-TO-MARKET销售数据受到(dao)返(fan)(fan)利(Rebate)政策影(ying)响,所有的(de)(de)交易(yi)(yi)数据都(dou)会因不同(tong)区域结算返(fan)(fan)利或渠(qu)道申报销售考核(he)的(de)(de)时间(jian)点(dian)而(er)无法记(ji)录(lu)真(zhen)实(shi)的(de)(de)交易(yi)(yi)时间(jian)。这两项特(te)点(dian)发生在非常多(duo)企业(ye)CRM(Customer Relationship Management)、ERP系统上,所以若需要进行天气驱动(dong)(dong)销售,需要投入更多(duo)的(de)(de)精力了解每一笔数据与每一个字段的(de)(de)业(ye)务(wu)含义,才有机会真(zhen)正(zheng)帮助(zhu)到(dao)企业(ye)开(kai)始好的(de)(de)数据驱动(dong)(dong)管理(理解业(ye)务(wu)才能真(zhen)正(zheng)解决商业(ye)问题)。

成(cheng)功的(de)(de)(de)数(shu)(shu)据(ju)驱动(dong)业(ye)(ye)(ye)(ye)务管理取决于(yu)设(she)定正(zheng)确的(de)(de)(de)商业(ye)(ye)(ye)(ye)问(wen)题(ti)(Business Question),通过对行(xing)业(ye)(ye)(ye)(ye)的(de)(de)(de)理解不断地提出(chu)可(ke)能(neng)的(de)(de)(de)假设(she)(Hypothesis)并(bing)使用大数(shu)(shu)据(ju)的(de)(de)(de)方法论进(jin)行(xing)验证(zheng)每(mei)一项假设(she),直(zhi)到可(ke)验证(zheng)数(shu)(shu)据(ju)因果性的(de)(de)(de)阶段,并(bing)测(ce)试成(cheng)功,才是完整的(de)(de)(de)数(shu)(shu)据(ju)驱动(dong)业(ye)(ye)(ye)(ye)务实践(Practice)。错误的(de)(de)(de)问(wen)题(ti)会(hui)增加企(qi)业(ye)(ye)(ye)(ye)在推动(dong)数(shu)(shu)据(ju)驱动(dong)管理业(ye)(ye)(ye)(ye)务成(cheng)本与(yu)风险,例如(ru)我们将(jiang)商业(ye)(ye)(ye)(ye)问(wen)题(ti)设(she)定为酒(jiu)精(jing)性饮料(liao)销售(shou)与(yu)天气(qi)(qi)要素的(de)(de)(de)相(xiang)关性,我们很容易得(de)到天气(qi)(qi)炎(yan)热(re)酒(jiu)精(jing)性饮料(liao)销售(shou)量(liang)就会(hui)上升的(de)(de)(de)结论(甚至不用数(shu)(shu)据(ju)就可(ke)以得(de)到此结论),但是对于(yu)企(qi)业(ye)(ye)(ye)(ye)需要的(de)(de)(de)是帮助企(qi)业(ye)(ye)(ye)(ye)用数(shu)(shu)据(ju)去掌握、洞(dong)悉(Insight)、预(yu)测(ce)商业(ye)(ye)(ye)(ye)行(xing)为,而(er)不是为了大数(shu)(shu)据(ju)而(er)大数(shu)(shu)据(ju)。

本文主要研究(jiu)天(tian)气驱动的(de)销(xiao)售预测(ce),在(zai)酒精性饮料销(xiao)量(liang)和(he)羽(yu)绒服销(xiao)量(liang)两个领域,利(li)用(yong)天(tian)气进(jin)(jin)行预测(ce)均取得了十分优秀的(de)效(xiao)果。本文仍有(you)(you)(you)很多(duo)可以进(jin)(jin)一(yi)步(bu)研究(jiu)的(de)空间;目(mu)前,我(wo)们研究(jiu)的(de)时(shi)(shi)间周期都只有(you)(you)(you)三年,而很多(duo)特殊的(de)气象(xiang)现(xian)象(xiang),如(ru)厄尔尼诺(El Nino)、激烈天(tian)气等(deng),只有(you)(you)(you)在(zai)比较长的(de)时(shi)(shi)间下(xia)才能(neng)表现(xian)出来,我(wo)们会进(jin)(jin)一(yi)步(bu)收集更多(duo)的(de)数(shu)(shu)据改善(shan)我(wo)们已有(you)(you)(you)的(de)实践(jian)积(ji)累(lei)。在(zai)我(wo)们的(de)数(shu)(shu)据中,特别(bie)是酒精性饮料数(shu)(shu)据,有(you)(you)(you)很多(duo)异(yi)常的(de)情况无法用(yong)现(xian)有(you)(you)(you)的(de)数(shu)(shu)据解释,需要和(he)行业(ye)(ye)进(jin)(jin)行深入(ru)交流才能(neng)够进(jin)(jin)一(yi)步(bu)呈现(xian)出更好的(de)数(shu)(shu)据驱动业(ye)(ye)务效(xiao)果,好的(de)数(shu)(shu)据驱动业(ye)(ye)务一(yi)定是来自(zi)于(yu)深入(ru)行业(ye)(ye)了解行业(ye)(ye)的(de)努力(li)与积(ji)累(lei)。

参考文献

[1] 施瓦茨. 气(qi)候(hou)经济学(xue)[M]. 气(qi)象出版社, 2012.

[2] Byunglak Lee, Victor J. Tremblay. Advertising and the U.S. Market Demand for Beer.[J]. Applied Economics, 1992, 24(1):69-76.

[3] Rojas C, Peterson E B. Demand for differentiated products: Price and advertising evidence from the U.S. beer market [J]. International Journal of Industrial Organization, 2008, 26(1):288-307.

[4] Voleti S, Ghosh P. A non-parametric model of residual brand equity in hierarchical branding structures with application to US beer data[J]. Journal of the Royal Statistical Society, 2014, 177(1):135–152.

[5] Empen J, Hamilton S F. How Do SUPERMARKETS RESPOND TO BRAND-LEVEL DEMAND SHOCKS? EVIDENCE FROM THE GERMAN BEER MARKET[J]. American Journal of Agricultural Economics, 2013, 95(5):1223-1229.

[6] 刘(liu)一伶, 杜春(chun)生, 张(zhang)辉. 羽绒服销(xiao)量(liang)预测模型及其商业应用研究[J]. 现(xian)代经(jing)济信息(xi), 2012(19):175-176.

[7] Breiman L. Random Forests[J]. Machine Learning, 2001, 45(1):5–32.

[8] Fernández-Delgado M, Cernadas E, Barro S, et al. Do we need hundreds of classifiers to solve real world classification problems?[J]. Journal of Machine Learning Research, 2014, 15(1):3133-3181.

来源:统计之都

作者:罗应琏(北京维艾思气象信息科技有限公司),朱珊(中山大学华南统计科学研究中心) ,何顺(中山大学华南统计科学研究中心),周翔(中山大学华南统计科学研究中心),李昶(北京维艾思气象信息科技有限公司) ,王学钦(中山大学华南统计科学研究中心)

链接(jie):http://cos.name/2016/05/weather-driven-industry-sales-big-data/

热收缩包装机_热收缩机具备厂家直销价格优势的专业提供商-青岛麦格自动化设备有限公司 滦州市捷澳建材有限公司 玻璃隔断_办公室玻璃隔断墙—希格玛隔墙_好隔墙 淋浴房定制_抗菌淋浴房厂家_淋浴房加盟-精度卫浴 浙江阿斯克建材_保温隔热材料_新型保温材料_硅酸钙_珍珠岩 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人网 | 凯时真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人