常见问题解答
关于数据采集和分析的一些问题
数据采集设备的兼容性是指三个方面的兼容性:打印机类型、打印机端口类型和打印指令类型。
打印机有多种类型,例如办公室常见的激光打印机和喷墨打印机。用于零售行业销售点的凭证打印机,绝大多数是热敏凭证打印机和点阵凭证打印机,也有个别使用宽幅点阵打印机甚至办公室用激光打印机或喷墨打印机的情况。
酷方支持绝大多数常用的销售点热敏打印机和点阵打印机,并支持宽幅点阵打印机,暂不支持办公室常见的激光打印机和喷墨打印机。
在酷方支持的打印机中,我们兼容几乎所有打印端口,包括:USB接口打印机、并口(高级并口)打印机、串口打印机和以太网口打印机。
打印机的打印指令纷繁复杂,在用协议总量超过40个。酷方支持用于销售点凭证打印机和宽幅点阵打印机常用打印协议10余个,并支持数十家打印机厂牌的扩展指令。
数据采集设备的稳定性,包括对原有设备的干扰程度,设备本身的稳定运行和被采集数据的完整性与安全性。
酷方采用硬件旁路监听方案,从原理上杜绝了对被监听设备的干扰及影响。即便酷方自身被断电,仍不会打断销售点的正常收银业务。
酷方采用工业级的成熟方案,支持7×24不间断工作。
酷方本身具有数据本地保存功能,可以保障在网络故障时,将采集数据缓存到本地,以防止丢失。
酷方包含可选的备用电池,当外部电源意外断开时,备用电池开始供电,保障数据的完整性。
硬件采集 | 软件采集 | |
---|---|---|
兼容性 | 常见接口打印机 | 在常见接口打印机的基础上,可以支持一体机 |
打印环境变更 | 需重新设置 | 需重新设置,但部分收银机会每日或定期初始化系统,则软件无法支持 |
跟打 | 支持 | 支持 |
安装便利性 | 不更改收银机任何设置 | 需要管理员权限进行安装,并需要更改收银机相关设置 |
网络 | 设备自带网络 | 需使用收银机自带网络,或外接网络设备 |
安全性 | 单向传输,不会对收银机有任何影响 | 有安全隐患,软件本身有被攻击可能;如果需要收银机连接公网才能传输数据,则收银机便暴露在公网环境中 |
稳定性 | 硬件本身有损坏概率 | 如不使用外接网络设备,则不存在硬件稳定性问题 |
计算消耗 | 对收银机无影响 | 利用收银机算力,需要一定的计算资源 |
第三方设备接入 | 实施简单,对收银机无影响 | 需占用收银机端口资源,并需做更多调试 |
成本 | 较高 | 较低 |
零售智能网关,是一种全功能的销售点边缘网关,它集成了传统的销售点凭证打印功能,并支持无线打印。
零售智能网关,配合我们的多种监听配件,可以采集销售点收银业务的完整数据,包括:凭证打印机、客显、金融手柄、键盘、扫码枪等几乎所有设备。
零售智能网关,本身是一台无线路由器,可以支持2.4G/5G的Wi-Fi接入。
零售智能网关,除了支持Wi-Fi接入外,还支持BLE无线接入和ZigBee无线接入,可以支持多种无线传感器,可广泛用于客流追踪、产品追踪等店级IOT应用。
通过选择专用的智能屏幕,或是无线接入移动设备,可以为消费者提供更多新的营销交互,或为店员移动跟随服务提供有效保障。
交易金额
交易额、营业额、交易流水、销售额
指定时间段内,所有实际完成交易获得的总金额
指定时间段内,报告对象所有单笔交易发生的金额的求和
客单价
平均单价
指定时间段内,单笔交易的平均金额
指定时间段内,报告对象每笔交易金额的加权平均值
交易笔数
销售笔数、水单数
指定时间段内,所有完成交易的次数
指定时间段内,报告对象所有单笔交易的次数之和
客流
客流量
指定时间段内,在某个场所停留过的总人数
指定时间段内,初始人数 + 进入人数
人效
单人销售额
指定时间段内,单个销售人员完成的销售额
指定时间段内,销售额 / 销售人员数量
坪效
单位面积销售额
指定时间段内,每平方米产生的销售额
指定时间段内,报告对象的交易额 / 店铺面积
商户数据覆盖率
–
指定时间段内,具有有效数据的商户数量占所有商户数据的百分比
指定时间段内,有效数据的商户数量 / 所有商户的数量
购买频次
–
指定时间段内,商品(SKU)在交易中出现的次数
指定时间段内,出现统计对象(通常是单一商品)的交易笔数之和
区域
做经营分析时的数据统计范围,通常以单一楼层做为一个区域
业态
商户的经营特色属性,以销售对象和销售产品特色来进行划分。常用的业态分类有餐饮,零售,生活服务,休闲娱乐,儿童亲子,超市
异动(商户)
指定时间段内,销售金额上升或下降变化幅度最大的商户
重点关注(商户)
指定时间段内,销售金额最高的商户
关联购买(商品)
在同一笔交易中完成购买的商品组合
热卖商品 / 活跃商品
指定时间段内,有过实际销售的商品
新品商品
在交易中首次出现购买的商品(SKU),新品自首次出现30天后即作为正常商品,不再算作新品
特卖商品
指定时间段内,有促销活动的商品
本报告体系中,同比分析的定义为历史同期数据分析,以年为单位,日报为去年同日,周报为去年同周,月报为去年同月。
偏离值处理 – 数据缺失
由于外力因素,数据可能产生缺失,为确保分析的延续性和可读性,需要针对数据进行推算还原,数据推算规则如下:
情景1:推算商户Store历史数据
1. 推算基本对象:商户
2. 推算基本报告时段:日报
3. 数据推算最大时间跨度:90天
4. 可推算指标:销售额,销售笔数
第一步:累计商户一个月的数据Data-Store-MonA,计算当月的数据平均值Ave. Data-Store作为基数。
第二步:以Mall的同一业态同一个月的数据Data-Cat-MonA,计算当月的数据平均值Ave. Data-Cat。
第三步:以所在Mall的同一业态当月的数据平均值Ave. Data-Cat为基数100%,推算Mall的同一业态过去3个月的数据变动指数Cat-Index_N(N取值为1到90)。
第四步:利用购物中心业态的数据变动指数Cat-Index_N,和商户基数Ave. Data-Store反推过去90天商户的各项销售数据。
当商户开业之日少于90天,数据推算到实际开业当天。
情景2:推算商户Store当期偶发缺失数据
1. 推算基本对象:商户
2. 推算基本报告时段:日报
3. 数据推算最大时间跨度:14天
5. 可推算指标:销售额,销售笔数
第一步:计算商户历史的日数据平均值。
第二步:利用商户历史的日数据平均值,作为当期数据。
日数据的平均值以每周同期进行计算,即周一的平均值为历史数据周一的平均值。
商户历史数据使用4周平均。
当历史数据少于4周,大于1周,可按照实际历史数据推算。
当历史数据少于1周,视同情景1,推算商户Store 历史数据处理。
本报告体系对待数据缺失,采用多值插补的方法来规划推算。多值插补的思想来源于贝叶斯估计,认为待插补的值是随机的,它的值来自于已观测到的值。具体实践上通常是估计出待插补的值,然后再加上不同的噪声,形成多组可选插补值。根据某种选择依据,选取最合适的插补值。
本报告体系中,环比分析的定义为相邻两个时段的数据进行分析,日报为前一日,周报为前一周,月报为前一月,年报为前一年。
偏离值处理 – 数据波动过大
由于日常经营活动中,商户的经营数据会产生比较大的变化。因此,本报告体系对数据波动设定阈值,当数据变动阈值超过预设时,即产生提醒,并对异常数据进行校正。
1. 数据校正对象:商户
2. 数据校正基本报告时段:日报
情景1:商户历史日交易笔数超过或等于15笔
当商户交易额超过过去4周同期平均值的200%时,系统将对商户数据自动进行排查。在排查过程中,相关数据将以过去4周同期平均值的200%,在报告中显示。 经过数据排查,商户数据将以实际值显示在系统中。
情景2:商户日交易笔数超过或等于8笔,少于15笔
当商户交易额超过过去4周同期平均值的300%时,系统将对商户数据自动进行排查。在排查过程中,相关数据将以过去4周同期平均值的300%,在报告中显示。 经过数据排查,商户数据将以实际值显示在系统中。
情景3:商户日交易笔数少于8笔
当商户交易额超过过去4周同期平均值的400%时,系统将对商户数据自动进行排查。在排查过程中,相关数据将以过去4周同期平均值的400%,在报告中显示。 经过数据排查,商户数据将以实际值显示在系统中。
对于任意ε>0,有:。当
时,如果总体为一般总体的时候,统计数据与平均值的离散程度可以由其标准差
反映,因此有:
。
本报告体系根据不同商户的业态类型和经营状况,计算分层标准差基数,用于检验商户销售额的偏离度。