模型预测讲解(预测很好的模型怎么仿真)

新媒体兔Tik Tok待售:做运营的同学会不会也头疼预测这件事?作者分享了一些做预测的小技巧,期待和大家一起学习交流。

大家好,我是一个热爱学习的小熊女孩。

没错,我又加班了~众所周知,小熊女最害怕下班时被别人喊上一声“小熊女~ ~”。

所以,这一天我收拾行李补妆的时候,领导又在背后喊我。

这次接到的任务很简单,就两个字:预测。建立预测模型是一件非常复杂的事情。

领导淡淡地说:“做个预测,看看”。

不仅手术伙伴晕了,还挤掉了我的戏份。一定不能忍。

所以今天我们整理了快速预测的方法,只有用excel才能做到。大多数日常工作预测都基于几个连续的数据,例如:

今年一月到五月有销售。六月份的销售怎么样?

最近10周有新用户。第11周有多少?

我在过去的30天里取得了成就。今天的成绩如何?

这种预测有一个专业术语:时间序列预测。

朋友看到这个不要慌,即使只有几个数字,他们也可以建模。首先要做的是区分数据趋势。有三种常见的数据趋势:

趋势:持续发展的趋势。

平躺:几乎没有变化,一条直线。

类型:有规律的周期性波动。

直接看图,一眼就能认出哪个(如下图)?

举个简单的例子。一款互联网产品于2020年8月上线。每个月底的用户数量如下。

领导希望预测2021年6月的用户数量。我们做什么呢

一、观察形态

把数据做个折线图,说明是典型的趋势(增长趋势),所以用趋势预测的方法。

二、处理数据

制作一个新的折线图,并制作这个图的趋势线。

三、选择形状

选择合适的趋势线形状,并显示公式和r平方。

这一步是很多朋友最害怕的一步,因为他们不了解这些模型和参数。如果他们做错了什么呢?

不要害怕!这种对几个数字的短期预测本质上是不准确的。

特别是很多业务数据,比如用户数、销量等,都是和业务努力程度挂钩的,并不是数据能量所能预测的,请放心大胆去做。

这里只要掌握几个基本原则:

选择接近实际趋势的趋势线(不要实际上行,趋势线下行)。

r平方的值尽可能接近1(习惯上不小于0.6)。如上图所示,如果选择了多个项目,可以通过调整项目数量来增加趋势线的R平方,使趋势线更接近实际趋势形态(如下图所示)。

四、预测结果

将预测模型写入单元格并预测结果。公式出来后,做一些小的调整,直接复制就可以了。这里选择了多个项目,参数为2(如下图)。

这里简单解释一下公式,其中y为待预测的用户数据(因变量),x为自变量,即时间,x的平方为时间*时间,对应关系如下:

其实趋势线拟合的原理是假设数据随时间变化。所以,因变量是数据指标,自变量是时间,以及各种形式的时间,如时间的平方、对数和指标等。

五、预测未来情况

这里有10个数据,下个月要预测的第11个数据,时间是11,时间平方是121。通过代入公式(如下所示)可以计算出预测值。

就这样!多么简单。

努力的朋友,在尝试这种方法的时候,会发现很有可能几条趋势线预测的结果都接近1,那么这个时候该如何选择呢?

如果一定要纠结这个问题(我强烈建议大家不要纠结这个,因为我们不专业,让专门研究算法的小哥哥来纠结吧)。

可以计算均方差(MSE),并且将使用具有较小MSE值的任何方法(如下图所示)。

显然,两次拟合的MSE值较小,所以使用这一次。

到了,都搞定了。多么简单。

这种趋势拟合(也称为趋势外推)是解决趋势预测的一种非常快速的方法。

其优点包括:

所需数据少,可以预测几个数字。

它可以模拟曲线趋势,没有方向误差。

它是一个模型,充分满足了领导对模型的渴望,但它的缺点也很明显。

领导一句话就能打败它:“你说预测的134万用户是从什么渠道来的?”

可惜,我一点也说不出来。因为模型只是模拟曲线的趋势,无法解释趋势是怎么来的。

用数据分析的专业术语来说,叫做:业务可解释性差。这种较差的可解释性有时会导致严重的问题。

比如我朋友回看上图,虽然两次拟合的MSE值比较小,但是这个预测结果明显有问题:连续10个月都在涨,这个月却转跌了!

很可能导致一连串的领导问题:

为什么会掉下来?

是少了新意还是多了失落?

操作差还是产品体验差?

需要短期拉动还是长期拐点?

不幸的是,模型本身无法解释这一点。

所以焦明华的小伙伴会果断放弃二次拟合的结果,用线性拟合的结果。

因为这样更符合领导的期望(少被喷)。

如果领导一定要解释新的渠道是从哪里来的。我该怎么办?这时,可以用杜邦分析法拆解用户数量指标(如下图)。

拆解后,我们逐一去找负责相应渠道的同学,问:

亲爱的,六月份还会做这个A频道吗?

亲爱的,如果你做A频道,你会投多少票?

亲爱的,A频道的转换率曾经是x%。你要优化吗?

问了一堆问题后,把收集到的信息做一个总结,明确说明下个月为什么这么多人(如下图)。

这就是众所周知的商业预测模型,它更容易解释,可以清楚地解释:

增长从何而来?

为什么长这么大?

如果不达标,还能怎么办?

但这个缺点也很明显:

它没有人们无法理解的算法,所以看起来并不伟大。

需要运营的大量投入,运营不一定想说话。

即使手术想谈,也可能是拍脑袋,很有可能不准。所以,世界上没有“双向解”,只能根据情况做预测。

以上就是熊姐姐今天整理出来的知识点。还有两种:平躺型和季节性。火锅已经点好了。请下次再写。

作者:编码器熊,微信微信官方账号:编码器熊。

本文最初由@ Coder Bear发布,大家都是产品经理。未经允许禁止转载。

图来自Unsplash,基于CC0协议。

奖励作者,鼓励TA努力!欣赏



新媒兔新媒体交易平台目前有 抖音号出售抖音号转让抖音号购买快手号购买等新媒体账号服务市场,并在新媒体服务的基础上将会开拓更多的虚拟资产服务业务。新媒兔对用户的需求提供信息匹配、账号估值、数据鉴定、资金担保、合同担保、运营指导等专业的虚拟资产服务配套服务! 还有问题补充欢迎评论与新媒兔小编互动哦~