本文将深入探讨预测模型的核心原理、常见模型类型以及实际应用中的关键流程。
“到底怎么预测才准?”是数据领域终极难题。
在数据分析和商业决策中,预测模型是不可或缺的工具,但如何构建准确且实用的预测模型一直是数据领域的难题。
本文将深入探讨预测模型的核心原理、常见模型类型以及实际应用中的关键流程。
“到底怎么预测才准?”是数据领域终极难题。
太多文章,在介绍预测方法本身,而具体到实际中:
1、可以用的数据非常少。
2、预测出来领导不满意,让再改改。
3、实际情况差距大,领导还是不满意!
到底怎么办?!今天一篇文章讲清楚。
从本质上看,预测算法只有2大类:
自回归:用于趋势性递增、递减的数据。
带季节因素自回归:用于有周期性波动的数据。
基于时间序列的预测,最大优势在于:不需要很多数据(如下图)只需要一个指标(比如收入/用户数/订货数量)即可。
多分类问题:未来是ABC哪个情况,典型如决策树。
连续型问题:未来的数值是多少,典型如线性回归。
因果关系类模型,对于有投入产出的情况更管用,更能体现:“一分钱一分货”的关系。
不过现实中, 影响产出因素很多,往往很难收集到足够多数据,实操的预测误差可能比时间序列还大(如下图)。
这是两种基础思路,在实操中,还要解决更多问题。
现实中,缺少数据是头号问题,很多时候,领导就是扔给你一个excel表+几个数字,让你预测……巧妇难为无米之炊,很多时候,时间序列法是唯一选择,因为就一个指标+十几个数,没得选……
现实中第二大麻烦,是怎么衡量预测准确度。
比如预测销量是1000万:
业务做到900万,会说:预测得一点都不准,搞得货积压了
业务做到1100万,会说:预测得一点都不准,还是我厉害
总之,只要你不是100%精准,业务都有理由赖到你头上。
甚至可以反复横跳。
比如:“本来业务能达标的,看到预测说能达标,我们就省点投入,结果不达标了,都怪预测干扰了业务判断……”
因此,在实际工作中,不能孤零零只谈模型,要和业务动作结合起来,综合提升效果。
所有的互联网营销模式,从小米到天猫到拼多多,都在用业务手段,对抗预测的不足,比如:
场景1:“货物本身不耐储藏,多进货的话库存损失率会很高,但销售数量又很少,数据确实很多”——用团购,成团了才采购
场景2:“销售数据很少,少到无法计算价格弹性,业务方又想预测价格弹性,多赚钱”——用拍卖,少量用户竞价,获得更高价格
场景3:“新品是全新款,没有数据,咋预测?”——做新品预售/粉丝凭码购买,测试用户群体规模
场景4:“大促期间备货量难预测?拿捏不准用户有多少需求?”——让用户先付10元定金,定金膨胀3倍,提前锁定订单
凡是有业务手段可以用的,优先上业务手段,人家大厂都没能力100%精准预测,小厂就更别逞能了
在实际工作中,大部分业务场景不需要100%精确度,业务本身就有波动。
,业务怕的是突然暴增/暴跌的场景。
预测目标与其设定为:“100%精准”,不如设定为:“是否暴增/暴跌超过业务消化能力”。
预测100%精准基本无解,但是发现哪里可能暴涨/暴跌是很容易的。
通过基础分析,把不稳定因素区分出来,能大大缩减预测问题的难度(如下图)。
做好基础分析,拆分不稳定因素以后,也更方便挑选模型组合,解决问题(如下图)。
预测时间周期越长,自然偏差越打。
用滚动预测能很大程度弥补这个缺点。
通过日/周滚动预测,既能补充数据缺失,又能反映业务方临时调整带来的效果,一举两得(如下图)。
一个好问题+滚动预测,基本上能满足实际工作需求。
但作为做预测的人,得学会保护自己,避免业务方反复横条,瞎胡甩锅。
买定离手法是很好办法。
预测结果给出以后,买定离手,所有相关业务方不再质疑预测结果,而是基于预测结果做叠加。
谁觉得预测少了,谁自己写请示申请额外货物,并且留下书面证据。
到时候是预测得不准,还是业务自己申请多了所以卖不动,看得一清二楚(如下图)。
从本质上看,如果业务发展可控,自然没人需要赌命:
1、了解业务规律,把握常规走势
2、通过基础分析,找到波动来源
3、采取业务手段,规避波动风险
这样的组合拳,比盲目赌命管用的多。
本文由人人都是产品经理作者【接地气的陈老师】,微信公众号:【接地气的陈老师】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
这名外卖骑手名叫万灯辉,今年37岁,是湖北仙桃人。
他经营过火锅店,一年赚五六十万元,但由于盲目扩张原因,门店在几年后倒闭,他也背上百万债务。
万灯辉说,“除了送外卖,我找不到一个月拿3万左右的工作了。
” “2024年做到365天不休息,每天工作14到16个小时,总收入22.3万元”,对此,万灯辉澄清说,14到16个小时是“早出晚归”的时间,真正背单(跑单)时长不超12小时,因为平台有防疲劳机制,跑单最长只能12小时。
有人惊叹于他的毅力,也有人质疑数据造假。
随着平台官方数据的披露——注册714天、完成订单47393单、收入44.7万元、触发防疲劳强制下线240次——争议暂告段落,但留下的思考远未结束。
为生活“死磕 ”的样子令人动容 不知疲惫的“卷王”却要精准预防 像万灯辉这样不愿主动选择休息的骑手并非个例。
北京大学国家发展研究院副院长张丹丹曾在多个骑手微信群“潜水”,观察到类似现象:当骑手队长在群里说“明天有几个休息名额,愿意休假的可以报名”时,很少有骑手主动报名。
据新京报报道,万灯辉所在站点站长介绍,万灯辉是站点内极少数坚持超长时间跑单的骑手。
因为债务压力,他经常“不听劝”,坚持高强度跑单。
“每次见到他,我都劝他休息几天,站点、驿站都能休息,但他往往坚持跑单。
” 北大教授邱泽奇曾说,骑手一天干多少小时,本质上是劳动者的自主选择。
但这种选择,是在生存压力下的“被自愿”。
而这种超负荷运转,必然伴随着巨大的健康风险。
正是在这种背景下,平台从2024年底上线防疲劳”机制——“8小时提醒、12小时强制下线”。
万灯辉为了尽早还清债务不知疲倦的工作,这份执着,在不少网友看来,实属难能可贵,但他的故事也让我们看这样一种拉扯:一边是平台出于安全考量的“强制休息”,一边是骑手为了生存不得不“对抗算法”。
这一现实背后,折射出当前外卖行业防疲劳机制的隐忧:标准化的算法,遇上了非标准化的劳动者。
骑手万灯辉展示触发疲劳休息提醒的界面 要让外卖小哥适时“停一停”,防疲劳机制必须告别简单的“一刀切”,走向更精准、更有温度的“千人千面”。
现实中,有像万灯辉这样背负百万债务的“还债骑手”,也有刚入行的大学生兼职,还有年过半百的老骑手。
一个25岁的小伙和一个45岁的大叔,身体机能截然不同,却适用同一套“12小时强制下线”规则,这显然不够科学。
更令人痛心的是,近年来外卖骑手猝死、遭遇交通事故的新闻时有发生。
据光明网报道,2024年1月1日,59岁的外卖员宁先生送餐时猝死,手里还攥着要送的外卖。
另据财新网,数据显示,中国有外卖骑手超过千万人,2023年全国发生外卖骑手交通事故1.2万起。
有些悲剧发生在骑手为了冲单量而忽视身体报警的瞬间。
如果算法能引入健康管理维度,结合骑手的年龄、历史体检数据(在隐私保护前提下)、甚至心率手环等穿戴设备数据,对高龄或有心血管风险的骑手提前预警、降低阈值,或许能为生命多加一道保险。
要让骑手不必过度透支身体“卷时长”,还要改变订单“单价”与“难度”的不平衡。
需要注意的是,目前的防疲劳机制多以“连续跑单时长”为衡量标尺。
外卖骑手的工作具有极强的时段性,且个体差异巨大。
浙大研究员袁哲的建议切中要害:平台需要构建更科学、动态的疲劳治理机制,综合考量连续工作强度与实际作业负荷。
毕竟,骑手的“在线时长”并不等同于“工作时长”,其中有三成时间可能用于等单和休息。
正如中国劳动关系学院教授姜颖所言,如果骑手跑一单平地只需20分钟,跑一单老旧小区爬楼也要20分钟,但收入却差不多,骑手自然会倾向于多接单、快跑。
如果将单价与恶劣天气、高楼无电梯、大件重物等特殊场景等难度挂钩得更紧,触发动态溢价机制,是不是就能让骑手不再单一、持续地“卷时长”? 以骑手和平台为核心的即时配送体系已经是当今中国的基础设施,要维系这个系统的可持续运转,除了平台优化算法,社会层面也要进一步完善公共设施:在商圈、写字楼周边增设更多的“骑手驿站”,提供平价餐饮、热水和临时休息区,让骑手在等单间隙能真正放松,而不是只能在马路牙子上狼吞虎咽。
今天,万灯辉还在奔跑,他的目标是还清剩下的债务,他的这份“不摆烂、还清债”的担当与坚持值得肯定,甚至让人动容,但我们期待,他的还债之路,不必如此“拼命”。
期待各方“共治”,让算法不再是冰冷的计时器,而成为懂健康、知冷暖、明价值的智能助手。
毕竟,我们要的不仅是更快的送达速度,更是每一个骑手都能平安回家的夜晚。
来源:综合都市现场 编辑丨胡元媛 实习生 黄语轩 一审丨胡元媛 二审丨袁隽永 三审丨彭治国
然而,在我们身边,却真真切切存在着一个令人惊叹且充满谜团的人类现象——超高龄产妇。
当63岁的吉林松原母亲,颤抖着双手却满含深情地紧握新生女儿那柔软的小手;
当驻马店60岁产妇,在历经失独的至暗时刻后,终于迎来新生命带来的希望曙光——这些在过往认知里被断言“绝无可能”的生命奇迹,如今正以一种令人咋舌的频率,在现实的舞台上接连上演。
超高龄生育,这个曾经被医学的边界牢牢框定、看似遥不可及的领域,如今正借助辅助生殖技术的突破性进展,一点点冲破桎梏,将曾经的幻想变成了触手可及的现实。
01,女性最佳生育年龄 众所周知,女性生育是有周期的,超过一定年龄就绝经了,这个年龄一般是49岁左右(44-54),也就是很多人熟悉的更年期。
理论上,越过这个年龄,妇女是不能自然受孕的。
但是,很神奇的是,人类中屡屡出现超高龄产妇,之前就报道过一位67岁自然受孕的母亲,类似的记录似乎还不少。
。
。
内容是从抖音上一些官方新闻客户端截取的,应该是真实的 那么,这里就产生了一个违背现有科学认知的问题:超高龄妇女,她们体内如何出现活跃的卵细胞? 02,超高龄妇女为何还能自然受孕? 超高龄妇女,她们体内如何出现活跃的卵细胞?是因为她们本身卵细胞就比普通人寿命更长?还是因为她们体内某些干细胞被激活从而重新生成了卵细胞? 目前全世界这个领域的人都在猜测。
如果是前者,那么问题也就是nature级别。
当然,女性的个体差异这种问题的确存在,但是既然统计数据一般是44-54之间,所以,出现这种67的概率应该是小的很,因此,这种极端例子,值得重视。
但是后者的话,那是诺奖级别的,因为这意味着,衰老的人体内,他们的干细胞还是可以激活的,这是真正的人类生命之泉。
那么,这就意味着,可能未来我们真的可以通过激活人体的干细胞来解决很多事情,甚至很多现在棘手的疾病都不是问题了,毕竟干细胞,尤其是胚胎干细胞,那可是几乎万能的啊。
当然,到目前为止,仍未证明后者是对的。
之所以了解这个问题,是因为我一个朋友就在做这方面的研究,不过他们用的是小鼠,虽然也发现了一些有意思的现象,也发了如cell stem cell这种论文,但是还是缺乏足够的证据支持这些结论。
最后,发现大家都在关注老人该不该生的问题???是我的关注点不对么?