本文来自微信公众号 ”雷帅快与慢“,作者: thunderbang,纷传经授权发布。
想象你是一个小学校长,要给全体小学生的学习能力打分,或者说给所有人打上好学生、差学生的标签。你会怎么打?
拿出六年级的学生,因为他们考试考得多可靠度高,所有考试或者近期考试里面好成绩占比特别高的,定义为好学生,特别低的定义为差学生。然后用所有你能捞到的信息如家庭背景、兴趣爱好等,去训练一个分类模型,最后对所有一到六年级的学生进行预测。
你确定一定以及肯定不会这么做,这是舍本逐末,很荒唐。如果你把这个任务留给各班班主任,你会发现他们一定是采用了另一种做法。
六年级的人考过很多试,当然很好定义,根据历史成绩尤其是近期成绩直接打就行。一年级的人只考了几次试,那也要根据语文数学美术音乐体育品德等学科成绩去判断啊,这就是说服力最强的。低年级的置信度肯定没有那么高,但也比用喜欢吃什么东西、打不打球、回家看不看电视这些场外因素预测强。所有学生的打标就依靠学科成绩和体现出来的一些特性判断就是最有效的。
第一种做法,是模型思维。在这个场景里,你根本不会去倚重模型思维,你甚至觉得模型的思路很可笑。但是,换个场景,你没有在做这种可笑的事情吗?
第二种做法,是策略思维。你根据最重要的信息,把这个打分策略做出来了。
当你用模型思维去解决问题的时候,你有没有发现,你可以解决任何问题。你可以用你捞到的那些东西,去预测一个人是不是有钱、是不是gay、是不是有出轨潜力、是不是有暴力倾向、是不是很卷、是不是想跳槽、是不是黄赌毒、是不是喜欢说栓Q、会不会扶老奶奶过马路、挤牙膏是从中间挤还是两头挤、刷碗是顺时针还是逆时针……
我们是来解决问题的,解决问题没那么容易,一板斧走到黑怎么能行呢?你还得会二板斧三板斧……
当你用策略思维的时候,你会想各种办法去解决问题。例如,用一个问题替代原来的问题是一个解决难题的好策略。也就是说,如果你无法解决某个问题,就去解决另外一个简单点的问题好了,去找这个简单的问题吧。
还是用风控举例,信用风险当然可以直接预测,也可以拆解问题,低收入的人风险高,高负债的人风险高等等,于是解决这两个子问题可以对终极问题有所裨益。
上面给小学生学习能力打分的问题,你觉得模型思维很可笑。但实际上,收入、负债也是一样,去预测是很奇怪的,当然不是说一定不可以。
至于说为什么风险可以预测,收入和负债不能呢?我认为在一个以风险为评价目标的预测中,因为预测和真值永远是有误差的,收入负债预测存在一次误差,而收入负债和风险的关系并不是绝对的,也就是说传导到风险识别上这个误差是要叠乘的。预测结果必然可用性不高。
收入和负债模块更合适的做法是,去定义不要去预测。用你所有能获取到的相关数据,按可靠程度高低,想尽办法对齐,直接写case when。
一句话总结,上面说到的模型思维和策略思维的区别就在于如何定义这个y。模型思维是随便定义了一小部分样本的y,然后找X来预测;策略思维是想尽办法好不容易定义了这个尽可能覆盖全的y,然后没有然后。
前者容易还是后者容易,朋友们?不要自欺欺人,前者容易得多,多一个模型预测的环节根本不构成办法的难度。问问自己,是不是只会做前者,不会做后者?
做模型,我们都喜欢端到端的解决方案,因为端到端的解决方案是最简单的。但有时候它不起作用。
你根本就不知道你做出来的是什么东西。你说要测试,反正可以测嘛?你觉得总是有用的,但事实是随便做的都是无用的。好的策略应该是简单且合乎逻辑的,模型思维做出来的模型做不到这一点,你只能相信数据,只能去测试。然后测试回来没有用。
另一个问题是,端到端的解决办法总是要基于历史数据,如果你的历史做得很好还行,如果本来就不行,学习历史来发展未来有什么意义呢?
况且,历史数据往往是有条件的,去掉这个条件,你的模型很可能会出大问题。举个财富管理的例子,历史用户都是有100w+持仓的平台高粘性用户,现在想找更多高净值高潜客户,于是你完成了建模,去掉了历史持仓100w+的条件,找出来一批高评分的所谓“高潜”用户。这个评分在历史数据上表现好就一定是有效的吗?
如果你看见一个人在地铁里阅读《参考消息》,下面哪种情形与读报者更吻合?他有博士学位,他没有大学文凭。你可能会选有博士学位那个,但这样做不一定是明智的。你应该充分考虑第二种选项,因为地铁里没有大学文凭的人更多。
如果一个人被打标成诗歌爱好者,猜测她学的是中国古代文学还是工商管理,你也应该选择第二个答案。因为虽然学习中国古代文学的女学生更容易是诗歌爱好者,但几乎可以肯定有更多的工商管理专业且爱好诗歌的女学生。
“张三是位30岁的男性,硕士学历,已婚,但无子女。他在大厂工作,能力强、干劲足,很受同事欢迎。”这样的人在历史数据里表现出来转化率高,但抛开100w+的持仓,这样的人高净值的比例能低到吓人。
遇到问题不管三七二十一就做个模型的人,我认为是用战术上的勤奋来掩盖战略上的懒惰,这样做模型不仅没效果而且没价值。我有一个判断工作价值的办法,如果经验不重要,那工作就是没有价值的。
最后提醒一下。不要以为在土里插个温度计,就可以测量整个地球的温度了。