2022年,我在某个城市做时间序列预测的项目,当时数据量挺大的,得有几百万条记录。那时候,我啊,也是一头雾水,看着那些密密麻麻的数字,我当时也懵,不知道从哪里下手。后来啊,我花了好几天时间,把数据清洗了,再然后,我尝试了好多模型,从简单的线性回归到复杂的深度学习,反正就是各种试,各种调参数。
我记得有一次,我调了一个参数,结果预测结果一下就变好了,当时我那个激动啊,心里想,这回算是有点眉目了。但是,我也偏激了点,觉得这个模型就无敌了。结果,我后来才反应过来,这只是一时的胜利,实际应用中,还有很多问题要解决,比如数据的实时更新、模型的解释性等等。
那个项目,我最后用了多少钱,我记不太清了,反正挺贵的。但是,通过这个项目,我学到了不少东西,也体会到了时间序列预测的复杂性。现在回想起来,那些日子,虽然累,但也挺有意思的。
预测未来5年房价,数据集涵盖2015-2020年,模型准确率85%。
这就是坑:预测房价过于复杂,依赖过多假设。
别信:过度依赖预测模型做决策。
别这么干:用预测结果指导决策前,多结合实际市场调研。
2023,某电商企业用深度学习模型预测销售量,准确率提升20%,但模型过拟合,这就是坑。