给定多个房屋对应电力消耗历史N天的相关序列数据等信息,预测房屋对应电力的消耗。本赛题是一个典型的时间序列问题。时间序列问题是指对按时间顺序排列的数据点进行分析和预测的问题,往往用来做未来的趋势预测。...
将这些报错处理完后就可以跑通代码了,但是跑的速度很慢,我自己跑通一次用了四个小时,将N的值改小一些可以加快跑的速度,但是训练后的性能也会有所下降,如果出现不够1000行的错误,可以尝试将。使用的CUDA设备编号无效,...
API。_讯飞星火datawhale...
然后,使用这些拼接后的数据作为新特征,通过多次重复K折交叉验证(RepeatedKFold)来训练一个线性回归模型(这里使用的是Ridge回归器),每次验证都计算并记录了模型在验证集上的平均绝对误差(MAE)。)...
今天,我根据项目文档进行了代码的运行,对项目的运行逻辑以及关键参数的作用有了初步的了解。通过这次实践,我对序列到序列(Seq2Seq)模型和门控循环单元(GRU)模型有了基本的认识,并且掌握了数据处理的基本思路。在数...
本次笔记,我将分为选择模型、调参、特征工程三个部分来尝试。...
LightGBM是一个实现GBDT算法的框架,具有训练速度快、内存消耗低、准确率高、分布式支持等优点,主要通过Histogram算法、带深度限制的Leaf-wise叶子生长策略和直方图做差加速等技术进行优...
深度学习是机器学习一个分支,通过神经网络模拟人脑的学习方式,可以处理大量数据并且从中自动学习和提取特征,进行预测。深度学习就是将这些神经元模型层层堆叠起来的复杂结构,按一定的层次形成一个庞大的网络,从网络最底层接...
由于Task3是在Task2基础上做的改进,实操起来感觉比较简单,难度主要在于对Transformer的理解,以及在基础参数上自己尝试做出优化以抵达更高的上限。...
DatawhaleAI夏令营机器学习-Task2学习笔记...