Datawhale AI 夏令营(NLP方向)2024 2期 笔记2

这里我们提到的神经网络,指的是人工神经网络(ArtificialNeuralNetworks,ANNs)。它是一种计算模型,这种模型能够学习和处理复杂的数据模式,通过模拟大脑神经元之间的连接和信号传递来实现...

【Datawhale AI 夏令营】基于术语词典干预的机器翻译挑战赛

目前神经机器翻译技术已经取得了很大的突破,但在特定领域或行业中,由于机器翻译难以保证术语的一致性,导致翻译效果还不够理想。对于术语名词、人名地名等机器翻译不准确的结果,可以通过术语词典进行纠正,避免了混淆或歧义,最...

Datawhale AI 夏令营——电力需求挑战赛——Task1学习笔记

很简单的流程,最关键的处理数据也只是单纯的筛选、分组、求平均、重置序号、合并。这一份baseline只是用来入门,明显可以优化,具体考虑增加数据处理的流程与准确性,参数的选取与加工等等。时间序列问题是指对按时间顺序...

Datawhale AI 夏令营-全球Deepfake攻防挑战赛-Task 2

ImageNet包含超过1400万张注释过的图像,这些图像分布在超过2.2万个类别中。它的规模之大使得它成为深度学习模型训练和评估的理想数据集。ImageNet数据集中的图像包含了各种场景、物体、背景和遮挡情况,...

Datawhale AI 夏令营之机器学习(二)——lightgbm 特征工程

机器学习模型的主要步骤为:探索性数据分析、数据预处理、提取特征、切分训练集与验证集、训练模型、预测结果。_lightgbm特征工程...

Datawhale AI 夏令营——Deepfake_task1

本次挑战是为了应对各种类型的Deepfake攻击,而设计的一个检测模型,task1的任务就是跑通预设模型。我将学习预设模型的代码,并附上对应理解。首先先设置三个类,前两个用于监控和报告训练过程中的指标的实用工具。后者...

Datawhale AI 夏令营——task01代码解析

用1-N进行标识,即1为数据集最近一天,其中1-10为测试集数据。数据集由字段id(房屋id)、dt(日标识)、type(房屋类型)、target(实际电力消耗)组成。本场以“电力需求预测”为赛题的数据算法挑战赛。...

Datawhale AI 夏令营——电力需求预测挑战赛

其中id为房屋id,dt为日标识,训练数据dt最小为11,不同id对应序列长度不同;type为房屋类型,通常而言不同类型的房屋整体消耗存在比较大的差异;target为实际电力消耗,也是我们的本次比赛的预测目标。下...

Datawhale AI 夏令营 task2笔记

结构基本上和编码器是一致的,在基于循环神经网络的翻译模型中,解码器只比编码器多了输出层,用于输出每个目标语言位置的单词生成概率,而在基于自注意力机制的翻译模型中,除了输出层,解码器还比编码器多一个编码­解码注意力子层,...

Datawhale 2024 年 AI 夏令营 基于术语翻译的机器学习入门知识