Datawhale-AI 夏令营 自然语言处理实战营 总结(Task01-Task02)

③构建词汇表,根据英文和中文数据的词汇内容,增加索引的内容,对于一些陌生的词汇,我们给予其“未知”的标签。缺点:通过代码实操发现,在翻译领域的BLEU评价指标基本得分很低,直接原因是翻译出来的语句较生硬,基本都是通过...

Datawhale AI 夏令营- 讯飞机器翻译挑战赛task2:baseline代码详解

这张图展示了经典的RNN架构,其中每个垂直矩形框都是时间步长t的隐藏层,每个这样的层都包含若干神经元,每个神经元对其输入执行线性矩阵运算,然后执行非线性运算(例如tanh())。语言模型需要计算特定序列中...

从零入门 AI for Science(AI+药物) #Datawhale AI 夏令营

从零入门AIforScience(AI+药物)#DatawhaleAI夏令营...

Datawhale AI 夏令营-Task1

DatawhaleAI夏令营-Task1...

2024 DataWhale AI 夏令营 DeepFake

采用CrossEntropyLoss损失函数和Adam优化器,并使用调度器动态调整学习率。CrossEntropyLoss损失函数常用于分类任务中,它能将预测的分类标签转换成概率,以对数的方式来预测错误程度。Lyy...

Datawhale AI 夏令营(NLP方向)2024 2期 笔记2

这里我们提到的神经网络,指的是人工神经网络(ArtificialNeuralNetworks,ANNs)。它是一种计算模型,这种模型能够学习和处理复杂的数据模式,通过模拟大脑神经元之间的连接和信号传递来实现...

【Datawhale AI 夏令营】基于术语词典干预的机器翻译挑战赛

目前神经机器翻译技术已经取得了很大的突破,但在特定领域或行业中,由于机器翻译难以保证术语的一致性,导致翻译效果还不够理想。对于术语名词、人名地名等机器翻译不准确的结果,可以通过术语词典进行纠正,避免了混淆或歧义,最...

Datawhale AI 夏令营——电力需求挑战赛——Task1学习笔记

很简单的流程,最关键的处理数据也只是单纯的筛选、分组、求平均、重置序号、合并。这一份baseline只是用来入门,明显可以优化,具体考虑增加数据处理的流程与准确性,参数的选取与加工等等。时间序列问题是指对按时间顺序...

Datawhale AI 夏令营-全球Deepfake攻防挑战赛-Task 2

ImageNet包含超过1400万张注释过的图像,这些图像分布在超过2.2万个类别中。它的规模之大使得它成为深度学习模型训练和评估的理想数据集。ImageNet数据集中的图像包含了各种场景、物体、背景和遮挡情况,...

Datawhale AI 夏令营之机器学习(二)——lightgbm 特征工程

机器学习模型的主要步骤为:探索性数据分析、数据预处理、提取特征、切分训练集与验证集、训练模型、预测结果。_lightgbm特征工程...