Datawhale AI夏令营(AI+物质科学)之跑通baseline-Task2新手教程

@今天不熬夜 2024-08-13 16:31:03 阅读 72

前言

Datawhale AI的夏令营(线上的),这期夏令营是基于天池平台“第二届世界科学智能大赛 物质科学赛道:催化反应预测”开展的从零入门AI for Science。上篇文章完成Task1教程后,继续给大家干Task2的教程,话不多说,开整!

正文

第一步:

1.打开魔塔社区:

链接如下:魔搭社区汇聚各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。

icon-default.png?t=N7T8

https://www.modelscope.cn/my/mynotebook/preset

2.启动:

与Task1不同的是,这里我们选择方式二GPU环境启动 ,这个过程可能需要等待一段时间,如下图。

3.查看Notebook进入环境:

第二步(准备工作):

1.创建文件

点击如图所示位置,依次建立dataset,model,output名称的新文件夹,得到如图所示结果

2.准备必要文件

方法一:

将之前Task1里下载的两个数据集压缩包压缩出来(没看Task1教程的可参考我的Task1的教程,里面提供了数据集压缩包的下载方法,链接:http://t.csdnimg.cn/OLaRf),单独提取出.csv文件到桌面为后续使用做准备,在Datawhale AI夏令营官方教程里下载另外两个名为Task2_RNN.ipynb和vocab_full.txt的两个文件,共计四个文件备用。

方法二:

为更加方便大家做准备工作,我为大家准备好了这四个文件,大家下载后压缩到桌面即可完成四个文件的准备工作,链接:

链接: https://pan.baidu.com/s/1Iei80X-CbTVsdZs24mzKLA?pwd=1209 提取码: 1209

相应图示如下:

3.拖拽准备运行

将准备工作的四个文件vocab_full.txt文件拖拽到mp文件下,Task2_RNN.ipynb文件拖拽到建好的coda文件下,两个数据集.csv文件拖拽到dataset文件夹下,即完成拖拽工作。

相应图示如下:

第三步:

1.点击运行

打开Task2_RNN.ipynb点击右上运行按钮即可开始运行,不出意外这个过程会比较漫长,我是运行了一个多小时这样子。

相应图示如下

2.运行完成及下载

运行完成后,打开output文件夹,里面会有名为RNN_submit.txt文件即代表运行成功,右键下载此.txt文件用来后续提交,相应图示如下

第四步:

提交

1.打开官网

链接如下:

上海科学智能研究院

icon-default.png?t=N7T8

http://competition.sais.com.cn/competitionDetail/532233/mySubmissions

2.提交

点击提交结果选择刚刚下载的RNN_submit.txt进行提交。

相应图示如下

3.查看分数,大功告成

点击我的成绩,查看分数。

相应图示如下

你很棒哦,至此已经完成了Task2的任务了!

总结

大家的准备工作一定要做好,我上面重要操作也给出了颜色标注,还是要说一下两个数据集文件一定要是.csv文件。如果你还是遇到问题,就在评论区说出你遇到的问题,大家可以讨论一下,共同进步哦!后续也会更进相关教程,欢迎大家参考和给出意见。预祝大家都能成功!!!



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。