黑神话降临:揭秘AI数据如何助力游戏应用创新

海天瑞声AI 2024-10-03 15:01:02 阅读 64

《黑神话:悟空》一经上市便引爆了全球玩家的热情,其精良的制作直接将国产游戏水准带到了 Next Level。截至8月底,全平台销量已超过1000万套,数以万计的天命人重走西游,降妖缚怪。作为一款备受瞩目的国产游戏大作,《黑神话:悟空》的开发过程中涉及多种 AI 技术,包括角色行为、环境交互、游戏难度调整、视觉效果等。

01《黑神话:悟空》中的AI技术

《黑神话:悟空》在开发过程中,运用了多种先进的AI技术,从角色行为、环境交互、游戏难度调整到视觉效果和剧情互动,让悟空的代表角色 NPC 天命人拥有七十二变的能力。

AI生成对话与情节分支:LLM与机器学习模型

游戏利用大模型结合机器学习模型,生成更为动态和自然的对话系统。角色的反馈更加智能和个性化,增强了玩家与虚拟角色之间的互动性和沉浸感,提升了剧情的重玩价值。

AI配音:语音合成技术

AI技术在配音方面的应用日益广泛,利用语音合成技术生成个性化、情感化的配音效果,使得AI配音与真人配音几乎难以分辨,大大提升了游戏的沉浸感。

图片

全景光线追踪和DLSS 3

游戏采用了全景光线追踪技术和DLSS 3技术,提升了游戏的光照、反射和阴影效果,创造了更加逼真和震撼的视觉体验。这些技术不仅提高了图形渲染的质量,还增强了游戏的沉浸感。

场景构建

开发团队利用Stable Diffusion技术,通过简单的文本描述生成场景草图,极大地提高了场景设计的效率。这种基于深度学习的图像生成模型,使得复杂场景的构建变得更加便捷和高效。

角色创作

使用Midjourney这一创意AI工具,根据文本提示生成概念艺术和设计,帮助快速生成角色的初步形象,并进一步细化角色的外观和特征。

图片

AI驱动的行为模式

游戏中的敌人能够根据玩家的战斗风格做出智能反应,并动态调整攻击策略,增加了游戏的挑战性和重玩价值。

AI感知与动态环境

环境因素如天气和时间的变化能够影响游戏中的敌人行为,增加了游戏的动态性和真实感。

*图片来源:游戏官网&截图


02  训练模型可能涉及的数据

从技术层面来看,基于机器学习的各种能力,都离不开算法和数据的积累。在《黑神话:悟空》中应用的AI技术涉及到多种训练数据,具体取决于每项技术的应用领域。以下是可能涉及的训练数据:

所需的智能语音数据:

语音合成数据:大量高质量的真人语音样本,包括不同音色、语调和情感表达的录音,用于训练语音合成模型。

文本-语音对齐数据:带有精确文本标注的语音数据,用于语音合成模型的训练,使生成的语音能够自然地对应不同的文本内容。

中文多人语音合成数据集-角色扮演:该数据集由发音人模仿蜡笔小新、小猪佩奇等动画角色,以及模仿刘德华、杨幂等男女明星音色,并包含部分中英混语音内容。可广泛应用于游戏、数字人等领域,提升模型的情感表达及模仿能力。🔗 King-TTS-106 中文多人语音合成数据集

中文高质量小说语音合成数据集:包含200小时以上的音频内容,涵盖配角类音色和主角类音色,所有语料均为原创语料,能够围绕小说角色设定,以片段式单句的形式带来生动的听觉体验。覆盖了青年、中年、老年等不同年龄段,包括娇蛮小姐、仁厚阿伯、恶毒妇人、游手好闲的混混等多样化角色形象。同时包括中性、喜、怒、哀、惧、不屑、关切、严肃、内心独白等九种基本情绪,以及哭泣、结巴、笑、冷哼、叹气等副语言,还有疑惑、惊讶等语气。

所需的计算机视觉数据:

图像数据:高分辨率的场景图片、视频和3D渲染数据,这些数据用于训练DLSS模型,以通过深度学习将低分辨率图像提升至高分辨率。

图像-文本对齐数据:包含大量自然场景、建筑、环境等图像数据,结合对应的文本描述,用于训练生成模型,使其能够根据文本描述生成相应的场景图像。

4K长焦风景图像数据集:包含超25,000张图片,以建筑和植物为主题。 图像全尺寸无虚化,无论是前景还是背景,放大后都能保持其细节的清晰度。同时,确保同一主体的不同角度图像不超过5张,保证内容的多样性和独特性。采用相机最高质量模式拍摄,4K以上的分辨率确保图像的每个细节和丰富色彩。使用185mm至235mm的焦距,捕捉细节的同时保持了画面的深度和立体感。🔗 King-IM-101 长焦风景图像数据集

中国元素图文数据集:包含400,000张中国元素风格高清图片,覆盖中国美食、建筑、非物质文化遗产以及传统节日等多个领域。所有图片均保证短边分辨率不低于1024像素,同时附带50字左右简述标注版本。图片均由专业图商合规授权。

所需的自然语言数据:

大量的对话脚本、小说、剧本、历史资料、神话故事等,这些数据用于训练语言模型,以生成自然且富有情感的对话。

多情感文本数据集:包含平静、生气、高兴、难过、害怕等18种细粒度情感标签,总计超320,000句,8,700,000字。文本均按照设定的人物小传,符合人物特点的多情感数据。在客服、教育、娱乐等领域中,能够提升语言模型在情感识别和生成方面的能力,提供更加丰富和个性化的用户体验。



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。