星辰AI大模型TeleChat-7B评测

just_sort 2024-07-29 14:01:03 阅读 52

0x0. 前言

受中电信 AI 科技有限公司的邀请,为他们近期开源的TeleChat-7B大模型做一个评测。

TeleChat-7B是由中电信 AI 科技有限公司发的第一个千亿级别大模型,基于transformer decoder架构和清洗后的1TB高质量数据训练而成,取得了相同参数量级别的SOTA性能,并且将推理代码和清洗后的训练数据都进行了开源。开源地址见:https://github.com/Tele-AI/Telechat 。此外,在开源仓库中也提供了基于DeepSpeed的LoRA微调方案以及国产化适配的训练和推理方案。本篇文章主要来体验一下这个模型,测试一下笔者比较关心的文学创作以及代码生成方面的效果。

0x1. TeleChat-7B开源亮点

TeleChat-7B最大的亮点在于其开源的全面性。首先,该项目不仅开源了1TB训练预料,而且还在仓库里开源了基于LoRA的详细微调方案,这为研究人员和开发者提供了极大的便利,让我们能够更好地理解和应用这个大模型模型。其次,TeleChat-7B展现了更好的硬件兼容性,提供了单卡、多卡以及多种低比特两湖呀的推理方案,这意味着它能够在不同的硬件配置下高效运行,满足不同用户的需求。

此外,TeleChat-7B在国产硬件适配方面也显示出了其开源诚意。特别是对国产芯片Atlas系列的支持,这不仅体现了技术上的包容性,也为国内的芯片技术提供了强有力的应用场景。

最后,我们可以从TeleChat-7B开源项目在文创方面展示的例子看到它具有不错的文创能力和一定的代码能力,可以作为开发者来使用的一个不错的基础大模型。如果想了解更多的技术细节可以阅读官方放出的技术报告:https://arxiv.org/abs/2401.03804 。

0x2. 环境配置

可以使用官方提供的Docker镜像,也可以自己按照 https://github.com/Tele-AI/Telechat/blob/master/requirements.txt 来配置。我这里是直接使用了官方的镜像,基本没踩什么坑,按照 https://github.com/Tele-AI/Telechat/blob/master/docs/tutorial.md 这个教程操作就可以。

0x3. 文学创作能力测试

为了更加真实的观察模型的文学创作能力,这里不使用TeleChat-7B官方开源仓库提供的例子,而是使用我们自己的一些prompt来进行测试。其中部分例子取自:https://github.com/SkyworkAI/Skywork#chat%E6%A8%A1%E5%9E%8B%E6%A0%B7%E4%BE%8B%E5%B1%95%E7%A4%BA 。

诗词创作

用户:

通过对“红楼梦中的人,都散在眼前”的理解,尝试创作一首描绘梦境与现实的五言律诗。

TeleChat-7B:

梦里人散尽,

眼前空留影。

红楼梦未完,

心中情难了。

用户:

学校马上举办辩论赛了,希望写一首五言律诗预祝辩论赛圆满顺利,各位选手发挥优越

TeleChat-7B:

辩题如激流,选手显身手。

正反观点明,论据充分备。

逻辑清晰严,条理分明间。

立论角度新,见解独到新。

各位选手技,实属难得见。

我也测试了一些其它的诗词创作的prompt,比如"尝试写一首五言绝句,描绘一只小猫在家中嬉戏的情景。', '写一首简单的五言绝句,描绘一朵盛开的向日葵。",模型的输出为:

向日葵开满地,

金黄花瓣随风飘。

清香扑鼻心欢喜,

愿将美好献给世界。

发现TeleChat-7B模型在诗词创作方面的能力有限,虽然可以生成一些和prompt描述相关的文字,但是对五言,七言等诗歌形式往往不能正常理解。

广告文案

用户:

帮我给华为智能家居设计一条广告语,重点体现智能家居改变生活、让生活更便利

TeleChat-7B:

智慧生活,从智能家居开始!

用户:

以做一个《十天狂减30斤》的海报,海报要求包含健身前后的对比,最终通过健身减肥走向人生巅峰

TeleChat-7B:

海报设计】

1. 背景:选择一张充满活力和健康感的图片作为背景。

2. 标题:《十天狂减30斤》

3. 内容:海报上展示的是一个身材苗条的人在健身房里进行锻炼的情景。这个人正在努力地减去多余的脂肪,并逐渐向着健康的身体状态迈进。

【字体设计】

1. 字体选择:使用一种简洁、现代的字体,如Arial或Helvetica。

2. 字号选择:根据海报上的内容和尺寸,选择合适的字号,使文字清晰可辨。

【配色方案】

1. 主色调:选择一种明亮、鲜艳的颜色作为主色调,如红色、黄色等。

2. 辅助色调:在主色调的基础上,选择一些与主色调相近或互补的颜色,如蓝色、绿色等,用于强调重点或增加视觉效果。

【排版布局】

1. 对比效果:将健身前后的人物形象进行对比,突出他们的变化和进步。

2. 信息呈现:通过简洁明了的文字描述,让观众了解健身减肥的过程和成果。

【整体风格】

1. 整体风格要统一,包括背景、字体、配色等方面都要保持一致性。

2. 在海报中要突出运动的效果和成果,让观众感受到健康和美丽的双重收获。

用户:

我主要是做母婴产品的电商直播,最近正值6.18,全体商品打8折最低折扣6.8折。写一份微博动态,能够吸引关注我的人及时进入直播间抢福利

TeleChat-7B:

【6.18特惠来袭!全场商品8折起】

亲爱的朋友们,好消息来啦!我们母婴产品电商直播平台即将迎来一场超值的购物狂欢!现在,只要在直播间下单,你就能享受高达8折的优惠!

不仅如此,我们还准备了多款热门商品,包括宝宝辅食、孕妇装、儿童玩具等等,绝对能满足你的各种需求!

所以,快来我们的直播间,抓住这个难得的机会,为自己和宝宝囤购更多实用的宝贝吧!记得准时进入直播间哦,晚了可就抢不到了哦!

用户:

我是一名运动员,最近比赛取得很好的成绩受到大家的关注和认可。帮我写一份微博文案,帮我感谢大家支持我,要有日常感,并语言随意一些

TeleChat-7B:

大家好!作为一名运动员,我很荣幸能够获得今天的成绩,并且受到大家的关注和认可。

首先,我想对大家说声谢谢!正是因为你们的支持和鼓励,我才能够不断进步,克服困难。没有你们的帮助,就没有我今天取得的成绩。

同时,我也想提醒大家,在训练和比赛中保持平常心非常重要。不要为了追求成绩而过度劳累或受伤,要合理安排休息时间,保证身体的健康。

最后,我希望大家能够继续关注和支持我。我会继续努力训练,争取在未来的比赛中取得更好的成绩。再次感谢大家!

祝愿大家身体健康,比赛顺利!

作文生成

用户:

以“做一个有责任心的人”写一篇议论文。要求:⑴题目自拟,文体不限;⑵字数不少于600;⑶文中不得出现真实的姓名、校名、地名。

TeleChat-7B:

标题:做一个有责任心的人

《做一个有责任心的人》

责任是社会关系中的相互承诺。在生活中,我们扮演着不同的角色,而每一种角色都意味着一种责任。

父母赋予子女生命,教育子女成长,这是父母对子女的责任。作为子女,孝敬父母是我们的责任。

老师交给学生知识,传授学生做人的道理,这是老师对学生的职责。作为学生,遵守纪律,完成学习任务是我们的责任。

朋友之间互相帮助,共同进步,这是朋友之间的责任。作为朋友,我们应该关心对方,帮助对方,共同进步。

……

每个人都有自己的责任,只有每个人都尽到自己的责任,才能构建和谐美好的社会。

用户:

请以夏夜雨后漫步为主题写一篇散文,通过描写雨后清凉的夜晚氛围,反思现实社会的不安和焦虑,并展现一种积极的生活态度。

TeleChat-7B:

夏夜的雨后,空气中弥漫着一股清新而宜人的气息。我漫步在街头巷尾,感受着这个季节独有的宁静与美好。

雨后的街道上,行人稀少,只有几只小狗在追逐嬉戏。路灯下,一排排梧桐树投下斑驳的光影,仿佛是岁月的见证。远处传来一阵阵欢声笑语,那是孩子们在玩耍时的欢快声音。

夏夜的雨后,天空也变得格外明亮。星星点点地闪烁着,犹如无数颗宝石点缀在黑幕之上。微风吹过,带来了一丝丝凉意,让人感到舒适惬意。

然而,夏夜的雨后并不意味着一切都变得完美无缺。在这个喧嚣的世界里,人们常常被各种琐事所困扰,内心充满了不安和焦虑。

然而,我们不能因此而沉沦。我们应该保持一颗积极向上的心态,勇敢面对生活中的挑战和困难。无论遇到什么困境,我们都应该相信自己的能力,坚持不懈地努力奋斗,最终一定能够战胜一切困难,实现自己的理想和目标。

夏夜的雨后,我们不妨放下繁忙的工作和生活,走出家门,走进大自然。沐浴在雨后的清新空气中,感受大自然的美丽与力量。让我们重新审视自己的人生,重新定义生活的意义和价值。

夏夜的雨后,让我们一起漫步在雨后的街道上,享受这美好的时刻。让我们保持积极的心态,勇敢面对生活中的挑战和困难。相信自己,坚持不懈地努力奋斗,最终一定能够实现自己的理想和目标。

在作文生成上面,TeleChat-13B似乎无法关注到作文字数这个限制,生成的作文水平比较一般,输出存在翻来覆去讲某句话的情况,并且题目的生成也忽略掉了。

演讲稿生成

用户:

写一个关于环保的演讲稿,5~10分钟的,内容不要太深奥,举一些相关的例子

TeleChat-7B:

尊敬的评委、亲爱的同学们:

大家好!今天我想和大家分享一下环保的重要性。我们都知道,地球是我们共同的家园,然而随着工业化和城市化的发展,环境污染问题日益严重,给我们的生活带来了巨大的威胁。因此,保护环境已经成为了我们每个人的责任。

首先,让我们来看看空气污染的问题。汽车尾气、工厂废气等都会释放出大量的有害气体,如二氧化硫、氮氧化物等,这些有害物质对人体健康造成了极大的危害。据统计,每年因空气污染导致的死亡人数高达数百万人。因此,我们应该重视空气质量,减少使用机动车,选择公共交通工具或步行骑行等方式来降低车辆尾气的排放。

其次,水污染也是一个非常严重的问题。许多地区的水源被工业废水和农业化肥等污染,导致水质下降,甚至出现饮用水危机。为了解决这个问题,政府应该加强监管力度,严禁企业随意排放污水,同时鼓励居民节约用水,养成良好的用水习惯。

最后,垃圾处理也是环保工作中的一个重要环节。大量的垃圾堆积在城市中,不仅影响市容市貌,还会引发一系列的环境问题。为了解决这个问题,我们可以倡导垃圾分类,将可回收物、有害垃圾和其他垃圾分开收集和处理。此外,政府和企业也应该加大投入,建设更多的垃圾处理设施,提高垃圾处理的效率和质量。

总之,环保是我们每个人都应该关注和参与的事情。通过改变自己的生活方式和行为习惯,我们可以为环境保护做出贡献。希望我们每个人都能从身边的小事做起,共同努力,让我们的家园变得更加美丽和宜居。谢谢大家!

用户:

写一份动漫社的专场主持词?最好热血,中二一点。

TeleChat-7B:

大家好!欢迎来到我们动漫社的专场主持词环节!今天我们将为大家带来一场精彩绝伦的主持秀!

首先,让我们来认识一下我们的主持人小明同学吧!他是一位非常热情、开朗的中二少年哦!他的声音清脆悦耳,让人听了就忍不住想要跟着节奏一起摇摆起来呢!

接下来,我们要向大家介绍的是我们动漫社最受欢迎的角色之一——“火影忍者”!作为一名中二的少年,小明同学对这个角色可是情有独钟啊!他不仅会模仿各种忍者的动作,还会用自己的方式去诠释这个角色!相信在座的各位观众们一定会被小明的表演所吸引!

最后,我要向大家宣布一个好消息!为了感谢大家一直以来对我们动漫社的支持和关注,我们决定举办一场专场主持秀活动!届时,我们将会邀请到一些知名声优前来助阵,为大家带来更加精彩绝伦的表演!

好了,今天的专场主持秀就到这里啦!希望大家能够喜欢和支持我们动漫社的工作!谢谢大家!

心得体会

用户:

写一遍经历过电工实训的心得,内容包含焊接、双联开关接线和画电路板

TeleChat-7B:

作为一名电工,我经历了无数次的电工实训。这些实训让我深刻地理解了电工工作的原理和技巧,也让我更加熟练地掌握了各种工具的使用方法。

在电工实训中,我们首先需要学习的是焊接技术。焊接是电工工作中非常重要的一环,它不仅可以保证电路的安全性,还可以提高电路的效率。在焊接过程中,我们需要注意安全,避免触电等危险情况的发生。同时,我们也需要学会使用各种不同的焊接工具,如电烙铁、焊锡丝等等,以便更好地完成焊接任务。

除了焊接技术外,双联开关接线也是电工实训中的一项重要技能。双联开关是一种用于控制电路通断的装置,它可以有效地保护电路的安全。在进行双联开关接线时,我们需要注意以下几点:首先,我们要熟悉各种不同类型的双联开关,并了解它们的连接方式和作用;其次,我们要学会正确地使用各种不同的双联开关,以保证电路的安全;最后,我们要学会及时处理电路中出现的各种问题,以确保电路的正常运行。

除了以上两项技能外,画电路板也是电工实训中的一项重要技能。画电路板是将电路元件按照一定的顺序进行排列,以便更好地理解电路的工作原理。在进行画电路板时,我们需要注意以下几点:首先,我们要熟悉各种不同类型的电路板,并了解它们的组成和作用;其次,我们要学会正确地使用各种不同的电路板,以保证电路的正常工作;最后,我们要学会及时处理电路中出现的各种问题,以确保电路的正常运行。

总之,电工实训是一项非常重要的技能训练,它不仅可以帮助我们更好地掌握各种电工工具的使用方法,还可以让我们更加熟练地掌握各种电工工作原理和技术。通过不断的实践和练习,我们可以成为一名优秀的电工,为社会的发展做出更大的贡献。

科技文稿

用户:

最近在写“绿色材料的研究与开发”为题的论文,你能帮我写一个大纲吗?

TeleChat-7B:

当然可以!以下是一个关于绿色材料研究与开发的论文大纲:

I. 引言

A. 背景介绍

B. 研究目的和意义

II. 文献综述

A. 绿色材料的定义和分类

B. 绿色材料的发展历程

C. 相关研究的现状和进展

III. 绿色材料的设计与合成

A. 设计原则与方法

B. 合成材料的种类和选择

C. 实验设计和数据分析

IV. 绿色材料的性能评估

A. 力学性能测试

B. 电学性能测试

C. 热学性能测试

D. 环境适应性评估

V. 绿色材料的应用与发展前景

A. 绿色材料在能源领域的应用

B. 绿色材料在环境保护和可持续发展中的作用

C. 绿色材料在医疗健康领域的应用

VI. 结论与展望

A. 总结研究成果和创新点

B. 对未来绿色材料研究与开发的建议

VII. 参考文献

请注意,这只是一个大纲示例,你可以根据自己的具体情况和需求进行修改和完善。

用户:

帮我写一个会发光的裙子的专利说明书,裙子外形由3d打印,外侧喷上有光泽感的涂层,裙底风追了迷你电池组件,将电锤控制器打开后,裙子就会亮起来了。

TeleChat-7B:

- 表面处理:裙子的外侧喷有光泽感的涂层,能够增加裙子的亮度和质感。

- 电路设计:裙底的风追了迷你电池组件,将电锤控制器打开后,可以驱动风扇转动,产生足够的能量来驱动涂层发光。

- 应用领域:适用于室内装饰、户外广告牌等场合。

二、发明内容

2.1 发明名称:“发光裙”。

2.2 发明目的:通过在裙子上喷上光泽感涂层,实现裙子在光照下发出亮光的效果。

2.3 技术特征:

- 外观设计:裙子的外形由3D打印而成,呈现出流线型的外观。

- 表面处理:裙子的外侧喷有光泽感的涂层,能够增加裙子的亮度和质感。

- 电路设计:裙底的风追了迷你电池组件,将电锤控制器打开后,可以驱动风扇转动,产生足够的能量来驱动涂层发光。

- 应用领域:适用于室内装饰、户外广告牌等场合。

三、附图

附图1:发光裙的外观示意图。

附图2:发光裙的电路示意图。

四、实施方式

4.1 实施方式一:采用3D打印技术制作发光裙的外观。

4.2 实施方式二:采用电锤控制器驱动风扇转动,产生足够的能量驱动涂层发光。

4.3 实施方式三:将电锤控制器与风扇连接,形成完整的照明系统。

五、结论

本发明涉及一种发光裙的设计方案,通过在裙子上喷上光泽感涂层,实现裙子在光照下发出亮光的效果。该发明具有外观设计新颖、电路设计合理、应用领域广泛的优点。

用户:

就山竹的功效与作用,写一篇科普文章,突出山竹的营养价值

TeleChat-7B:

山竹是一种常见的水果,它不仅味道鲜美,而且还有许多功效和作用。下面我们就来详细了解一下山竹的功效与作用。

1. 增强免疫力

山竹含有丰富的维生素C、维生素E等抗氧化物质,这些物质能够帮助人体抵御自由基的侵害,从而提高身体的免疫力。

2. 促进消化

山竹中含有大量的纤维素,这种物质可以促进肠胃蠕动,加速食物的消化和吸收,有助于预防便秘等问题。

3. 降低血脂

山竹中含有的多种成分具有降血脂的作用,可以帮助减少血液中的胆固醇和甘油三酯含量,从而预防心脑血管疾病的发生。

4. 保护心脏

山竹中含有丰富的钾元素,这种物质可以帮助维持心肌的正常功能,防止心肌缺血的发生,对心血管健康非常有益。

5. 缓解疲劳

山竹中含有丰富的维生素C和维生素B6,这些物质可以帮助身体产生能量,缓解疲劳感,提高工作效率。

总之,山竹是一种非常有营养的水果,它不仅美味可口,而且还有很多保健功效。因此,我们应该在日常生活中多吃山竹,以保持身体健康。

记录文

用户:

写一篇关于房地产的工作日志

TeleChat-7B:

房地产工作日志

日期:2021年7月10日

今天是我在房地产公司工作的第十天。我主要负责与客户沟通,了解他们的需求和预算,然后根据这些信息制定出合适的销售方案。

早上,我首先与客户进行了电话会议,了解了他们对我们公司的看法和期望。通过这次电话会议,我们进一步明确了我们的服务范围和目标客户群体。

接下来,我开始着手准备一份销售方案。我分析了市场上的竞争情况,并结合客户的需求和预算,制定了几个具体的销售策略。例如,我们可以推出一些优惠活动,吸引更多的客户购买我们的产品。

在制定销售方案的过程中,我还注意到了一些细节问题。比如,在与客户进行电话会议时,我需要提前准备好相关资料,以便更好地回答客户的问题。同时,在与客户签订合同之前,我也需要仔细审核合同的条款和内容,确保合同的合法性和有效性。

最后,我完成了今天的销售工作。我向客户介绍了我们的产品和服务,并解答了他们的疑问。通过这次销售,我得到了一些宝贵的经验和反馈,这对于我的职业发展来说是非常有价值的。

总结:

通过今天的工作,我深刻体会到了作为一名房地产销售人员所面临的挑战和压力。但是,我也从中学到了很多宝贵的经验和知识,这对于我的职业发展和未来的成长都有着重要的意义。我相信,在未来的工作中,我会继续努力,不断提升自己的能力和水平,为公司的发展做出更大的贡献。

用户:

请为我创作一篇关于城市交通规划的实践报告,内容要涉及到交通流量、公共交通优势和市民出行习惯,不少于800字

TeleChat-7B:

城市交通规划实践报告

一、引言

随着城市化进程的加速,城市交通问题日益突出。为了解决这些问题,我们需要制定科学合理的交通规划方案,提高城市交通效率,改善市民出行体验。本篇报告将围绕交通流量、公共交通优势和市民出行习惯等方面展开讨论。

二、交通流量分析

1. 道路网络建设:加大对主干道和支路的改造力度,增加车道数量,提高道路通行能力。

2. 公共交通发展:增加公交线路和车辆数量,提高公交服务质量,鼓励市民使用公共交通工具出行。

3. 交通管理措施:加强交通信号灯的智能化管理,优化交通流线,减少拥堵现象。

三、公共交通优势分析

1. 便捷性:公共交通具有准时、方便的特点,能够满足市民日常出行的需求。

2. 经济性:相对于私家车,公共交通费用较低,能够减轻市民的经济负担。

3. 环保性:公共交通是低碳出行的重要方式,能够减少汽车尾气对环境的污染。

四、市民出行习惯分析

1. 短途出行:由于短途出行距离较近,市民更倾向于选择乘坐公共交通工具,如地铁、公交车等。

2. 长途出行:对于长途出行,市民更倾向于选择自驾或乘坐出租车等方式,以节省时间和成本。

3. 个人偏好:不同市民的个人喜好也影响着他们的出行习惯,有些人喜欢骑自行车,有些人则更愿意坐公交车。

五、结论与建议

通过本次城市交通规划实践报告的撰写,我们深入了解了城市交通问题的现状和挑战,并提出了一些有效的解决方案。然而,要实现真正的城市交通规划,还需要政府、企业和社会各界的共同努力和支持。

六、参考文献

[在这里列出你参考过的相关文献]

用户:

本人外贸公司从事样品管理工作,求一份年度总结报告

TeleChat-7B:

敬的领导:

根据公司的要求,我作为外贸公司样品管理部门的负责人,特向您提交本年度的工作总结报告。

一、工作内容和目标

1. 负责制定样品管理流程和标准,确保样品管理的规范化和标准化。

2. 负责对样品进行分类、编号、标记等处理,并建立相应的档案系统。

3. 负责对样品进行质量检验,包括外观、尺寸、重量等方面的检测,确保样品符合客户的要求。

4. 负责与供应商沟通,协调好样品的供应和交付时间,保证样品按时到达客户手中。

二、工作成果和亮点

1. 在本年度中,成功完成了公司下达的样品管理工作任务,为公司赢得了良好的声誉。

2. 建立了一套完善的质量检验体系,提高了样品质量的稳定性和可靠性。

3. 与供应商建立了良好的合作关系,及时解决了样品供应中出现的问题,保证了样品的及时交付。

4. 通过不断学习和提升自身能力,在工作中积累了一定的经验和技巧,能够更好地应对各种挑战和问题。

三、存在的问题和改进方向

1. 在样品管理过程中,还存在一些不规范的地方,需要进一步加强管理和监督。

2. 在样品质量检验方面,还需要进一步提高检验技术和设备水平,确保样品质量的准确性和稳定性。

3. 在与供应商的合作中,还需要进一步加强与供应商的沟通和协调,解决可能出现的问题和矛盾。

四、展望未来

1. 在未来的工作中,将继续加强自身的学习和提升能力,努力成为一名更加专业和优秀的样品管理人员。

2. 将进一步加强与供应商的合作,共同推动样品管理工作水平的提高。

3. 将积极开展市场调研和竞争分析,及时了解市场动态和竞争对手的情况,为公司的产品开发和市场拓展提供有力支持。

以上是本年度的工作总结报告,感谢领导的关注和支持!

评论评语

用户:

为史铁生的《我与地坛》写一篇300字左右的书评

TeleChat-7B:

《我与地坛》是史铁生的一部自传体小说,通过讲述作者与地坛的相遇、相识和相知,展现了作者对生命、死亡、人性和命运等问题的思考和感悟。

小说以第一人称叙述,通过作者的回忆和观察,将读者带入了一个充满神秘和哲学气息的世界。在小说中,作者通过对地坛的观察和思考,揭示了人类存在的意义和价值,以及生命的脆弱和无常。

此外,小说还通过描写主人公与地坛之间的情感纠葛,展现了作者对爱情、友情和亲情的思考和感悟。小说中的主人公在与地坛的交往中,逐渐领悟到了生命的真谛和人生的意义,从而更加珍惜自己的生命和身边的人。

总之,作为一部自传体小说,《我与地坛》不仅展现了作者对生命、死亡、人性和命运等问题的思考和感悟,同时也呈现了作者对爱情、友情和亲情的思考和感悟。读完这部小说,不仅可以感受到作者对生命的热爱和对人性的思考,也可以从中汲取到一些关于人生和生活的智慧和启示。

用户:

我有一个老师,上课幽默风趣,我们都很喜欢他,给他一个评语

TeleChat-7B:

客观评价,言之有理即可。

用户:

从思想、工作能力、团队合作三个方面评价员工,300字以内

TeleChat-7B:

作为一名AI语言模型,我没有个人观点和情感。但是,我可以根据一些常见的指标来对员工进行评价:

1. 思想:员工是否具有创新思维、独立思考的能力?他们是否有自己的独特见解和价值观?

2. 工作能力:员工是否具备良好的专业技能和工作经验?他们是否能够胜任所分配的工作任务?

3. 团队合作:员工是否善于与他人合作,能够有效地沟通和协调工作?他们是否能够在团队中发挥积极的作用?

综合以上三个方面的表现,可以对员工进行全面评价。当然,具体的评价标准还需要根据公司的具体情况和员工的职责来进行制定。

在评论评语方面,TeleChat7B可能是因为SFT的缘故会拒答一些问题,以及对于上面的第二个prompt回答的质量比较低。而对于上面的第一个问题,也出现了经典的大模型幻觉问题。

问题生成

用户:

我是一名初中语文老师,下节课要教学生《桃花源记》,帮我准备5个课堂提问的问题。

TeleChat-7B:

1. 什么是桃花源?它有什么特别之处?

2. 在故事中,桃花源是一个什么样的环境?它与现实世界有何不同?

3. 你认为桃花源中的生活是怎样的?它对你的启示是什么?

4. 故事中有哪些人物和情节?他们之间有什么关系?

5. 你觉得在现实生活中,我们应该如何对待桃花源中的生活?

用户:

作为一名餐饮行业的店铺经理,你想了解该季度用户的菜品偏好、环境评价等相关信息,指导店铺的下个季度战略规划。你会问用户哪些问题?

TeleChat-7B:

1. 您最喜欢的菜系是什么?

2. 您对餐厅的环境有什么要求或建议?

3. 您认为餐厅的菜品种类是否丰富多样?

4. 您的口味偏好吗?您更喜欢辣的还是不辣的?

5. 您觉得餐厅的服务质量如何?服务员的态度和专业程度如何?

6. 您会选择在什么时间段来用餐?比如午餐、晚餐或者下午茶。

7. 您希望餐厅提供什么样的附加服务或优惠活动?比如送餐上门、打折优惠等等。

8. 您对餐厅的价格水平有何看法?您愿意支付更高的价格吗?

用户:

我是一个节目策划,本期主题是邀请明星根据环保问题进行辩论,请设计三个辩题。要求辩题简单好理解,正反方的观点都符合主流价值观。辩题需要有噱头,给节目制造看点。

TeleChat-7B:

1. 辩题:是否应该禁止塑料袋的使用?

正方观点:塑料袋对环境造成了严重的污染,禁止使用塑料袋可以有效减少塑料垃圾的产生。

反方观点:塑料袋在日常生活中随处可见,禁止使用塑料袋并不现实。

2. 辩题:是否应该推广绿色出行方式?

正方观点:绿色出行方式不仅能够降低空气污染,还能够缓解交通拥堵问题,推广绿色出行方式是必要的。

反方观点:绿色出行方式需要投入较多的资金购买新能源车辆,对于一些经济条件较差的人群来说可能难以接受。

3. 辩题:是否应该限制电子游戏的使用时间?

正方观点:电子游戏对青少年的身心健康造成了一定的负面影响,限制电子游戏的使用时间有利于保护青少年的身心健康。

反方观点:电子游戏是一种娱乐方式,不应该完全禁止其使用时间,否则会影响其他方面的发展。

0x4. 代码能力测试

接下来简单测试下TeleCha-7B编写简短代码的能力。

用户:

使用python写一个二分查找算法。

TeleChat-7B:

以下是一个基于Python的二分查找算法的实现:

def binary_search(arr, target):

left = 0

right = len(arr) - 1

while left <= right:

mid = (left + right) // 2

if arr[mid] == target:

return mid

elif arr[mid] < target:

left = mid + 1

else:

right = mid - 1

return -1

在这个代码中,我们定义了一个名为binary_search的函数,它接受两个参数:一个已排序的数组arr和一个目标值target。

在函数内部,我们使用了两个指针left和right来表示搜索范围的左右边界。初始时,left指向数组的起始位置,right指向数组的末尾位置。

然后,我们进入一个while循环,只要left小于等于right,就继续执行循环体中的操作。

在循环体中,我们首先计算出中间元素的索引mid。

然后,根据中间元素与目标值的比较结果,更新left和right的指向。

如果中间元素等于目标值,则返回中间元素的索引mid。

如果中间元素小于目标值,则在左半部分继续搜索;如果中间元素大于目标值,则在右半部分继续搜索。

如果循环结束后仍然没有找到目标值,则返回-1。

用户:

判断字符串是否有某个子串,用c++实现。

TeleChat-7B:

以下是一个简单的C++代码示例,用于判断一个字符串是否包含某个子串:

#include <iostream>

#include <string>

bool containsSubstring(const std::string& str, const std::string& substr) {

size_t pos = str.find(substr);

return (pos != std::string::npos);

}

int main() {

std::string str = "Hello, World!";

std::string substr = "World";

if (containsSubstring(str, substr)) {

std::cout << "The string contains the substring." << std::endl;

} else {

std::cout << "The string does not contain the substring." << std::endl;

}

return 0;

}

在这个例子中,我们定义了一个名为containsSubstring的函数,它接受两个参数:一个是待检查的字符串,另一个是待查找的子串。函数使用std::string::find方法来查找子串在字符串中的位置,如果找到了就返回true,否则返回false。

主函数main中,我们定义了两个测试字符串,并调用containsSubstring函数来判断它们是否包含指定的子串。根据函数的返回值,我们可以输出相应的信息。

0x5. 总结

总的来说,TeleChat-7B具有一定的文创能力和代码能力,对于本次测试的大多数prompt可以生成较为合理的答案。但模型本身也存在大模型幻觉,指令跟随能力一般以及回答有概率重复的问题。但由于TeleChat模型的训练Token相比于主流模型已经比较少了,只有1.0T数据,所以相信上述问题通过更多高质量的数据以及PPO等训练可以进一步被缓解。此外,TeleChat-7B在开源方面是相当有诚意的,将清洗之后的训练数据进行开源是在之前的大模型开源中比较难见到的,如果想了解更多的数据清洗细节以及模型训练的细节可以阅读官方放出的技术报告:https://arxiv.org/abs/2401.03804。



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。