langchain调用语言模型chatglm4从智谱AI

参考了一些官方和他人帖子:主要就是LLM类的继承和重写#函数继承和重写@property我们这里的本地模型是chatglm6B,结果:显存:速度:10个字需要0.12s。_langchainchatglm4...