本地运行的大模型使用apply_chat_template模版,得到的输出总是包含input的内容应该怎么处理呀,除了后期再做清理,有没有什么方法可以使模型生成的内容不包含input的内容呀?之前使用inputs = tokenizer(combined_message, return_tensors='pt', padding=True, truncation=True).to(model.device)和inputs = tokenizer.apply_chat_template(messages, add_generation_prompt=True, padding=True,truncation=True,return_tensors="pt").to(model.device)得到的output都会包含input的内容