4.2 零样本学习/一次样本学习/少样本学习——Transformer模型的典型功能