很多朋友可能想过,是否只有英伟达显卡,才能运行现如今大家所熟知的大语言模型。但我们需要注意一点,计算机的世界没有魔法,深度学习的世界可能有但并不多——对于任意一个深度学习模型,他所需要的仅仅是对权重的加载、对权重的推理,就可以得到你想要的推理结果。那么对于一个大语言模型也是如此,只要我们支持机器和硬件设备支持加载权重到实时缓存中,再提供权重推理所需要的计算单元的支持,也就是算子的支持,那么他就一定能在任意所选设备上运行;而基于这一原理,我们也自然能够在 CPU 上运行任意深度学习模型,包括大语言模型,只要 CPU 支持了对应的模型算子实现。