特斯拉前AI总监介绍了一种最简的GPT模式,它利用有限状态马尔可夫链,只需要两个token 0/1和上下文长度为3,训练结果已相当可观。这是一个适合想要了解流行AI模型技术的人的机会。