结果他没发现训练法有问题文字转WAV音频