这证明我们碰到的是一个大机缘文字转WAV音频