原来是这种算法……文字转WAV音频