毕竟那样的话根本就用不着费尽心机的算计文字转WAV音频