我们的作用只是探底文字转WAV音频