最后还是决定如实交代文字转WAV音频