我们原先约定的是文字转WAV音频