他大概地估算了一下文字转WAV音频