之前确实会有这样的担心――毕竟文字转WAV音频