因为他根据自己的测算文字转WAV音频