他应该再多报几百万的文字转WAV音频