但我也的确不愿意和人类文字转WAV音频