最后只能归结在散修的行列文字转WAV音频