最好的办法就是先把他们分开文字转WAV音频