现在出场的人和发生的事汇聚成后面的文字转WAV音频