但一个粗略的统计数据就是文字转WAV音频