Jin10 Data 26 Agustus, dini hari ini, Microsoft Research merilis model audio inovatif VibeVoice-1.5B sebagai Sumber Terbuka. VibeVoice-1.5B menciptakan beberapa terobosan teknologi besar dalam dunia suara: dapat secara kontinu mensintesis suara realistis yang sangat panjang selama 90 menit sekaligus, sementara sebagian besar model sebelumnya hanya dapat mensintesis suara dalam waktu kurang dari 60 menit, dan setelah 30 menit akan muncul masalah seperti penyimpangan nada dan pemutusan makna.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Model audio inovasi sumber terbuka VibeVoice-1.5B dari Microsoft
Jin10 Data 26 Agustus, dini hari ini, Microsoft Research merilis model audio inovatif VibeVoice-1.5B sebagai Sumber Terbuka. VibeVoice-1.5B menciptakan beberapa terobosan teknologi besar dalam dunia suara: dapat secara kontinu mensintesis suara realistis yang sangat panjang selama 90 menit sekaligus, sementara sebagian besar model sebelumnya hanya dapat mensintesis suara dalam waktu kurang dari 60 menit, dan setelah 30 menit akan muncul masalah seperti penyimpangan nada dan pemutusan makna.