Jin10 verileri 26 Ağustos'ta, bu sabah, Microsoft Araştırma Enstitüsü, yenilikçi ses modeli VibeVoice-1.5B'yi Açık Kaynak olarak yayınladı. VibeVoice-1.5B, ses alanında birçok önemli teknik atılım gerçekleştirdi: tek seferde 90 dakikalık ultra gerçekçi sesi kesintisiz bir şekilde sentezleyebiliyor, önceki çoğu model yalnızca 60 dakikanın altında ses sentezleyebiliyordu ve 30 dakikadan sonra ton kayması, anlamsal kopmalar gibi sorunlar ortaya çıkıyordu.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Microsoft Açık Kaynak yenilikçi ses modeli VibeVoice-1.5B
Jin10 verileri 26 Ağustos'ta, bu sabah, Microsoft Araştırma Enstitüsü, yenilikçi ses modeli VibeVoice-1.5B'yi Açık Kaynak olarak yayınladı. VibeVoice-1.5B, ses alanında birçok önemli teknik atılım gerçekleştirdi: tek seferde 90 dakikalık ultra gerçekçi sesi kesintisiz bir şekilde sentezleyebiliyor, önceki çoğu model yalnızca 60 dakikanın altında ses sentezleyebiliyordu ve 30 dakikadan sonra ton kayması, anlamsal kopmalar gibi sorunlar ortaya çıkıyordu.