Zalogowany jako: gość

Forum

Wątek: Sztuczna inteligencja jako lektor audiobooków

Wróć do listy wątków

1 z 1

1 z 7: Numernabis

Sztuczna inteligencja jako lektor.
Nadchodzi nowa era audiobooków, tylko patrzeć jak nastąpi wysyp audiobooków czytanych przez sztuczną inteligencję, poniżej link do próbki, brzmi to naprawdę świetnie i osobiście jestem za.
Nie wiem jakie są koszty gdyby przeciętny Kowalski chciał sam przekonwertować swoje pliki txt stosując sztuczną inteligencję,na pewno jednak potrzebny jest dobry sprzęt i póki co jest to mocno czasochłonne.

https://www.dropbox.com/scl/fi/9big55zs5szijbkpkkt0q/Sztuczna-inteligencja-jako-lektor.mp3?rlkey=k0qx8s0y6q3bccz0dx3koydmz&dl=1
Znajdź sobie zajęcie, które kochasz, a nie przepracujesz w życiu ani jednego dnia.
10.10.2023 18:17

2 z 7: tomecki

Dobry to mało powiedziane. Chcąc robić coś na podobnym poziomie na własnym sprzęcie trzeba najpierw sobie taki syntezator zrobić, bo o ile mi wiadomo, nie ma do pobrania polskiego modelu tej jakości. Trening to najpierw potrzeba co najmniej kilku tysięcy godzin dobrej jakości czytania zsynchronizowanego z tekstem, czyli trochę jak w RH - Od tej do tej sekundy mamy powiedziene co następuje i tak przez całe te setki i tysiące godzin nagrań.
Sam trening to zapewne sporo pracy komputera jakości uczelnianej czyli coś takiego, czego nikt raczej w domu nie ma. Kilkanaście, może więcej kart jakby graficznych pracujących prawdopodobnie tygodniami żeby to miało jakiekolwiek ręce i nogi.
Potem dopiero można syntezę robić i tu też kilka problemów. Po pierwszy, puki co, syntezatory nie rozumieją jeszcze, o czym czytają. To trochę tak jakby świetny lektor nasłuchał się i naczytał np. angielskiego bez znajomości języka. Mając wybitne umiejętności w zakresie naśladowania akcentu zapewne prawidłowo będzie czytał pod względem językowym. Jeśli nasłucha się kryminałów czy innych książek z mocniejszą akcją zapewne zauważy, że określenia w rodzaju "I kill you!" z reguły są czytane dość ostro, a "I love you" zdecydowanie inaczej. nie musi tego rozumieć, wystarczy, że załapie, że są tego rodzaju reguły, ale problem w tym, że nie wszystko tak się da. Jeśli przyjdzie do jakichś bardziej skomplikowanych kwestii typu, że jeden z drugim żartują sobie z tekstów w rodzaju "I kill You" względnie "I love You" zapewne niekoniecznie wychwici, że akurat w tym momencie trzeba to przeczytać inaczej, np. ironicznie. podejrzewam, że gdyby jakoś spiąć model językowy w stylu Chata GPT z syntezą w taki sposób, że Chat będzie określał jak syntezator ma czytać dane zdanie czy tam akapit to może faktycznie coś z tego być. Jeśli chcesz więcej przykładów sztucznej inteligencji czytającej różności to możesz odwiedzić tutejszy blog. Chyba się nazywa "pobawmy się AI". Tam jest sporo różnych eksperymentów i jakkolwiek można się czepiać strony językowej i generalnie merytorycznej to dość dobrze pokazuje to na jakim poziomie są teraz algorytmy od sztucznych głosów.

10.10.2023 18:41

3 z 7: tomecki

Inna rzecz, że to się dość dynamicznie zmienia i to, co teraz uważane jest za ostateczną granicę już za parę miesięcy może być już normą. Tak, czy inaczej takie faktycznie dobre czytanie beletrystyki sztucznymi głosami to nie jest taka bardzo prosta sprawa. Wydaje mi się, że da się coś takiego zrobić dobrze, ale trzeba w to włożyć sporo pracy.

10.10.2023 18:43

4 z 7: Numernabis

W każdym bądź razie daje to możliwość uzyskania audiobooków do tej pory nieosiągalnych. Zapewne taniej i szybciej, a co za tym idzie - więcej.
Znajdź sobie zajęcie, które kochasz, a nie przepracujesz w życiu ani jednego dnia.
10.10.2023 19:00

5 z 7: Kat

Brzmi naprawdę dobrze, choć nie znam się na technicznych niuansach tworzenia głosów itd. to jednak jest to całkiem dobre rozwiązanie, ale czy nie generuje większych kosztów?
"Nie wolno się bać. Strach zabija duszę. Strach to mała śmierć, a wielkie unicestwienie. Stawię mu czoło. Niech przejdzie po mnie i przeze mnie. A kiedy przejdzie, odwrócę oko swej jaźni na jego drogę. Którędy przeszedł strach, tam nie ma nic. ... Jestem tylko ja." - Litania Bene Gesserit przeciw strachowi ("
10.10.2023 20:49

6 z 7: Numernabis

Nie sądzę, bo nawet płacą jakąś licencję płacimy jedną i nie są to na pewno koszty jakie pochłania lektor za jeden tytuł.
Nie zastąpi to człowieka, choć kto wie, jeszcze niedawno nikt nie pomyślałby, że sztuczna inteligencja będzie w stanie tak dobrze i w ogóle przeczytać audiobooka.

Film "Terminator" powoli staje się rzeczywistością.
Znajdź sobie zajęcie, które kochasz, a nie przepracujesz w życiu ani jednego dnia.
10.10.2023 21:24

7 z 7: tomecki

Koszty są... mniejsze jeśli to zwyczajnie przepuścisz przez takie coś. Możliwe, że podobne lub większe jeśli będziesz się bawić w oznaczanie zdań z konkretnymi emocjami, generowanie różności po kilka razy coby w końcu znaleźć najlepiej przeczytane itd.

11.10.2023 13:18

Wróć do listy wątków

1 z 1


Nawigacja


Copyright (©) 2014-2024, Dawid Pieper