Od chińskich modeli po Follow the Leaders – najnowsze trendy AI
Zapraszam Was do kolejnej odsłony podcastu BSS bez tajemnic. Tym razem w studiu towarzyszył mi Paweł Płocki i – jak to zwykle z Pawłem bywa – rozmowa szybko nabrała tempa. Od najnowszych modeli open source z Chin, przez rozwiązania Microsoftu i Google’a, aż po innowacje od ElevenLabs i Suno – przyglądamy się temu, jak dynamicznie rozwija się świat sztucznej inteligencji. Rozmawiamy o narzędziach do edycji obrazów i generowania dźwięku, nowych możliwościach w text-to-speech, a także o tym, jak zmienia się komfort pracy z modelami językowymi. Sporo miejsca poświęcamy premierze GPT-5, hype’owi z nią związanym oraz pierwszym realnym doświadczeniom użytkowników – od „thinking mode” po wersję Pro. Dyskutujemy też o zastosowaniu AI w kodowaniu i o tym, jak zmieniają się narzędzia wspierające programistów.
Key Points
- Chińska inwazja technologiczna w AI przyspiesza, z Alibabą na czele, która regularnie wypuszcza nowe open-source'owe modele, takie jak Quen do edycji zdjęć.
- Microsoft wprowadził open-source'owy model text-to-speech, który generuje mowę z tekstu, umożliwiając tworzenie wielogłosowych kompozycji dźwiękowych wysokiej jakości.
- GPT-5, mimo początkowych kontrowersji, pokazuje swoją siłę, zwłaszcza w wersji Pro, co można zauważyć w rosnącej konkurencji z narzędziami do kodowania, takimi jak Cloud Code.
Chapters
0:00 | |
1:00 | |
1:40 | |
4:48 | |
11:02 | |
16:29 | |
17:58 | |
24:11 | |
26:22 | |
27:18 |
Transcript
Loading transcript...