Posłuchasz dziś rocka czy muzyki elektronicznej? Algorytmy data science wiedzą, które utwory pominiesz
Dla wielu z nas muzyka jest nieodłącznym towarzyszem każdego dnia. Wybór odpowiedniej ścieżki dźwiękowej ułatwiają algorytmy data science wbudowane w serwisy streamingowe, które na podstawie preferencji konkretnego słuchacza automatycznie ustawiają playlisty i proponują nowe utwory. Zgromadzone dane pozwalają również ocenić, czy użytkownik przesłucha daną piosenkę do końca.
Odgadywanie gustów słuchaczy nie jest wynalazkiem XXI wieku. Zanim nastała era serwisów streamingowych, z tym wyzwaniem mierzyły się linearne rozgłośnie radiowe. Jednak było im trudniej, ponieważ musiały trafić w gust jak najszerszego grona odbiorców, mając zdecydowanie mniej precyzyjne dane niż te, którymi dziś dysponują Spotify, Deezer, czy Google. Koncerny posiłkują się takimi narzędziami, jak badania focusowe, a także listy przebojów wskazujące aktualne trendy. Pierwsze zestawienia powstawały w oparciu o głosy przesyłane na kartkach pocztowych. Dziś listonoszy wyręczają wirtualne plebiscyty w serwisach internetowych, jednak w ten sposób nie dogodzi się wszystkim. Co innego, gdy za oręż ma się algorytmy data science.
Osobisty DJ
Serwisy streamingowe, zamiast opracowywać ofertę dla "uśrednionego" słuchacza, używają algorytmów data science, które przyglądają się zachowaniom każdego użytkownika. Dzięki temu możliwe jest stworzenie spersonalizowanej playlisty uwzględniającej nie tylko takie czynniki jak pora dnia czy ulubione gatunki muzyczne, ale nawet nasz nastrój. W ten sposób Spotify i YouTube zautomatyzowały pracę redaktorów muzycznych, skutecznie ich zastępując i stając się wirtualnymi DJ-ami, pomagającymi odkrywać nowe dźwięki i melodie, które idealnie wpasowują się w gusta.
"Odkryj w tym tygodniu"
Przyjrzyjmy się jednej z usług oferowanych przez szwedzki serwis strumieniowy Spotify. "Odkryj w tym tygodniu" to uruchomiony w 2015 roku system rekomendacji firmy — co tydzień użytkownicy Spotify dostają składankę nowych utworów. Najważniejszym elementem usługi jest gust... innych osób. Algorytm bazuje na powiązaniach między użytkownikami, poszukując ludzi podobnych pod kątem przesłuchanych piosenek. Dodatkowo, przedsiębiorstwo używa technik przetwarzania języka naturalnego, żeby odnaleźć związki i skojarzenia w słowach list odtwarzania, a także poszukuje anomalii w zachowaniu użytkowników. Kolejnym elementem są konwolucyjne (czyli splotowe) sieci neuronowe przetwarzające spektrogramy piosenek i poszukujące analogii we wzorach akustycznych. Całość dopełnia konfrontacja z wcześniejszymi wynikami algorytmów data science, czyli sprawdzenie, ile utworów z poprzedniej listy użytkownik przesłuchał i polubił.
Algorytmy data science mogą przewidzieć nawet pomijanie utworów
Serwis muzyczny stawia na społeczność, udostępniając biblioteki programistyczne i zanonimizowane dane użytkowników, na podstawie których powstają nowe funkcje i modele. Jeden z nich potrafi analizować dane pochodzące z bazy 130 milionów zarejestrowanych sesji użytkowników Spotify. Celem jest sprawdzenie możliwości przewidywania, czy użytkownik pominie kolejny utwór. Model opracowany na niewielkim podzbiorze wspomnianej bazy danych z prawdopodobieństwem 78 proc. poprawnie wskazuje, czy użytkownik pominie kolejny utwór, czy jednak dosłucha go do końca. W konsekwencji, kiedy użytkownik zaczyna pomijać piosenki, serwis może podsunąć mu utwory w innym nastroju, co zwiększy szansę, że kolejna pozycja nie zostanie pominięta.
Muzyka na YouTube’ie popularniejsza niż Spotify
Spotify ma 381 milionów użytkowników i wielu myśli, że to najpopularniejszy muzyczny serwis streamingowy, jednak w rzeczywistości zajmuje 3 miejsce w tej kategorii. Pierwszy jest YouTube z 2 miliardami aktywnych użytkowników. Może to nieintuicyjne, jednak 7 na 10 najczęściej wyświetlanych "filmów" w portalu Google'a to właśnie piosenki. Dominują również w pierwszej setce. Drugie miejsce zajmuje Tencent z ponad 800 milionami słuchaczy rozsianymi pomiędzy różne serwisy muzyczne należące do chińskiego koncernu. Co ciekawe, popularność teledysków na YouTube’ie nie przekłada się na aktywność w aplikacji muzycznej Google’a — z YouTube Music korzysta 30 milionów słuchaczy. YT swój muzyczny sukces zawdzięcza przyzwyczajeniom użytkowników, którzy traktują serwis jako wyszukiwarkę muzyki. A i tu pracują algorytmy data science, skutecznie podpowiadając kolejne treści.
Pierwszy muzyczny silnik rekomendacji
Ważnym etapem rozwoju algorytmów data science okazał się serwis społecznościowy Last.fm, który w 2005 roku umożliwił zapisywanie danych utworów odtwarzanych w programach muzycznych (a później także w serwisach streamingowych, takich jak Spotify czy YouTube) i tworzenie na tej podstawie grup słuchaczy o podobnych preferencjach. Serwis przez pewien czas pozwalał też słuchać tematycznych stacji radiowych. Jednak najważniejszą część stanowi silnik rekomendacji AudioScrobbler, który na podstawie danych zebranych od użytkowników sugeruje podobnych artystów i nowe utwory do odsłuchania. Sukces Last.fm dość szybko został dostrzeżony przez twórców serwisów streamingowych. Dziś praktycznie każdy serwis umożliwiający słuchanie muzyki przez internet wyposażony jest w funkcję sugerowania kolejnych utworów i odkrywania nowych artystów.
25 miliardów dolarów dzięki algorytmom
Streaming odpowiada już za 87 proc. rynku muzycznego. Według danych RIAA (Recording Industry Association of America), wartość serwisów strumieniowych w 2021 roku przekroczyła 25 miliardów dolarów. Trudno się zatem dziwić, że internetowi giganci starają się zyskać przewagę nad konkurencją, oferując użytkownikom coraz dokładniejsze podpowiedzi utworów, które mogą im się spodobać. Stawką jest czas, jaki słuchacz spędzi na danej platformie.