Postaw w biznesie na analizę danych i wybierz studia podyplomowe z data science
– Przez wiele lat uczyłam na studiach magisterskich i podyplomowych data miningu oraz analizy danych, prezentując praktyczne rozwiązania dla przedsiębiorstw. Z mojego doświadczenia wynika, że wiedza z obszaru statystyki stanowi podstawę do przyszłej pracy analityków i ekspertów data science – tłumaczy dr hab. Wioletta Grzenda ze Szkoły Głównej Handlowej w Warszawie.
Dr hab. Wioletta Grzenda jest profesorem uczelni i kierownikiem Zakładu Metod Statystycznych i Analiz Biznesowych w Instytucie Statystyki i Demografii Szkoły Głównej Handlowej w Warszawie. W pracy naukowo-dydaktycznej koncentruje się na modelowaniu zjawisk społeczno-ekonomicznych z wykorzystaniem podejścia klasycznego i bayesowskiego oraz metod uczenia maszynowego. Jej pasją jest szeroko rozumiana analiza danych.
Wspólnym mianownikiem data science i biznesu są dane. Czy istnieje potrzeba ich dodatkowego generowania?
W przeszłości pozyskanie danych do potrzeb naukowych wymagało sporego wysiłku. Obecnie na ogół nie ma już potrzeby generowania syntetycznych danych, ponieważ rzeczywistych jest tak dużo, że wyzwaniem jest raczej możliwość ich efektywnego przetwarzania.
Istnieje wiele stron internetowych z ogólnodostępnymi danymi. Wiele przedsiębiorstw, a nawet instytucji finansowych, bardzo skrupulatnie podchodzi do kwestii udostępniania danych. Organizacje anonimizują swoje dane i udostępniają je do celów dydaktycznych i naukowych. O ile na początku mojej kariery naukowej, zaawansowana analiza danych była domeną dużych przedsiębiorstw i instytucji finansowych, dziś obszar analityki i data science, jest obecny niemal w każdej firmie.
Do kogo skierowane są studia podyplomowe Data Science w biznesie?
Studia te kierowane są zarówno do osób, które nie posiadają jeszcze kompetencji z obszaru data science, jak i analityków, którzy posiadają już doświadczenie w tej dziedzinie. Mając na uwadze zmiany, które zachodzą na rynku pracy, wiele osób chce się przekwalifikować lub wręcz musi zdobywać nowe umiejętności. Chcemy dać szansę wszystkim.
Ale jak dobrze rozumiem, nie są to tylko studia dla ekspertów z dziedziny IT czy data science?
Zdecydowanie kierujemy tę ofertę do szerszej grupy kandydatów, choć trzeba pamiętać o kilku kwestiach. Dzwonią do nas osoby, które ukończyły np. socjologię i pytają, czy dadzą sobie radę na tym kierunku? Trudno jest nam na to pytanie odpowiedzieć, bo to zależy od otwartości kandydata na nowe wyzwania, jak i jego nakładu pracy własnej.
Oczywiście studia te kierujemy również do osób, które nie posiadają wiedzy statystycznej, gdyż wiedzę w tym obszarze stopniowo będziemy dostarczać i uzupełniać. Trzeba jednak pamiętać, że u podstaw analizy danych leży statystyka i matematyka. Dlatego nastawienie studenta ma duże znaczenie.
Ucząc przez wiele lat na studiach podyplomowych z metod data miningu, zauważyłam, że studenci okazują zainteresowanie statystyką, jako podstawa do pracy analityków czy ekspertów data science. Chciałabym, aby słuchacze naszych studiów unikali błędów w analizie danych, które wynikają z braku wiedzy z obszaru statystyki.
Z jakich narzędzi data science będą umieli korzystać studenci kończąc te studia podyplomowe?
Technologie i języki programowania bardzo dynamicznie się rozwijają. Obecnie najpopularniejsze są języki programowania R i Python, dlatego włączamy je do programu jako podstawę. Dodatkowo chcemy nauczyć studentów korzystać ze środowiska SAS Viya, ponieważ ta platforma umożliwia zarówno pracę w dowolnie wybranym języku programowania, jak i posiada własne rozwiązania dedykowane dla analizy danych. Przede wszystkim zdajemy sobie sprawę, że szczególnie analitycy biznesowi muszą na bieżąco aktualizować swoją wiedzę. W związku z tym musimy stale obserwować, jakie jest zapotrzebowanie rynku na konkretne kompetencje i narzędzia analityczne, aby dostosowywać program studiów do bieżących potrzeb.
Dobrze, a z jakimi kompetencjami wyjdą absolwenci studiów Data Science w biznesie?
Jeśli ktokolwiek chce zostać specjalistą data science, umiejętność wykorzystania nowych technologii będzie kluczową kompetencją, którą powinien dysponować. Absolwenci tych studiów będą z pewnością ją posiadać. Drugim punktem jest zdobycie wiedzy statystycznej, która pozwala unikać wielu błędów w modelowaniu czy analizie danych, a także daje przepustkę do drugiego etapu, którym jest budowa modeli sztucznej inteligencji i uczenia maszynowego. W tym przypadku wychodzimy od regresji liniowej i logistycznej, czyli podstawowych modeli wykorzystywanych w marketingu, czy też w instytucjach finansowych choćby z uwagi na regulacje KNF. Następnie będziemy uczyć modeli czasu trwania, czyli rozszerzymy wiedzę o modelach regresji biorąc pod uwagę również moment, w którym zaszło badane zdarzenie. Wiedza ta jest niezbędna osobom, które chciałyby prowadzić analizę danych medycznych i farmaceutycznych, jak również pracować w firmach ubezpieczeniowych.
Podczas studiów będziemy omawiać także szeregi czasowe, a następnie przejdziemy do uczenia maszynowego i modeli data miningu, skupiając uwagę na drzewach decyzyjnych, lasach losowych, a następnie metodach takich jak bagging i boosting oraz sztucznych sieciach neuronowych.
Biorąc pod uwagę, że wszyscy wykładowcy posiadają duże doświadczenie, będziemy dzielić się naszymi pomysłami na rozwiązania, które nie są standardowe. Pokażemy, jak łączyć modele, o których wspominałam. Będziemy podawać oryginalne przykłady zastosowań, a także wskazywać, jakich błędów należy unikać. Nasi wykładowcy to osoby, z których większość na co dzień łączy naukę, dydaktykę i biznes.
A co z praktyką?
Temu służyć będą konkretne przykłady zarówno związane z dziedzinami zastosowań np. w credit scoringu, jak i przykłady zastosowania konkretnych technik np. zaawansowanych modeli uczenia głębokiego. Taki jest zamysł tych studiów, aby zawsze łączyć teorię z praktyką. Każde zagadnienie omówimy na konkretnym przykładzie, najczęściej biznesowym. Absolwent tych studiów będzie potrafił pozyskiwać dane i odpowiednio przygotować je do analizy, przeprowadzić modelowanie, jak również wyciągać wnioski i oceniać koszty podejmowanych decyzji.
Wiedza, którą przekażemy słuchaczom będzie w odpowiedni sposób usystematyzowana. Mam przekonanie, które wynika z mojego doświadczenia, że z pewnością osoba, która będzie uczestniczyła w zaplanowanych przez nas zajęciach, poradzi sobie z analizą danych w pracy zawodowej.
Czy poza wiedzą i umiejętnościami jest coś, co mogą te studia przynieść absolwentom?
W przypadku osób, które już pracują w biznesie, te studia dają szansę na poszerzenie posiadanych kwalifikacji i kompetencji oraz dostosowanie ich do aktualnych potrzeb rynku. Stwarzają one również możliwość zupełnego przekwalifikowania się.
Dodatkowym atutem tych studiów jest fakt, że są one zdalne. Osoby mieszkające w różnych częściach Polski będą mogły w nich uczestniczyć w modelu online. Mając już doświadczenie w prowadzeniu tego typu zajęć, mogę zapewnić, że zajęcia online nie będą polegały na obserwowaniu tego, co robi wykładowca z drugiej strony ekranu, ale na wspólnym aktywnym działaniu.
Czy studenci, którzy zdobywają takie umiejętności, mają realne szanse na znalezienie satysfakcjonującej pracy?
Zarówno na studiach dziennych, jak i niestacjonarnych, większość studentów SGH już pracuje. Jak wynika z rozmów, przyszli oni na ten kierunek, aby się rozwijać i podnieść swoje kompetencje oraz znaleźć ciekawszą pracę. Zapotrzebowanie na specjalistów z obszaru data science jest ogromne i osoby z tymi kompetencjami nie mają żadnych problemów ze znalezieniem pracy w Polsce, jak i na świecie.
Ostatnio z pierwszych stron gazet nie schodzi temat chatGPT. W jakim stopniu ta technologia wpływa na pracę studentów?
Technologia generatywnej sztucznej inteligencji, jak chatGPT, daje szansę rozwoju, ale musimy uważać, aby nie ulec złudnemu wrażeniu, że już nie trzeba uczyć się języków programowania i analizy danych.
Z moich doświadczeń, a nieco już eksperymentowałam, mogę powiedzieć, że to narzędzie w części przypadków myli się, np. nie sprawdza założeń dla wszystkich modeli. Nawet jeśli ta technologia zostanie dopracowana i błędy zostaną wyeliminowane, to należy pamiętać, że nie posiada ona intuicji. Co więcej nie zna faktów, które w obszarze biznesowym, niekoniecznie są spisane, a mają ogromne znaczenie dla uzyskania poprawnego wyniku analiz, a w konsekwencji podjęcia właściwej decyzji biznesowej.
Studia Podyplomowe Data Science w biznesie dostarczają gruntownej wiedzy i umiejętności z obszaru statystyki oraz uczenia maszynowego niezbędnych do analizy danych w biznesie z wykorzystaniem języków programowania R i Python oraz środowiska SAS Viya.