Co trzeba umieć, żeby pracować jako senior data scientist?
Coraz większe i zróżnicowane zbiory danych, a także świadomość korzyści, jakie kryją się za ich analizą, zwiększają popyt na ekspertów w data science. Firmy, chcąc nadążyć za cyfrową rewolucją, poszukują pracowników z doświadczeniem, którzy wspomogą zespoły analityczne i z łatwością będą komunikowali się z kadrą zarządzającą. Sprawdziliśmy, czego dokładnie pracodawcy oczekują od osób na stanowisku senior data scientist.
Senior data scientist odgrywa kluczową rolę w budowaniu kultury danych w organizacji. W codziennej pracy zajmuje się rozwiązywaniem złożonych problemów biznesowych. Projektuje, rozwija i wprowadza systemy zarządzania danymi. Jego aktywność przekłada się na bardziej precyzyjne i oparte na rzetelnych informacjach decyzje biznesowe. Współpracuje też z różnymi działami w przedsiębiorstwie, a także z menedżerami. Zbiera wymagania, przygotowuje rozwiązania, formułuje wnioski i rekomenduje działania. Z tego powodu, poza zdolnościami technicznymi, potrzebuje rozwiniętych kompetencji miękkich, które ułatwią komunikację oraz pracę w interdyscyplinarnych zespołach.
Wykształcenie? Najlepiej wyższe
Jeśli kwestia ukończonej uczelni pojawia się w ofercie, to zazwyczaj dotyczy oczekiwań związanych ze studiami z zakresu matematyki, statystyki, informatyki lub uczenia maszynowego. Niekiedy nawet obrona pracy magisterskiej nie wystarczy, bo część przedsiębiorstw chętniej podejmie współpracę z doktorantami lub osobami ze stopniem doktorskim.
Umiejętności miękkie
Nawet najlepsze studia i tytuły naukowe na niewiele się zdadzą, gdy zabraknie umiejętności miękkich. Potrzeba analitycznego myślenia, dbałości o szczegóły, a także otwartości na nowe projekty. Ponieważ seniorzy często mają pod opieką młodszych stażem kolegów, pracodawcy chcą, by doświadczonych data scientistów cechowały zdolności komunikacyjne i przywódcze. To pomoże w przewodzeniu juniorom, a także odpowiednim przygotowaniu danych i delegowaniu związanych z nimi zadań. Ułatwi też dostosowywanie prac analityków do ogólnej strategii organizacji.
Praca w zespołach wymaga również umiejętności dzielenia się wiedzą, pełnienia roli mentora i nauczyciela. Z kolei poziom stanowiska w firmowej hierarchii wiąże się z dużą dozą niezależności, stąd kluczowe są również: samodzielne rozwiązywanie problemów analitycznych, organizacja własnej pracy oraz podejmowanie decyzji w dziedzinie data science. Od seniora oczekuje się również przygotowywania i realizowana strategii działań zespołu data science, a także okresowej oceny wydajności prac.
Jednym z narzędzi w kontekście pracy w zespole data science, które powinni znać seniorzy, to Git – rozproszony system kontroli wersji ułatwiający pracę z dużymi projektami. Drugim rozwiązaniem jest Jira, której używa się do zarządzania pracą, często z wykorzystaniem metodyki agile zakładającej m.in. bieżące dostosowywanie projektów do zmieniających się wymogów zleceniodawców.
Współpraca z biznesem
Łatwość komunikacji ma znaczenie również w relacjach z klientami, innymi zespołami i kadrą zarządzającą. Senior data scientist powinien umieć opracowywać, ale też jasno przedstawiać pomysły na wykorzystanie potencjału firmy, jaki niosą za sobą gromadzone dane. Duże znaczenie ma zdolność wsłuchiwania się w głos biznesu i gotowość do przekładania wymagań na szybkie prototypowanie, do którego potrzeba również sporej dozy kreatywności.
We współpracy z innymi działami i interdyscyplinarnymi zespołami niezbędne są narzędzia do wizualizacji danych. Pracodawcy często zakładają również, że senior data scientist będzie bardzo dobrze posługiwał się popularnymi na rynku platformami analityki biznesowej i narzędziami do wizualizacji danych.Seniorzy powinni znać również narzędzia ETL, które wspomagają pozyskiwanie, przekształcanie i ładowanie danych do hurtowni.
Wiedza i doświadczenie
Istotne jest podnoszenie własnych kompetencji i poznawanie nowych narzędzi, które pozwalają nadążać za szybkim rozwojem data science. To sprzyja wypracowywaniu nowych modeli biznesowych. Seniorom w pracy przyda się nie tylko wcześniejsze doświadczenie (zwykle co najmniej 3-letnie) w data science, ale również branżowe – pracodawcy zwracają uwagę na tematykę poprzednich projektów i sygnalizują, że chętnie zatrudniliby kogoś, kto dobrze odnajduje się w konkretnym obszarze, takimi jak przemysł, marketing, ochrona zdrowia czy edukacja.
Dobrze też, gdy kandydat na stanowisko senior data scientist, który wdraża algorytmy uczenia maszynowego, może pochwalić się wcześniejszą praktyką w dziedzinie eksploracji i czyszczenia danych. Przydatna jest znajomość zagadnień związanych z big data i platformami programistycznymi, takich jak Spark, Hadoop czy Hive przeznaczony dla hurtowni danych. Cenne są także umiejętności w operowaniu jak największym wachlarzem typów danych – zarówno ustrukturyzowanych, jak i nieustrukturyzowanych, z czym wiąże się wiedza z zakresu jezior danych (ang. data lakes). Dodatkową zaletą jest obycie w platformach chmurowych, głównie Microsoft Azure i Amazon Web Services.
Znajomość języków (nie tylko) programowania
Języki programowania, które najczęściej pojawiają się w ofertach pracy dla senior data scientistów, to: Python, R i SAS. Wymogi odnośnie do pierwszego często idą w parze z takimi bibliotekami jak scikit-learn, NumPy, Pandas, PyTorch, Matplotlib, a także seaborn. Kolejno na liście są Java, Scala oraz SQL. Warto zwrócić uwagę, że w tym zakresie nie ma miejsca na braki – pracodawcy wymagają biegłości. Jeśli chodzi o języki obce, w ogłoszeniach dominuje angielski i to co najmniej na poziomie B2, czyli średniozaawansowanym.