Kariera w data science? Zacznij jako junior data scientist

Kariera w data science? Zacznij jako junior data scientist

Angielski, SQL i Python to najczęstsze umiejętności, których opanowania oczekuje się od początkujących w data science. Przejrzeliśmy oferty, żeby sprawdzić, jakich dodatkowych kompetencji poszukują pracodawcy i przekonać się, jakie obowiązki czekają specjalistów na poziomie junior data scientist.

Junior data scientist na co dzień zajmuje się pozyskiwaniem danych z różnych źródeł, czyszczeniem ich, prowadzeniem analizy eksploracyjnej, a także dobieraniem odpowiednich modeli analizy czy pomocą w budowaniu algorytmów. Wśród kluczowych zadań jest m.in. przygotowywanie raportów, w tym zestawień doraźnych, na potrzeby kadry kierowniczej. Wiedza młodszych analityków jest wykorzystywana również do automatyzacji procesów związanych z opracowywaniem dokumentów. W pracy doskonalą się w wykrywaniu anomalii i błędów w danych, określeniu ich źródeł i szukaniu sposobów, by nie pojawiały się w przyszłości. Ponadto oferty wspominają o używaniu danych również w celach prognozowania dla działów sprzedaży, logistyki oraz finansów.

Łącznik biznesu ze światem technologii

Z wielu ogłoszeń jasno wynika, że zadaniem juniorów jest wspieranie integracji działań przedsiębiorstwa, a także komunikacja zarówno z menedżerami, jak i zespołami programistów czy klientami przedsiębiorstw. To wiąże się np. z wizualizowaniem i prezentowaniem danych oraz wnioskowaniem w sposób przystępny dla odbiorców. Początkujący analitycy powinni ćwiczyć się w zadawaniu właściwych pytań, by przedstawiane informacje jak najlepiej odpowiadały oczekiwaniom poszczególnych grup. Umiejętności miękkie przydadzą się również we wdrażaniu rozwiązań w całej firmie i budowaniu kultury organizacji opartej na danych, która pomoże wypracować przewagę biznesową.

Najważniejsze umiejętności

Zacznijmy od umiejętności, bez których ani rusz. Trzy podstawowe, zawarte w większości ofert to: angielski, SQL i Python. Jeśli chodzi o język Szekspira, to pracodawcy częściej oczekują zdolności swobodnej komunikacji niż sprawnego czytania dokumentacji technicznej, choć i takie wymogi się zdarzają. Znajomość SQL, używanego do tworzenia i modyfikowania relacyjnych baz danych, to must have. Z kolei wśród systemów do zarządzania wspomnianymi bazami zazwyczaj padają nazwy MySQL i PostgreSQL. W przypadku Pythona oczekiwania zwykle nie są wyśrubowane – zgodnie z treścią ofert, juniorom wystarczy podstawowa znajomość.

Inne języki programowania obecne w ogłoszeniach dla junior data scientist to R, C#, a także Java. Sporadycznie w wymogach można natknąć się na VBA, Scalę czy Kotlin. Przydatna okazuje się znajomość języka półformalnego UML (Unified Modeling Language) używanego do modelowania systemów.

Metodyki działania

Jeśli oferty wspominają o tym zagadnieniu, to najczęściej chodzi o zwinne strategie programowania. Zgodnie z założeniami agile’u praca nad projektem przebiega w kolejnych iteracjach, w których ramach zbiera się wymagania, planuje rozwiązania i testy. Każdy sam decyduje o realizacji swojej części pracy. Celem jest szybkie wykonanie projektu, ale przy zachowaniu wysokiej jakości. W interdyscyplinarnych zespołach nie ma hierarchii, a członkowie bezpośrednio się ze sobą komunikują.

Poszukiwane kompetencje miękkie

Przedsiębiorcy, którzy planują zatrudnić osobę na stanowisko junior data scientist, częściej niż konkretne technologie wyliczają w ogłoszeniach szereg kompetencji miękkich. Podium otwiera szybkie i analityczne myślenie. Kolejna jest sprawna komunikacja i umiejętność pracy zarówno indywidualnej, jak i zespołowej. Pracodawcy cenią samodzielność, kreatywne podejście do powierzonych zadań i zręczne rozwiązywanie problemów. Ponadto od przyszłych pracowników oczekują dociekliwości, skrupulatności oraz chęci ciągłego uczenia się.

Doświadczenie w pracy z danymi

Autorzy ofert celują w osoby obeznane ze statystyką, które miały do czynienia z modelowaniem, czyszczeniem i analizą danych, na przykład na studiach. Gdzieniegdzie pojawia się oczekiwanie, że kandydat będzie zaznajomiony z pracą na dużych zbiorach danych, a przynajmniej metodami analizy big data. Warto też mieć podstawową wiedzę z zakresu budowania hurtowni danych (data warehouses) i umieć korzystać z narzędzi ETL (extraction, transformation, loading). Służą one ekstrakcji danych z ich źródła, na przykład systemu ERP, transformacji związanej m.in. z czyszczeniem i wprowadzaniem reguł oraz ładowaniem do bazy, która jest podstawowym źródłem aplikacji opracowującej raporty.

Obsługiwane programy i systemy

Jeśli chodzi o systemy operacyjne, to domyślnym jest Windows, choć niekiedy w ogłoszeniach są również wzmianki o pracy na Linuxie. Skoro już o „okienkach” wspominamy, nie można przegapić częstej nadziei na zdolność kandydatów do sprawnego poruszania się w aplikacjach pakietu Office, ze szczególnym uwzględnieniem Excela. Junior data scientist planujący działania w obszarze analityki biznesowej powinien umieć korzystać z narzędzi do wizualizacji danych. Dodatkową zaletą jest odnajdywanie się w środowisku programistycznym SAS. Gdy wymogi w ogłoszeniu dotyczą pracy w chmurze, częściej od AWS pojawia się platformowa Microsoft Azure. Najrzadziej – Google Cloud.

Udostępnij link

https://www.datasciencerobie.pl/junior-data-scientist-na-poczatek-kariery-w-data-science/