Gdzie możesz szkolić się z data science?
Badanie zaprezentowane w raporcie „Accelerated digital transformation”, o którym przeczytasz na naszym blogu, pokazało, że poszerzanie i aktualizowanie wiedzy w dziedzinie data science jest zawsze na topie. Dotyczy to zarówno adeptów nauki o danych, jak i fachowców. Dlatego dziś przyjrzymy się popularnym kursom i pokażemy, gdzie możesz szkolić się z data science. Poniżej znajdziesz odnośniki do kompleksowych, a także specjalistycznych szkoleń. Co istotne, do każdego dołączysz, nie ruszając się sprzed ekranu.
Przegląd zaczniemy od kursów przekrojowych, które znaleźliśmy na kilku platformach (m.in. Udemy), z którą być może mieliście już do czynienia. Jeśli jesteś nowicjuszem, z pewnością zgłębisz meandry dziedziny. Tylko pamiętaj, aby nie przewijać materiału zbyt pochopnie! Jeżeli jednak szkolić się z data science będziesz już po raz kolejny – poniższy zbiór i tak może się przydać. Choćby po to, żeby uporządkować wiedzę i poznać nowe narzędzia.
Bootcamp z Udemy
Autorzy szkolenia "The Data Science Course 2022: Complete Data Science Bootcamp" zaczynają od omówienia różnych dziedzin nauki, które nie tylko zajmują się danymi, ale także pracują nad technikami i narzędziami popularnymi zwłaszcza wśród osób, które chcą szkolić się z data science. Drugą część poświęcili prawdopodobieństwu, a w jego ramach poruszają zagadnienia: kombinatoryki, wnioskowania bayesowskiego oraz funkcji rzeczywistej, która wyznacza miarę prawdopodobieństwa, czyli dystrybuanty.
Następnie przechodzą do statystyki i podstawowych zagadnień związanych z programowaniem w Pythonie. Jednak nie poprzestają na zagadnieniach podstawowej składni, instrukcji warunkowych, funkcji i iteracji – skupiają się także na zaawansowanych metodach statystycznych w Pythonie. Nie możemy też zapomnieć o rozdziale dotyczącym głębokiego uczenia, które poprzedzane jest omówieniem matematyki stojącej za machine learning. Jeśli weźmiesz udział w kursie, zdobytą wiedzę sprawdzisz na przykładach z biznesu wziętych.
10 kursów w Courserze
Propozycja amerykańskiej spółki edukacyjnej to szkoleniowy multitool – w ramach "Data Science Specialization" przerobisz w sumie 10 kursów. Kompendium przygotowane przez Uniwersytet Johna Hopkinsa rozpoczyna się wyjaśnieniem, w jaki sposób przekształcić dane w użyteczną wiedzę uzupełnioną o prezentację niezbędnych narzędzi. Drugi etap to nauka kodowania w R, wczytywania danych czy pisania funkcji. Następne szkolenia są poświęcone zbieraniu i czyszczeniu informacji, eksploracyjnej analizie danych, wnioskowaniu statystycznemu oraz regresji. Jeden z działów traktuje o ważnej kwestii, jaką jest pokazanie wyników analizy masowemu odbiorcy tak, aby były dla niego zrozumiałe i czytelne. Ostatnim etapem są projekty, którymi można uzupełnić portfolio.
Data science jak w Harvardzie
Certyfikat Uniwersytetu Harvarda będzie Ci przysługiwał, kiedy ukończysz program "HarvardX's Data Science" w platformie edX. Twórcy tego szkolenia również postawili na R i zaczynają naukę od podstaw języka. Następnie pokazują, jak wykorzystać Ggplot2, czyli open source’owy pakiet służący wizualizacji danych. Z kolei rachunku prawdopodobieństwa uczą, wykorzystując przykłady z kryzysu ekonomicznego w 2008 roku. Tym razem też nie obejdzie się bez wnioskowania i modelowania statystycznego, a także przetwarzania i przekształcania surowych danych w formaty potrzebne do analizy. W trakcie nauki dowiesz się, jak używać systemu Unix/Linux jako narzędzia do zarządzania plikami i katalogami oraz utrzymania porządku w projektach. Zapoznasz się z systemem kontroli wersji git, a także zgłębisz tajniki R Markdown, dzięki czemu w jednym dokumencie połączysz tekst z kodem.
Szybki kurs dla każdego z datacamp
15 krótkich filmów i 48 praktycznych ćwiczeń w kursie "Data Science for Everyone" to dobry start, jeśli chcesz się dowiedzieć, czym jest nauka o danych, ale raczej stronisz od kodowania. Szkolenie jest podzielone na cztery części. Pierwsza, poświęcona podstawom, traktuje m.in. o zastosowaniach data science, różnicach w zadaniach inżynierów danych, analityków czy specjalistów uczenia maszynowego, jak również o narzędziach, z których korzystają. Następny moduł pokazuje, skąd czerpać dane i objaśnia metody ich przechowywania. W trzecim etapie poznasz podstawy przygotowywania zgromadzonych danych, np. sposoby radzenia sobie z brakującymi wartościami, oraz zaznajomisz się z zagadnieniami eksploracji i wizualizacji informacji. Na końcu dowiesz się, co zrobić, aby prognozować przyszłe zdarzenia.
Akademia dla data scientistów
Program SAS Academy for Data Science to trzy ścieżki nauki. Jeśli zdecydujesz się zostać kuratorem danych, czekają na ciebie cztery szkolenia – pierwsze wyjaśnia, czym jest tego rodzaju kuratela i jak w jej ramach korzystać z SAS. W kolejnym opanujesz narzędzia do swobodnego zarządzania danymi i ich przekształcania, a także zapewnienia ich spójności i wiarygodności. W trzecim module poznasz platformy Apache Hadoop, Apache Hive i Apache Pig. Jednym z zagadnień w tej ścieżce jest kwestia używania SAS Federation Server do utrzymania, monitorowania i konfigurowania dostępu do danych.
Drugi segment Akademii SAS to dziewięć kursów na temat zaawansowanej analityki. W czasie nauki dowiesz się, jak odkrywać wzorce w danych i korzystać z modelowania predykcyjnego. Zrozumiesz działanie popularnych algorytmów sieci neuronowych i zajmiesz się big data. Poznasz SAS Text Miner, dzięki któremu staniesz się mistrzem przeszukiwania nieustrukturyzowanych danych tekstowych. Trzecia ścieżka w ramach Akademii uczyni cię fachowcem w dziedzinie inteligentnych algorytmów. Podczas 5 kursów zdobędziesz wiedzę o konwolucyjnych i rekurencyjnych sieciach neuronowych, jak również poznasz narzędzia potrzebne do wczytywania danych do pamięci i wizualizowania szeregów czasowych.
Szkolenia specjalistyczne
Dość już holistycznych podejść i popularnych narzędzi. Teraz przejdziemy do kursów, które nie tylko pomogą szkolić się z data science, ale też wyspecjalizować się w jego konkretnych zagadnieniach.
Wstęp do uczenia maszynowego
W kursie "Data Science: Machine Learning"poznasz podstawy machine larning. Między innymi dowiesz się, jak przeprowadzić sprawdzian krzyżowy (tzw. kroswalidację), żeby wykorzystać zbiory danych zarówno do uczenia, jak i walidacji modeli oraz uniknąć przetrenowania. Jako uczestnik szkolenia przyswoisz sobie popularne algorytmy uczenia maszynowego i sprawdzisz ich zastosowanie w systemach rekomendacji używanych w platformach VOD i sklepach internetowych. Elementem kursu jest zagadnienie regularyzacji ułatwiającej redukcję błędów w modelu bez konieczności jego przebudowy.
Machine learning z PyTorchem
Jeśli swoją znajomość Pythona określasz jako średniozaawansowaną i masz już podstawową wiedzę z zakresu prawdopodobieństwa i statystyki, możesz dołączyć do szkolenia "Intro to Machine Learning with PyTorch"w serwisie Udacity. Podczas około trzymiesięcznego treningu opanujesz techniki czyszczenia danych i zaznajomisz się z tematami nadzorowanego i nienadzorowanego uczenia maszynowego oraz uczenia głębokiego. W tej ostatniej części autorzy przybliżają podstawy projektowania i trenowania sieci neuronowych w PyTorchu – otwartoźródłowej bibliotece Pythona używanej w aplikacjach machine learning. Co ciekawe, PyTorcha opracowali specjaliści FAIR – Facebook's AI Research.
Sieci neuronowe i głębokie uczenie
Po ukończeniu szkolenia "Neural Networks and Deep Learning" zyskasz umiejętności potrzebne do budowania, trenowania i stosowania głębokich sieci neuronowych. Nauczysz się identyfikować kluczowe parametry w architekturze sieci neuronowych oraz wdrażać deep learning we własnych aplikacjach. Kurs rozpoczyna się od zagadnień ogólnych dotyczących np. trendów, które przyczyniły się do rozwoju głębokiego uczenia, a także przykładów zastosowania technologii. Na koniec autorzy przygotowali interesujący projekt – budowę i wytrenowanie sieci neuronowych do zadań związanych z rozpoznawaniem obrazów.
R po polsku
Propozycja Grupy Helion to "Analiza danych w środowisku R". Robiąc kurs dostępny na Udemy, poznasz składnię języka R oraz metody agregacji, filtrowania i sortowania danych. Korelacja, regresja czy analiza szeregu czasowego to tylko niektóre zagadnienia z poruszanych w dziale „Analiza danych i modelowanie statystyczne”. Osobna sekcja dotyczy tworzenia wykresów i map. Na końcu nauczysz się wykorzystywać Shiny, czyli pakiet służący tworzeniu interaktywnych aplikacji webowych.
Buduj kompetencje z SAS jeszcze na studiach
SAS Skill Builder to propozycja dla studentów. Po rejestracji z uczelnianego adresu uzyskasz dostęp do środowiska programistycznego SAS Studio oraz platformy SAS Viya. To narzędzia wykorzystywane w wielu przedsiębiorstwach do efektywnego i wygodnego wykonywania zadań związanych z modelowaniem analitycznym, a także organizowania danych tak, by stały się podstawą procesów decyzyjnych. Materiały w programie SAS dotyczą programowania i zarządzania danymi, tworzenia modeli predykcyjnych, analizy danych, opracowywania interaktywnych raportów, a także praktycznego wykorzystania uczenia maszynowego. Zdobyte umiejętności możesz potwierdzić certyfikatem.