7 książek o data science, które czyta świat
Eksploracyjna analiza danych i wykrywanie anomalii, techniki wydobywania wiedzy z danych, procesy przetwarzania języka naturalnego i wskazówki do rozmowy kwalifikacyjnej. O tym przeczytacie nie tylko na Reddit czy innych stronach skupiających miłośników data science. Na rynku wydawniczym nie brakuje bowiem publikacji, które pomogą odnaleźć się w gąszczu narzędzi i dobrych praktyk data science.
W rzeczywistości postępującego rozwoju narzędzi cyfrowych i kompetencji niezbędnych do pracy w data science może się wydawać, że wiedza książkowa o i dla branży technologicznej szybko się dezaktualizuje. Owszem, popularne dziś frameworki do pracy z aplikacjami nie wyglądają tak jak kiedyś, a od liczby dostępnych na rynku platform zaczyna się kręcić w głowie. Faktycznie trendy w tych obszarach przemijają, jednak jedno pozostaje niezmienne – fundamenty pracy z danymi, które do realiów rynku dostosowują zarówno te starsze, jak i nowsze publikacje. Przedstawiamy Wam 7 książek o data science, które są najpopularniejsze wśród użytkowników Amazon.com.
1. Ace the data science interview: 201 Real Interview Questions Asked By FAANG, Tech Startups, & Wall Street
To przewodnik nie tylko dla osób już pracujących w data science i szukających ścieżek awansu, ale także dla adeptów zawodu i tych, którzy myślą o zmianie branży. Autorami są Kevin Huo i Nick Singh – dwaj byli pracownicy Facebooka, którzy w jednym miejscu zebrali ponad 200 realnych pytań z rozmów rekrutacyjnych na stanowiska związane z data science, analityką danych i machine learning. Huo i Singh przekonują, że książka przybliży kandydata do zdobycia wymarzonej pracy w strukturach tzw. FAANG (Facebook, Apple, Amazon, Netflix i Google), startupów technologicznych i gigantów rynku finansowego z Wall Street.
Szczegóły tutaj.
2. SQL QuickStart Guide: The Simplified Beginner's Guide to Managing, Analyzing, and Manipulating Data With SQL
Rosnąca rola big data we współczesnym świecie oznacza, że bardziej niż kiedykolwiek odczuwamy palącą potrzebę magazynowania, dostępu i zrozumienia zawartości ogromnych baz danych. Tu z pomocą przychodzi SQL – podstawa nowoczesnego zarządzania i interpretacji danych. Dlatego Walter Shields kieruje książkę przede wszystkim do początkujących. Autor zaznacza, że język ten wciąż pozostaje najszerzej stosowanym i najbardziej niezawodnym, gdy chodzi o zarządzanie bazami danych.
„SQL QuickStart Guide” przybliża podstawową strukturę baz danych, sposoby wykorzystania SQL do lepszego rozumienia danych bez względu na skalę, a także kluczowe umiejętności, które pomogą opanować ten język. Atutem publikacji jest poziom przekazywanej wiedzy – jest ona bowiem wykorzystywana na akademickim szczeblu edukacyjnym, a jednocześnie pozostaje przystępna w zrozumieniu dla osób wciąż niewtajemniczonych w świat data science.
Szczegóły tutaj.
3. Data Science from Scratch: First principles with Python
Nauczenie się data science to nie tylko opanowanie narzędzi – bibliotek, frameworków i modułów. Ważne jest zrozumienie zasad będących fundamentami dziedziny. Dlatego Joel Grus łączy podstawy matematyki i programowania, uczenia maszynowego i przetwarzania języka naturalnego, żeby kompleksowo pokazać data science od środka.
Z książki dowiesz się o wykorzystaniu algebry liniowej, statystyki i koncepcji prawdopodobieństwa, pracy inżyniera danych od A do Z, implementowaniu modeli i sieci neuronowych, a także działaniu popularnych systemów rekomendacji i tych służących do przetwarzania języka naturalnego.
Szczegóły tutaj.
4. Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python
Skoro o statystyce mowa, to chcemy przytoczyć zdanie Petera i Andrewa Bruce’ów oraz Petera Gedecka, autorów tytułowej książki: „metody statystyczne są kluczowym elementem w data science, mimo że niewielu data scientistów ma wykształcenie kierunkowe z tego obszaru”. Dlatego trzej eksperci wydali przewodnik, który dostarcza przykładów wykorzystania statystyki oraz pokazuje, jak można uniknąć mniej i bardziej popularnych błędów. Co ważne, cała wiedza jest przedstawiona z punktu widzenia data scientistów.
Odbiorcami publikacji są specjaliści, którzy już znają języki R lub Python, ale brakuje im perspektywy statystyków. Autorzy utrzymują, że czytelnik lepiej opanuje eksploracyjną analizę danych, metody regresji do wykrywania anomalii, kluczowe techniki klasyfikacji i nienadzorowanego uczenia maszynowego.
Szczegóły tutaj.
5. Hands-on Machine Learning with Scikit-Learn, Keras & TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems
Drążymy głębiej i to dosłownie, bo ta książka traktuje o… deep learning. Aurélien Géron przekonuje, że wykorzystanie wydajnych narzędzi do implementacji programów i aplikacji jest dziś proste jak nigdy. Autor wykorzystuje konkretne przykłady i dwa gotowe frameworki na bazie Pythona – Scikit i TensorFlow – do zobrazowania koncepcji i rozwiązań do budowania uczących się systemów.
Z publikacji można się dowiedzieć, jak zwykła regresja liniowa i głębokie sieci neuronowe sprawdzają się w uczeniu maszynowym. Publikacja obfituje w ćwiczenia po każdym rozdziale, żeby lepiej utrwalić przyswojoną wiedzę. Wszystko, czego potrzeba na start, to minimum doświadczenia w pracy z kodem.
Szczegóły tutaj.
6. Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking
Napisana przez uznanych ekspertów w data science – Fostera Provosta i Toma Fawcetta. Książka ta wyposaża czytelnika w techniki i kompetencje, które są kluczowe do wydobycia użytecznej wiedzy z gromadzonych przez organizacje danych. Do zilustrowania korzyści z podejmowania decyzji opartych na faktach, autorzy wykorzystują przykłady rzeczywistych wyzwań biznesowych, z którymi się mierzyli albo oni sami, albo ich klienci.
„Data Science for Business” podpowiada również, jak usprawnić komunikację między klientami, kadrą zarządzającą a data scientistami. Wyjaśnia też, jak wdrożenie procesów data science pozwala uzyskać przewagę konkurencyjną i co zrobić, aby podejście analityczne i eksploracja danych dały najlepsze rezultaty w przedsiębiorstwie.
Szczegóły tutaj.
7. Data Science
Na zakończenie przedstawiamy książkę o jakże wymownym tytule! I choć została wydana dopiero cztery lata temu, to bardzo możliwe, że zyska miano jednej z publikacji ponadczasowych. Dlaczego tak myślimy? Spójrzmy na opis: „to zwięzłe wprowadzenie do wschodzącej dziedziny data science, które tłumaczy jej ewolucję, relację z machine learning, obecne możliwości zastosowania, kwestie infrastruktury danych oraz wyzwania etyczne i prawne”.
O randze publikacji świadczy również stojące za nią wydawnictwo, czyli MIT Press. Powierzyło ono Johnowi D. Kelleherowi i Brendanowi Tierneyowi opisanie m.in. kwestii integracji danych z wielu źródeł, stosowania algorytmów uczenia maszynowego, a także podejścia do zapewnienia prywatności w pracy z danymi.
Szczegóły tutaj.