Odkryj i wyodrębnij informacje ze stron internetowych za pomocą języka Python. Danologia to dynamicznie rozwijająca się dziedzina, która do 2026 roku ma stworzyć 11,5 mln nowych miejsc pracy. Wydobywanie informacji ze stron internetowych jest jednym z najbardziej pożądanych obszarów. Książka ta jest idealna dla początkujących danologów, którzy pragną poznać techniki eksploracji sieci. Rozpoczyna się od kluczowych koncepcji związanych z eksploracją danych w sieci Web i jej taksonomią, a następnie przechodzi do podstaw procesu ekstrakcji danych, jego zastosowań i komponentów. Porusza również aspekty prawne, ekstrakcję z dynamicznych stron oraz zabezpieczenia CAPTCHA. Zawiera koncepcję eksploracji opinii oraz struktury stron, a także eksplorację grafów, wyszukiwanie na stronach i algorytmy takie jak HITS. Na końcu przedstawia techniki eksploracji, które pomagają w odkrywaniu wzorców użycia danych. Książka oferuje pełny przegląd podstawowych i zaawansowanych koncepcji oraz praktyczne zastosowania z użyciem bibliotek open source w Pythonie. Przeznaczona jest dla wszystkich, którzy chcą nauczyć się eksploracji danych w sieci, w szczególności dla początkujących danologów, inżynierów i analityków danych.
Ranjana Rajnish Bücher
