Sadržaj:
Prikupljanje podataka
Octoparse – to je sveobuhvatno softversko rješenje za masovno i automatizirano prikupljanje (web scraping), strukturiranje i analizu podataka, za čiju upotrebu nisu potrebne vještine programiranja. Uz njegovu pomoć, možete pretvoriti bilo koje nestrukturirane web podatke u gotovu informatičku bazu za marketing, istraživanja, prodaju, promociju i rješavanje mnogih drugih poslovnih zadataka.

Ovisno o tome na kojim će se stranicama koristiti softver, moguće je dobiti podatke i/ili sadržaj sljedećih vrsta: cijene i informacije o proizvodima (za trgovačke platforme); objave, postovi, komentari (društvene mreže); cijene, ocjene, recenzije (booking, nekretnine); oglasi za posao i plaće (zapošljavanje) itd.

Razmatrani softver funkcionira pod upravljanjem jedinstvenog algoritma, čija je osnova umjetna inteligencija, što omogućava automatsko pronalaženje i izvlačenje podataka s web stranica prema unaprijed definiranim ili predloženim parametrima.

Predlošci
Usluga nudi više od 200 gotovih predložaka za prikupljanje podataka s web stranica iz sljedećih kategorija:
- Popularne web usluge;
- Internetske trgovine i tržišta (Amazon, eBay, Walmart itd.);
- Hoteli i putovanja (Airbnb, Booking, Tripadvisor itd.);
- Društvene mreže i mediji (Facebook, Instagram, Twitter, YouTube itd.);
- Pretraživači (Google, Yahoo);
- Oglasi (Crunchbase, Yellow Pages, Yelp itd.);
- Kartaške usluge (Google);
- Recenzije;
- Pretraživanje posla;
- Nekretnine;
- Školsko obrazovanje;
- Financije;
- Oklade.













Izrada zadataka
Osim predložaka, u Octoparse možete stvoriti vlastite zadatke za vađenje podataka s weba. Ovaj postupak se provodi u tri jednostavna koraka: navođenje URL adrese stranice s koje je potrebno prikupiti podatke, odabir cilja i zatim pokretanje i neposredno vađenje.
Postupak je izuzetno jednostavan i automatiziran – sustav prepoznaje ključne elemente na web stranicama i ističe ih, što ne samo da osigurava dodatnu udobnost u interakciji, već i štedi vrijeme. Još važnije, takav pristup isključuje potrebu za poznavanjem i korištenjem jezika XPath za samostalno stvaranje XML upita.

Spremanje i izmjena postavki zadataka
Tijekom automatskog vađenja informacija i na temelju sadržaja otkrivenog na web stranici, Octoparse stvara vlastite postavke koje se mogu ili spremiti kao predloške spremne za daljnju upotrebu, ili izmijeniti po vlastitom nahođenju, na primjer, isključivanjem jedne kategorije i dodavanjem druge ili jednostavno promjenom njihovog redoslijeda.

Očigledno je da potreba za izmjenom osnovnih postavki, koje uvjetuju konačno prikazivanje prikupljenih podataka, nastaje prilično često. Prvotno se prikazuju u obliku pregledne tablice s automatski definiranim kategorijama i redoslijedom, čije se kolone mogu zamijeniti, a nepotrebne jednostavno ukloniti.

Osim toga, često je potrebno samostalno odrediti takve parametre kao što su broj stranica na webu i interval pristupa njima.

Nakon automatskog ili samostalnog određivanja postavki, pokretanja i završetka samog procesa ekstrakcije, stvara se radni predložak (workflow) koji se sastoji od nekoliko blokova – uređivih elemenata, čiji konačni izgled određuje kako će zadatak izgledati na kraju.

Predstavljanje zadataka i upravljanje
Završeni zadaci dodaju se na nadzornu ploču (dostupnu iz gornjeg i bočnog izbornika), odakle se mogu izvoditi radnje poput pokretanja i zaustavljanja procesa ekstrakcije, dijeljenja s kolegama, izvoza, pregledavanja lokalnih podataka i onih koji se pohranjuju u oblaku.

Za lakše pretraživanje i upravljanje preporučuje se stvaranje grupa, a po potrebi se mogu premještati zadaci iz jedne kategorije u drugu.

Dodatni alati
U okviru aktualne (beta) verzije Octoparse postoje dva dodatna alata koja proširuju funkcionalne mogućnosti ovog programa i omogućuju učinkovitiju interakciju s podacima. Tako, RegEx alat omogućuje čišćenje prikupljenih informacija, dok alat za automatski izvoz baze podataka omogućuje postavljanje vlastitog rasporeda za izvoz u lokalnu bazu.

Izvoz podataka
Podaci prikupljeni pomoću Octoparse mogu se po potrebi spremiti u formate XLSX, CSV, JSON itd. za daljnju obradu u vanjskom softveru, poput Excela ili Ajaxa. Također postoji mogućnost izvoza u baze podataka.

Proxy poslužitelji
Razmatrani program omogućuje korištenje vlastitog proxy poslužitelja tijekom prikupljanja podataka. Na taj način možete sakriti ili automatski zamijeniti svoju IP adresu kako ne biste završili na crnoj listi obrađivanih web resursa.
Blokiranje oglasa
Octoparse sadrži alate za blokiranje oglasa, čime se smanjuje vrijeme učitavanja stranica i pristupa njima, a time se optimizira i ubrzava rješavanje osnovnih radnih zadataka.
Oblačne usluge
Za osiguranje sigurnosti i pouzdanosti procesa web-scrapinga, Octoparse koristi napredne tehnologije oblačnih računalnih sustava vlastitog razvoja, a također pruža pristup svojim uslugama i poslužiteljima, čija je brzina rada do 20 puta veća od lokalnih analoga.

Lekcije o korištenju
Na službenoj web stranici Octoparse dostupna je opsežna biblioteka obrazovnih materijala, zahvaljujući kojima se u najkraćem roku mogu savladati sve funkcionalne mogućnosti ovog softvera, kako bi se maksimalno učinkovito koristio za organizaciju radnih procesa i rješavanje poslovnih zadataka. Do njih se može doći i iz sučelja programa, iz glavnog prozora.

Tehnička podrška
U slučaju bilo kakvih poteškoća u korištenju i/ili problema u radu, Octoparse se uvijek može kontaktirati putem službe tehničke podrške za uslugu web-scrapinga podataka. Dostupni su sljedeći kanali komunikacije: e-pošta, forum i zajednica, društvene mreže i chat uživo (dostupan samo u plaćenom paketu). Pri tome valja napomenuti da je za dobivanje odgovora na određena pitanja često dovoljno obratiti se bazi znanja predstavljanoj na web stranici ili već spomenutim obrazovnim materijalima.

Prednosti
- Postojanje 14-dnevne besplatne probne verzije;
- Jednostavno i praktično, intuitivno sučelje;
- Nema potrebe za programerskim vještinama;
- Mogućnost korištenja oblaka usluga tvrtke razvijača;
- Postojanje obrazovnih materijala za korištenje softvera;
- Tehnička podrška s više kanala komunikacije;
- Velika biblioteka gotovih predložaka koje je moguće prilagoditi vlastitim potrebama;
- Podrška za najpopularnije web stranice i usluge različitih smjerova i tema.
Nedostaci
- Nema ruske lokalizacije;
- Nema predložaka za domaće web stranice;
- U trenutku pisanja recenzije, aktualne verzije Octoparse za Windows i macOS dostupne su samo u beta verziji. Prethodna (stabilna) verzija razlikuje se od nje sučeljem i funkcionalnošću.