Nagtataka kaba marahil may ilang members dito na nakakakuha ng datos mula sa ating forum at ginagawan ng topic upang makabuo ng makabuluhang ideya? Statistics na may graph na kasama, at ginagamit ang kapangyarihan ng numero upang bigyan tayo ng kaalaman sa mga impormasyon patungkol sa ating forum?
Kung lagi mong nakikita sina
LoyceV,
DdmrDdmr,
tranthidung at
asu(Local), sila marahil ang madalas na gumagawa ng topic na may kinalaman sa statistics sa pamamagitan ng tinatawag na Scraping o pag kalap ng datos mula sa ating forum. Ang Scraping ay isang paraan kung saan, ang bawat webpage ay dinadaanan upang kuhanin ang ano mang datos na ninanais nating kuhanin.
May ilang mga paraan kung paano isagawa ito:
1. Maaaring gumamit ng Phyton, o iba pang programming language para mag execute ng task sa pag sscrape.
2. At maaari din namang gumamit ng mga software na available para magscrape.
Ang ilan sa mga software na aking ginamit ay ang Outwit hub at ang Octoparse sa tulong ni
DdmrDdmrang ibabahagi ko ngayon ay yung paraang hindi tayo gaanong mahihirapan sa pagkalap ng datos gamit ang Octoparse:
I'll make it as short as possible, and if you want to figure it out further, I advise you watch other tutorials regarding Xpath.1. Mag download ng Octoparse at gumawa ng account dito. 2. Matapos gumawa ng account ay mag login.3. Pindutin ang Advance Mode + New Task4. Kopyahin ang URL ng unang page ng ninanais na kuhanan ng datos5. I paste ang Link sa Octoparse6. Pindutin ang Arrow para magsilbing loop. 7. Pindutin ang Loop Click the selected link. Matapos pindutin ang loop click selected link, pindutin naman ang Go To Web Page na nasa illustration para bumalik ka sa page 18. Pumili ng element na nais kuhanin at piliin ang select all, matapos ito, select extract both link and text. Sa proseso nito, dadaanan ng octoparse automatically ang bawat web page at kung ano ang element na nais natin kuhanin ay automatically nya ding kukunin.9. Maaari ng simulan ang pag eexctract ng datos.10. Ito ang itsura habang nag eextract ng datosMatapos ang lahat ng steps, maaari ng i export ang datos na nakalap, para sa akin, mas madaling maisaayos ito kung sa excel ko ito ieexport.Last step ay buksan ang excel file na iyong inexport.Ito ang ilan sa mga excel files ng datos na aking nakalap:
Pilipinas SectionPamilihan SectionPilipinas Altcoin SectionAltcoin AnnouncenmentAll Sections DataMula sa mga datos na ito, nasasaatin nalang kung pano natin ito mamanipulahin kagaya ng pag rarank, at pag pili ng mga variables na nais nating makuha at pag sasaayos nito.