Talk:Meeskond:Scraper

From ICO wiki
Revision as of 17:09, 10 November 2017 by Asamelse (talk | contribs)
Jump to navigationJump to search

Retsensioon meeskonna Scraper analüüsile meeskonnalt XYZ

Positiivsed küljed

Blogist tuleb välja, et tööplaan ja -jaotus on üles ehitatatud süstemaatilselt ja loogiliselt, analüüs on ilusti alamteemadeks jaotatud. Samuti on hästi välja toodud tööetapid ja kasutatavad tehnoloogiad. Hea, et olete läbi mõelnud, millist arendusmustrit plaanite kasutada. Analüüsi suurteks plussideks on oma oskuste mõistlik hindamine (tasakaal must-have ja nice-to-have featuride vahel) ja mõistlik riskide hindamine. Prototüübi must-have-features´i väljatoomine on hea mõte. Uudiste ilmumisaja valik oleks kindlasti kasulik näiteks meediauuringute läbiviimisel.

Väike vahemärkus analüüsi loetavuse/arusaadavuse kohta: “IDEE” bloki all olev kirjeldus “Teeme web scraper'i, mis laeb alla lehekülgede html failid…” on küll ülimalt oluline ja selgitab hästi, kuidas rakendus töötab, aga tekitab esimese ideed kirjeldava blokina pigem segadust. Segadus laheneb “Miks ja milleks?” alamteemat lugema hakates. Arusaadavuse huvides võiks eismeses “idee” blokis kohe öeldud olla, et rakendus on mõeldud meediaportaalide info sorteerimiseks.

Üldiselt jätab analüüs põhjaliku ja mitmekülgse mulje kuid mõned kohad siiski on, mida võiks veel läbi mõelda ja täpsustada. Kohati jääb mulje, et projekti on pandud kokku mitu vastandlikku ideed ja pole päris selge, kuidas need ühes rakenduses koos peaksid eksisteerima - sellest pikemalt konstruktiivse kriitika all.

Konstruktiivne kriitika

Rakendus ei pruugi teenida oma eesmärki. Kui eesmärk on leida kõige olulisemad teemad, siis olulised teemad on need, mida kajastatakse mitme päeva/nädala vms jooksul. Kas teemade ja märksõnade populaarsust mõõdetakse viimase 24 tunni jooksul, viimase nädala või viimase kuu jooksul? Kas kasutaja saab ise ajavahemikku valida? Kui avaldatakse sama teema kohta käivaid artikleid ja analüüse, siis ei pruugi tulla nende omavaheline seotus välja vaid paari märksõna otsides.

Fake-uudiste tuvastamine ja blokeerimine on hea mõte, kuid teostamise mõttes ülimalt raske. Tänapäeval räägitakse, kuidas isegi inimeste endi jaoks muutub võltsuudiste tuvastamine järjest raskemaks. Selle script'iga lahendamine võib osutuda seega väga keeruliseks ja tuua kaasa rohkelt vigaseid tulemusi. Samas on ka autorid ise selle välja toonud kui ühe raskeima ja ajamahukaima ülesande rakenduse loomisel - leiame, et selline analüüsitulemus on asjakohane.

Rakenduse eesmärk on vältida sisutühje ja kollaseid uudiseid. Kui rakenduse eesmärk on korraga kuvada kõige populaarsemad artiklid ja samas vältida kollaseid uudiseid, siis kuidas rakendus käitub, kui kõige populaarsemad artiklid on kollased uudised?

Samuti pole täpselt aru saada, mis teeb uudise rakenduse jaoks populaarseks: kas viimasel ajal tihedalt kasutatav märksõna või uudise lugejate arv?

Rakendus kuvab uudise, kui märksõnal on ajaloolisest keskmisest suurem esinemissagedus. aga mis siis saab, kui teema on pidevalt pildis ja mingi murrang toob kaasa ainult marginaalse märksõna esinemissageduse suurenemise? Kas rakendus kuvaks tähtsa uudise või mitte?

Keelevalik toimub radio buttoni abil, mis viitab ühele ja ainsale valikule, aga kas kasutajal on võimalik näha uudiseid vaheldumisi kahes või enamas keeles? Teatud sama kirjapildiga sõnad võivad küll eesti ja inglise keeles erineva sisuga artikleid välja tuua, aga tüütu oleks rakenduse kasutamisega nullist alustada, kui tahad näha teistes keeltes artikleid. Samuti tasuks läbimõtlemist, miks saab valida ainult ühes keeles kirjutatud, aga mitme riigi uudisteportaalidest pärinevaid uudiseid.

Soovitused

  • Tuleks määratleda aeg, mille jooksul uudiste esinemissagedust otsitakse.
  • Tuleks määratleda, kas artikli populaarsus sõltub märksõna esinemissagedusest või lugejate arvust.
  • Artiklite ja uudiste otsing võiks olla seotud mitme märksõnaga.