Skip to content

1413427114/FakeReviewsProject

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 

Repository files navigation

FakeReviewsProject

ToDo List

  • Scraping dettagli prodotto

  • Scraping di tutte le recensioni per un prodotto

  • Scraping dei customer

    • rank, voti utili, totale recensioni fatte, ultime 50 recensioni
  • Analisi feature della recensione:

    • recensioni per date
    • recensioni per utente
    • discostamento dalla media delle recensioni
    • acquisto verificato o meno
    • voti di utilità per la recensione
    • analisi trigrammi del testo delle recensioni
    • se "Recensione Vine"
    • conteggio parole delle review
      • analisi sulla media delle parole usate sulla base del fatto che per unafake reviews (si immagina) non ci si perda molto tempo
      • analisi congiunta del numero di parole superiore alla media su recensioni che contengono trigrammi ripetuti. potrebbero essere copie di altre recensioni, e quindi probabili fake
    • affidabilità del recensore basata su:
      • posizione in classifica (rank) - score valutato sulla base dei voti utili e totale recensioni scritte
      • analisi dei trigrammi delle ultime recensioni pubblicate (ultime 10 ad esempio) per controllare se contengono tutte testo simile
      • se risulta essere un "easy grader", ovvero se per le sue ultime recensioni pubblicate almeno una percentuale (ad esempio il 50%) sono a 5 stelle
      • se risulta essere un "one time reviewer", ovvero se per le sue ultime recensioni pubblicate una percentuale (ad esempio il 50%) sono state realizzate tutte nello stesso giorno
  • Analisi di eventuali correlazioni tra le feature (coefficiente di Pearson)

    • risultati su file ".xls" per analisi. osservazioni studiate e trascritte
  • Anomaly detection

    • clustering
    • isolation forest
    • svm

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%