Logo UNIPVM

Webcrawling (Research Project)

Di.S.E.S. - UNIVPM


Università Politenica delle Marche

 


Oggetto e Finalità del progetto

L'attività di web scraping viene svolta nell'ambito di un progetto di ricerca da parte del dipartimento di Scienze Economiche e Sociali (DiSES), all’interno dell'Università Politecnica delle Marche (Ancona, Italia). Il progetto prevede lo sviluppo di una ricerca empirica di carattere qualitativo e quantitativo mediante campionamento di un insieme di informazioni presenti all’interno dei siti web delle imprese italiane, al fine di cogliere il livello di penetrazione e di sviluppo di un insieme di tecnologie legati alla digitalizzazione e alla sostenibilità ambientale. L'attività di ricerca prevede il ricorso a sistemi di elaborazione statistica dei dati basandosi sull'utilizzo di software ed anche tecniche di web scraping per l'ottenimento e l'analisi dei dati.
Le informazioni raccolte saranno utilizzate solo ed esclusivamente per scopi di ricerca e saranno trattate in modo confidenziale. Le finalità riguardano quindi la realizzazione di un progetto di ricerca in collaborazione con altre Università e istituti di ricerca.
I dati saranno aggregati e analizzati in modo da garantire l'anonimato delle singole imprese coinvolte.
Non verranno fatte graduatorie o altro che sia riconducibile alle imprese. In ultimo, una volta unite le informazioni con le risultanze del web scraping i dati delle singole imprese saranno eliminati, e tutte le informazioni saranno gestite in modo aggregato per fini statistici e di ricerca.

Attività di Web scraping

Ai fini dell'obiettivo da raggiungere nel progetto di ricerca, facciamo ricorso ad attività di web scraping in quanto siamo interessati a capire se all’interno dei siti web delle imprese sono presenti delle informazioni relativi alle tecnologie volte alla digitalizzazione e alla sostenibilità ambientale. Parallelamente, l'attività di ricerca fa anche utilizzo a metodi classici di elaborazione e ottenimento di dati tramite il ricordo a database quali AIDA, Istat, Orbis, ecc. Le informazioni sulle imprese ed in particolare su nome, partita IVA, posizionamento geografico e indirizzo del sito web vengono prese direttamente dal database di AIDA. Una volta conclusa la ricerca tali informazioni verranno cancellate definitivamente.


Webcrawler

User-agent: DISES-UNIVPM-research-project-bot