Oggetto e Finalità del progetto
L'attività di web scraping viene svolta nell'ambito di un progetto di ricerca da parte
del dipartimento di Scienze Economiche e Sociali (DiSES), all’interno dell'Università Politecnica delle Marche (Ancona, Italia).
Il progetto prevede lo sviluppo di una ricerca empirica di carattere qualitativo e quantitativo mediante campionamento di un insieme
di informazioni presenti all’interno dei siti web delle imprese italiane, al fine di cogliere il livello di penetrazione e di sviluppo
di un insieme di tecnologie legati alla digitalizzazione e alla sostenibilità ambientale. L'attività di ricerca prevede il
ricorso a sistemi di elaborazione statistica dei dati basandosi sull'utilizzo di software ed anche tecniche di web scraping per l'ottenimento
e l'analisi dei dati.
Le informazioni raccolte saranno utilizzate solo ed esclusivamente per scopi di ricerca e saranno trattate in modo confidenziale.
Le finalità riguardano quindi la realizzazione di un progetto di ricerca in collaborazione con altre Università e istituti di ricerca.
I dati saranno aggregati e analizzati in modo da garantire l'anonimato delle singole imprese coinvolte.
Non verranno fatte graduatorie o altro che sia riconducibile alle imprese. In ultimo, una volta unite le informazioni con le risultanze del web
scraping i dati delle singole imprese saranno eliminati, e tutte le informazioni saranno gestite in modo aggregato per fini statistici e di ricerca.
Attività di Web scraping
Ai fini dell'obiettivo da raggiungere nel progetto di ricerca, facciamo ricorso ad attività di web scraping in quanto
siamo interessati a capire se all’interno dei siti web delle imprese sono presenti delle informazioni relativi alle tecnologie volte alla
digitalizzazione e alla sostenibilità ambientale. Parallelamente, l'attività di ricerca fa anche utilizzo a metodi classici di
elaborazione e ottenimento di dati tramite il ricordo a database quali AIDA, Istat, Orbis, ecc. Le informazioni sulle imprese ed in particolare
su nome, partita IVA, posizionamento geografico e indirizzo del sito web vengono prese direttamente dal database di AIDA.
Una volta conclusa la ricerca tali informazioni verranno cancellate definitivamente.
Webcrawler
User-agent: DISES-UNIVPM-research-project-bot