|
|
|
|
Strumenti |
16-02-2022, 09:04 | #1 |
Senior Member
Iscritto dal: Mar 2005
Città: trento
Messaggi: 1318
|
[Google script] Sorgente pagina sito come "ispeziona/analizza"
Salve,
dovrei "scaricare" il sorgente di una pagina web, con UrlFetchApp.fetch riesco a scaricare il sorgente html della pagina interessata, ma non riesco a vedere tutto il contenuto che vedo utilizzando il tasto destro del mouse "analizza" (con firefox... con chrome credo sia ispeziona elemento) è possibile in qualche modo accedere via script ai dati che vedo usando il comando analizza? grazie
__________________
<<giovani oggi bagnati, domani forse raffreddati....>> Papa Giovanni Paolo II - Aprile 1995 Trento Concluso positivamente con: 055, giankyfava, iceone, carocavallo |
16-02-2022, 11:00 | #2 |
Senior Member
Iscritto dal: Apr 2005
Messaggi: 3006
|
Il problema è che alcuni elementi sono modificati a runtime da altro codice presente nella pagina.
Ad esempio pensa a un comando javascript che dopo 30 secondi di permanenza aggiunge del testo.. Chiaramente non lo scaricheresti. L'unico modo che conosco è il "salva pagina" dopo averla aperta con un browser (tanto più che browser diversi danno anche risultati diversi..) |
16-02-2022, 11:41 | #3 |
Senior Member
Iscritto dal: Mar 2005
Città: trento
Messaggi: 1318
|
grazie per la risposta.
ho provato a fare "salva come html" da browser e scarica tutto il sorgente, allora ho provato a fare un wget e poi anche da google script a salvare direttamente la pagina web, ma scarica solo parzialmente. ora stavo leggendo che tramite python si dovrebbe riuscire a fare: https://www.geeksforgeeks.org/scrape...amic-websites/ vedo di continuare domani con le ricerche, ma tramite google script mi sa che posso anche lasciar perdere...
__________________
<<giovani oggi bagnati, domani forse raffreddati....>> Papa Giovanni Paolo II - Aprile 1995 Trento Concluso positivamente con: 055, giankyfava, iceone, carocavallo |
16-02-2022, 12:14 | #4 |
Senior Member
Iscritto dal: Apr 2005
Messaggi: 3006
|
Beh ovvio, l'unica soluzione è renderizzarlo con un browser e poi salvare. Altre soluzioni non ne conosco
|
16-02-2022, 17:47 | #5 |
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3612
|
edit
Ultima modifica di misterx : 17-02-2022 alle 16:46. |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 17:28.