Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
. . .
Isso é legal?
. . .
Bem, boas ferramentas para web scraping são pagas. Se o site tiver um
HTML bastante simples, você poderá usar o curl facilmente para
executar a solicitação e, em seguida, extrair os valores necessários
usando os comandos bash grep , cut , sed ,…
https://medium.com/@LiliSousa/web-scraping-with-bash-690e4ee7f98d 1/5
22/06/2019 Web Scraping com bash - Liliana Sousa - Medium
https://medium.com/@LiliSousa/web-scraping-with-bash-690e4ee7f98d 2/5
22/06/2019 Web Scraping com bash - Liliana Sousa - Medium
#! / bin / bash
n = "1"
rm -f tmp_file extractData.csv
// aumenta "book"
n = $ [$ n + 1]
// obter data
date = $ (cat tmp_file | grep date_added | cortar -d '"' -
f4)
// obter título
title = $ (cat tmp_file | grep "class = \" título \ "" |
cut -d '>' -f4 | cut -d '<' -f1)
// obter autor
author = $ (cat tmp_file | grep -A1 "class = \" author \
"" | tail -1)
// obter descrição
desc = $ (cat tmp_file | grep -A2 "class = \" descrição \
"" | tail -2 | sed 'N; s / \ n / /')
// obter preço
price = $ (cat tmp_file | grep "classe = \" preço \ "" |
grep span | corte -d '>' -f4 | cut -d '<' -f1)
// get
ship ship = $ (cat tmp_file | grep "class = \" envio \ ""
| cut -d '>' -f2 | cut -d '<' -f1)
feito
export LC_CTYPE =
Exportar C LANG = C
https://medium.com/@LiliSousa/web-scraping-with-bash-690e4ee7f98d 3/5
22/06/2019 Web Scraping com bash - Liliana Sousa - Medium
https://medium.com/@LiliSousa/web-scraping-with-bash-690e4ee7f98d 4/5
22/06/2019 Web Scraping com bash - Liliana Sousa - Medium
https://medium.com/@LiliSousa/web-scraping-with-bash-690e4ee7f98d 5/5