Sei sulla pagina 1di 11

n o

ila
M i
Organizzazioni e Società d
iDigitali
t u d
(Computer &egSociety) l i S
d
à delle Organizzazioni
Laurea in Management s i t
e del
e r Lavoro (MOL)
n i v
t U
i g h
y r Marco Cremonini
Cop marco.cremonini@unimi.it
NumPy: operazioni su liste (array)
n o
ila
i M
i d
u d
l i St
eg
à d
i t
ers
ni v
t U
i gh
y r
o p
C
NumPy: Aritmetica dei vettori
n o
ila
M
di (array)
Sono tutte operazioni semplici di aritmetica di base deii vettori
Le vediamo direttamente commentando i notebook: t u d
l i S
• Operatori aritmetici (à 02.03-Computation-on-arrays-ufuncs)
e g
d
• Somme, max, min (à 02.04-Computation-on-arrays-aggregates)
à
i t
• Broadcasting (à 02.05-Computation-on-arrays-broadcasting)
e rs
ni v
t U
i gh
y r
o p
C
Esercizio 1 con plot (1)
Consideriamo nel dettaglio l’esempio Example: What is the Average no
ila
Height of US Presidents? (02.04-Computation-on-arrays-aggregates)
M
• Salviamo in locale il notebook d i
d i
S tu
gl i
d e
• il dataset non l’abbiamo à lo cerchiamo
i t àe lo salviamo nella directory richiesta
(data) à come si scarica un csv dars
GitHub? à cercare risposta
• Eseguiamo di nuovo In [1] i v e
U n
h t
r i g
p y
C o
• Cosa ha fatto questo comando? Cercare comando head di Python (uguale al
corrispondente head di R)
Esercizio 1 con plot (2)
• Anticipiamo l’uso di una nuova libreria (pandas) che ha funzioni di n o
i
trasformazione di data frame. Sono molto simili a quelle viste per R. Farela
i M
attenzione a funzioni di pandas (pd.read_csv) e a funzioni di NumPy (ns.array). In
i d
Python dobbiamo specificare a quale libreria appartengono (in R non dovevamo
farlo, bastava richiamare le librerie necessarie) u d
l i St
e g
à d
i t
e rs
ni v
t U
i gh
y r
o p
C
• Perché dice che il nome np non è definito? Correggere l’errore.
Esercizio 1 con plot (3)
Dopo aver corretto l’errore precedente n o

ila
i M
i d pd il nome logico
u d per convenzione
l i St usato per pandas
eg
à d
i t
ers
• n i v
Cosa fa il comando np.array(data[…])? à cercare su doc. di NumPy
• t U
Aggiungere un arrayhname con i nomi dei presidenti e visualizzarlo
• r i g due celle che danno informazioni statistiche sul dataset.
Eseguire le successive
Che cos’èola
y
pdeviazione standard? Che cosa sono 25esimo e 75esimo percentile?
C
Che differenza c’è tra media (mean) e mediana (median)? à statistica di base di
una distribuzione di probabilità
Esercizio 1 con plot (4)
• Anticipiamo la seconda libreria importante di Python (matplotlib) che ha o
funzioni di visualizzazione di dati, insieme a una terza (seaborn, la n
http://seaborn.pydata.org/index.html) che è ancora una libreria per la M i
d i
visualizzazione e usa le funzioni di matplotlib per fornire funzioni di più alto
livello (quindi più comode da usare). di
St u
g l i
d e
i tà
e rs
ni v
• %matplotlib inline: questo serve per visualizzare un plot dentro un Jupyter
U
t
notebook (i comandi con % si chiamano magic command)
h
r i g
• plt: il nome logico standard per funzioni di matplotlib
p y
• import seaborn; seaborn.set(): di seaborn usa solo la funzione set(), non
C o
definisce un nome logico ma usa il nome proprio della libreria
Esercizio 1 con plot (5)
n o
ila
• Eseguiamo la cella che produce l’istogramma (analogo ai M
geom_histogram o geom_bar di ggplot2) i d
• Cercare sulla documentazione di t u d
matplotlib la descrizione delle funzioni l i S
usate: hist, title, xlabel, ylabel e g
(molto simili a ggplot2) d
s tà
i
i ver
U n
h t
r i g
Doc matplotlibà
p y
C o
https://matplotlib.org/3.1.1/api/pyplot_summary.html
Esercizio 1 con plot (6)
n o
Dalla cella precedente: ila
i M
• variare il tema di seaborn (set), provare a impostare il parametro style e palette
i d
à cercare su doc di seaborn (https://seaborn.pydata.org/api.html)
u d
i St
NOTA: se usate la funzione set_theme, che trovate sulla documentazione, e
l
g
ricevete l’errore AttributeError: module 'seaborn' has no attribute 'set_theme’ ,
e
d
questo è dovuto al fatto che avete installata la versione 0.10 di seaborn, mentre la
à
i t
e rs
documentazione online è per la versione 0.11. In quest’ultima versione, la
funzione set() è stata sostituita con set_theme().
Quindi: ni v
t U
• (sconsigliato) o usate set() invece di set_theme()
i gh
r
• (consigliato) oppure fate l’upgrade di seaborn con conda da terminale
y
p
comandi (poi chiudete e riavviate Jupyter notebook): conda upgrade
o
C
seaborn
Esercizio 1 con plot (7)
n o
• guardare i parametri della funzione hist di matplotlib e: ila
• variare il numero di colonne (bins) dell’istogramma i M
• definire un range min max per i valori dell’asse x i d
u d
• cambiare il tipo di istogramma (histtype)
l i St
• cambiare l’orientamento (orientation)
e g
• Ad esempio:
à d
i t
e rs
ni v
t U
i gh
y r
o p
C
Esercizio 1 con plot (7)
n o
• ila
guardare la corrispondente funzione histplot di seaborn (attenzione, la histplot()
i M
vuole la versione 0.11 o superiori di seaborn)
i d
d
https://seaborn.pydata.org/generated/seaborn.histplot.html#seaborn.histplot
u
l i St
e creare un istogramma simile usando questa funzione e i suoi parametri:

e g
d
seaborn.histplot(data=…, binwidth=…, stat=”…", color=”…", kde=”…", element= ”…")
à
plt.show()
i t
e rs
ni v
t U
i gh
y r
o p
C

Potrebbero piacerti anche