Ho un dataframe
come questo
index col1 col2 col3 col4
0 11/20 11/26 abc 35
1 11/21 11/24 xxx 30
2 11/22 11/27 abc 20
Qui col3
ha lo stesso valore (duplicati in base al valore).
Io sum()
col4
da righe in base al col3
valore.
Quindi in questo caso posso fare
df = df.groupby(['col3'])[['col4']].sum()
Ma con questo approccio ho
index col3 col4
0 abc 55
1 xxx 30
Vorrei essere in grado di conservare la prima occorrenza del duplicato del valore col1
(11/20) e l'ultima occorrenza di col2
(11/27), in modo che il prodotto finale assomigli
index col1 col2 col3 col4
0 11/20 11/27 abc 55
1 11/21 11/24 xxx 30