Ho due panda dataframes in questo modo:
df1
sito | link |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteX | https://www.retailer_siteX.com |
df2
sito | link |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteY | https://www.retailer_siteY.com |
Quindi voglio passare attraverso df2 e trovare le istanze dei link da df2 in df1. Ecco il mio codice:
for row in df2['link'].astype(str):
boolean_findings = df1['link'].str.contains(row)
Quando si stampa boolean_findings, sto diventando tutto falso, che so che non può essere vero perché sto vedendo le partite in locale sul mio file excel:
boolean_findings |
---|
False |
False |
... |
False |
Quello che voglio sapere è perché il collegamento ipertestuale stringa di testo è quello di non essere abbinati con il suo equivalente al primo df, e cosa posso fare per abbinare i siti.
TypeError: replace() takes no keyword arguments
. Quando ho tolto leregex=True
non un errore, ma non la sostituisce sia. Penso che un aspetto inre
modulo per ordinare questo, ma grazie per avermi messo sulla strada giusta!