Come posso utilizzare value_counts() solo per determinati valori?

Question 1

Voglio estrarre quante recensioni positive da parte del marchio sono in un set di dati che include le recensioni di migliaia di prodotti. Ho usato questo codice e ho ottenuto un tavolo tra percentaje di positivo e non di giudizi positivi. Come posso ottenere solo la percentuale di recensioni positive da brand? Voglio solo il "Vero" risultati in positive_review. Grazie!

df_reviews_ok.groupby("brand")["positive_review"].value_counts(normalize=True).mul(100).round(2)
brand                   positive_review
Belkin                  False               70.00
                        True                30.00
Bowers & Wilkins        False               67.65
                        True                32.35
Corsair                 False               75.22
                        True                24.78
Definitive Technology   False               68.29
                        True                31.71
Dell                    False               60.87
                        True                39.13
DreamWave               False              100.00
House of Marley         False              100.00
JBL                     False               58.43
                        True                41.57
Kicker                  True                66.67
                        False               33.33
Lenovo                  False               76.92
                        True                23.08
Logitech                False               75.75
                        True                24.25
MEE audio               False               53.80
                        True                46.20
Microsoft               False               67.86
                        True                32.14
Midland                 False               72.09
                        True                27.91
Motorola                False               72.92
                        True                27.08
Netgear                 False               72.30
                        True                27.70
Pny                     False               68.78
                        True                31.22
Power Acoustik          False              100.00
SVS                     False              100.00
Samsung                 False               61.94
                        True                38.06
Sanus                   False               75.93
                        True                24.07
Sdi Technologies, Inc.  False               55.63
                        True                44.37
Siriusxm                False               73.33
                        True                26.67
Sling Media             False               67.16
                        True                32.84
Sony                    False               55.40
                        True                44.60
Toshiba                 False               56.52
                        True                43.48
Ultimate Ears           False               70.21
                        True                29.79
Verizon Wireless        False               75.86
                        True                24.14
WD                      False               58.33
                        True                41.67
Yamaha                  False               61.15
                        True                38.85
Name: positive_review, dtype: float64

Question 2

Utilizzando il seguente giocattolo DataFrame come esempio:

df = pd.DataFrame({
    'brand': list('AAAABBBB'),
    'positive': [True, True, False, False, True, True, True, False]
})

Se si desidera ottenere la percentuale di giudizi positivi per ogni marchio, rispetto al numero totale dei giudizi per ogni marchio e poi provare:

df.groupby('brand')['positive'].mean()

Il risultato è come previsto:

brand
A    0.50
B    0.75
Name: positive, dtype: float64

Question 3

È possibile unstack l'uscita e la fetta di Vero

(df.groupby('brand')
   ['positive_review'].value_counts(normalize=True)
   .mul(100).round(2)
   .unstack(fill_value=0)
   [True]
 )

Question 4

Come sull'utilizzo di .reset_index() dopo la dichiarazione e quindi utilizzando una condizione.

rudolfovic · Answer 1 · 2021-11-22T17:40:05

Utilizzando il seguente giocattolo DataFrame come esempio:

df = pd.DataFrame({
    'brand': list('AAAABBBB'),
    'positive': [True, True, False, False, True, True, True, False]
})

Se si desidera ottenere la percentuale di giudizi positivi per ogni marchio, rispetto al numero totale dei giudizi per ogni marchio e poi provare:

df.groupby('brand')['positive'].mean()

Il risultato è come previsto:

brand
A    0.50
B    0.75
Name: positive, dtype: float64

mozway · Answer 2 · 2021-11-22T17:32:19

È possibile unstack l'uscita e la fetta di Vero

(df.groupby('brand')
   ['positive_review'].value_counts(normalize=True)
   .mul(100).round(2)
   .unstack(fill_value=0)
   [True]
 )

Sembra abbastanza ingombrante per la quale la domanda è: chiedere

Jeremy Caney · Answer 3 · 2021-11-22T17:39:50

-1

Come sull'utilizzo di .reset_index() dopo la dichiarazione e quindi utilizzando una condizione.

Jeremy Caney

2021-11-22 17:39:50

Che potrebbe essere utile. Si può offrire una spiegazione più dettagliata e forse un po ' più contestuale codice in modo che i futuri lettori possono seguire la vostra guida?

Jeremy Caney

Come posso utilizzare value_counts() solo per determinati valori?

Domanda

Migliore risposta

In altre lingue

Questa pagina è in altre lingue

Popolare in questa categoria

Domande popolari in questa categoria