Riqualificare un Modello di BERT

0

Domanda

Mi sono allenato un BERT modello utilizzando pytorch per circa un milione di dati di testo per un'attività di classificazione. Dopo il test di questo modello con i nuovi dati, I Falsi Positivi e Falsi Negativi. Ora voglio riqualificare l'esistente solo per il modello con FN e FP. Non voglio aggiungere il FN e FP per il set di dati esistenti e quindi allenare tutto il modello nuovo. Come posso riabilitare questa bert solo per il modello con queste FN, Fp su previosuly addestrati modello.

1

Migliore risposta

0

Senza conoscere il codice per il treno loop, l'idea di base dovrebbe essere qualcosa come questo dopo l'allenamento:

results = model(data)
wrong_datapoints = []
for i, result in enumerate(results)

    if result != labels[i]:
        wrong_datapoints.append((data[i],labels[i]))


(data_new, labels_new) = list(zip(*wrong_datapoints))

model.train(data_new, labels_new)

Se vuoi qualcosa di più specifico, si sta andando ad avere per fornire un codice di corrente treno loop.

2021-11-23 12:46:43

grazie per il feedback. Ma voglio mantenere un modello versione di esso, dal momento che si allena ogni settimana, abbiamo un modello versione. E anche l'iterazione di un milione di dischi vorrà un sacco di tempo. Stavo pensando di caricare la versione precedente del file bin(v1.0) e quindi riqualificare questo, con datapoint per creare un'altra versione v2.0
Patricia

Si potrebbe desiderare di chiarire la tua domanda di stato. Tuttavia, facendo il controllo delle versioni non rimuovere la necessità di monitorare gli esiti di punti di dati dopo l'allenamento, che necessitano di un singolo loop sopra il treno dei dati dopo l'allenamento è finito. È necessario determinare che cosa il "nuovo datapoint" sono, dopo tutto.
Kroshtan

In altre lingue

Questa pagina è in altre lingue

Русский
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................