Nuovo NN l'. CNN possono essere addestrati a rilevare un singolo oggetto in un'immagine. Tuttavia, se qualsiasi immagine in un set di dati può contenere qualsiasi n # di oggetti. Questo non costituisce un problema per CNNs come l'uscita denso strato deve essere di una dimensione fissa? Come è possibile risolvere questo problema?
Per esempio: Diciamo che io sono campione casuale 2 immagini dal set. Immagine 1 ha 2 oggetti e immagine 2 dispone di 5 oggetti. Y etichetta per img1 contiene la casella di delimitazione coordinate per 2 oggetti; il y etichetta per img2 contiene le coordinate di 5 oggetti, molto più grande vettore y di img1.
Una possibile soluzione? :
Avrei bisogno di trovare l'immagine con il maggior numero di oggetti (indicare questo valore M). Diciamo anche che un oggetto ha 4 coordinate. Se M = 5, avrei bisogno di un vettore y di 20. Se un'immagine ha 1 oggetto, il vettore y contiene 4 valori diversi da zero E 16 valori pari a zero. Il 4 non a zero i valori rappresentano le coordinate e il 16 a zero i valori rappresentano le coordinate degli altri inesistenti oggetti.