Più Istanze di uno Stesso Oggetto in Immagine, Rilevamento di Oggetti Utilizzando la CNN

0

Domanda

Nuovo NN l'. CNN possono essere addestrati a rilevare un singolo oggetto in un'immagine. Tuttavia, se qualsiasi immagine in un set di dati può contenere qualsiasi n # di oggetti. Questo non costituisce un problema per CNNs come l'uscita denso strato deve essere di una dimensione fissa? Come è possibile risolvere questo problema?

Per esempio: Diciamo che io sono campione casuale 2 immagini dal set. Immagine 1 ha 2 oggetti e immagine 2 dispone di 5 oggetti. Y etichetta per img1 contiene la casella di delimitazione coordinate per 2 oggetti; il y etichetta per img2 contiene le coordinate di 5 oggetti, molto più grande vettore y di img1.

Una possibile soluzione? :

Avrei bisogno di trovare l'immagine con il maggior numero di oggetti (indicare questo valore M). Diciamo anche che un oggetto ha 4 coordinate. Se M = 5, avrei bisogno di un vettore y di 20. Se un'immagine ha 1 oggetto, il vettore y contiene 4 valori diversi da zero E 16 valori pari a zero. Il 4 non a zero i valori rappresentano le coordinate e il 16 a zero i valori rappresentano le coordinate degli altri inesistenti oggetti.

1

Migliore risposta

1

La base è un modo di fare più oggetto di classificazione utilizzando la segmentazione. Questo viene fatto attraverso la segmentazione dell'immagine di input per diverse sub-aree e dei mangimi ciascuna area per la rete neurale.

Tuttavia, questo è un metodo di base e ora ci sono molti algoritmi avanzati che fare segmentazione automaticamente.

In generale, molti di classificazione di un oggetto è affrontato in due passi: il Primo è una regione proposta di algoritmo di indovinare quali parti dell'immagine che contiene l'oggetto.

Il secondo è un algoritmo per classificare le proposte delle regioni.

enter image description here

img fonte

2021-11-21 05:58:06

Qualcosa come il più Veloce R-CNN esegue la segmentazione utilizzando RPN per estrarre le caratteristiche che ritiene rilevanti? È la mia comprensione di questo corretto? Inoltre, quale sarebbe il vettore y aspetto dato che non ci sono variabili di stima etichette per le immagini.
Ayma

In altre lingue

Questa pagina è in altre lingue

Русский
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................