Più Istanze di uno Stesso Oggetto in Immagine, Rilevamento di Oggetti Utilizzando la CNN

Question 1

Nuovo NN l'. CNN possono essere addestrati a rilevare un singolo oggetto in un'immagine. Tuttavia, se qualsiasi immagine in un set di dati può contenere qualsiasi n # di oggetti. Questo non costituisce un problema per CNNs come l'uscita denso strato deve essere di una dimensione fissa? Come è possibile risolvere questo problema?

Per esempio: Diciamo che io sono campione casuale 2 immagini dal set. Immagine 1 ha 2 oggetti e immagine 2 dispone di 5 oggetti. Y etichetta per img1 contiene la casella di delimitazione coordinate per 2 oggetti; il y etichetta per img2 contiene le coordinate di 5 oggetti, molto più grande vettore y di img1.

Una possibile soluzione? :

Avrei bisogno di trovare l'immagine con il maggior numero di oggetti (indicare questo valore M). Diciamo anche che un oggetto ha 4 coordinate. Se M = 5, avrei bisogno di un vettore y di 20. Se un'immagine ha 1 oggetto, il vettore y contiene 4 valori diversi da zero E 16 valori pari a zero. Il 4 non a zero i valori rappresentano le coordinate e il 16 a zero i valori rappresentano le coordinate degli altri inesistenti oggetti.

Question 2

La base è un modo di fare più oggetto di classificazione utilizzando la segmentazione. Questo viene fatto attraverso la segmentazione dell'immagine di input per diverse sub-aree e dei mangimi ciascuna area per la rete neurale.

Tuttavia, questo è un metodo di base e ora ci sono molti algoritmi avanzati che fare segmentazione automaticamente.

In generale, molti di classificazione di un oggetto è affrontato in due passi: il Primo è una regione proposta di algoritmo di indovinare quali parti dell'immagine che contiene l'oggetto.

Il secondo è un algoritmo per classificare le proposte delle regioni.

img fonte

Reda El Hail · Answer 1 · 2021-11-21T05:58:06

La base è un modo di fare più oggetto di classificazione utilizzando la segmentazione. Questo viene fatto attraverso la segmentazione dell'immagine di input per diverse sub-aree e dei mangimi ciascuna area per la rete neurale.

Tuttavia, questo è un metodo di base e ora ci sono molti algoritmi avanzati che fare segmentazione automaticamente.

In generale, molti di classificazione di un oggetto è affrontato in due passi: il Primo è una regione proposta di algoritmo di indovinare quali parti dell'immagine che contiene l'oggetto.

Il secondo è un algoritmo per classificare le proposte delle regioni.

img fonte

Qualcosa come il più Veloce R-CNN esegue la segmentazione utilizzando RPN per estrarre le caratteristiche che ritiene rilevanti? È la mia comprensione di questo corretto? Inoltre, quale sarebbe il vettore y aspetto dato che non ci sono variabili di stima etichette per le immagini.

Più Istanze di uno Stesso Oggetto in Immagine, Rilevamento di Oggetti Utilizzando la CNN

Domanda

Migliore risposta

In altre lingue

Questa pagina è in altre lingue

Popolare in questa categoria

Domande popolari in questa categoria