Scale-invariant feature transform
Scale-invariant feature transform (SIFT) är en algoritm i datorseende för att extrahera intressepunkter med associerade lokala histogram över lokala gradientriktningar, vilka är rimligt väl opåverkade av skala, rotation och belysning. Algoritmen presenterades 1999 av David Lowe. De s.k. intressepunkterna, som möjliggör skalinvarians, extraheras på ett sätt som utgör en approximation till intressepunktsoperatorer som tidigare utvecklats inom skalrumsteori (se nedan).
Tillämpningar
[redigera | redigera wikitext]SIFT används till att finna korrespondenser mellan punkter i två eller flera bilder; matchning. Detta kan användas inom flera tillämpningar, till exempel bildregistrering.
Objektigenkänning
[redigera | redigera wikitext]Genom att för ett objekt bygga upp en databas med tillhörande SIFT-punkter kan objektet hittas i en godtycklig bild.[1] Träffar mellan bildens och objektets punkter kan hittas och verifieras genom en kontroll mot objektets geometri.
Panorama
[redigera | redigera wikitext]Genom att hitta korrespondenser mellan två delvis överlappande bilder kan avbildningen mellan bilderna uppskattas. Efter att avbildningen är uppskattad kan bilderna sys ihop till en enda stor bild. SIFT har framgångsrikt använts till att skapa panoraman helt automatiskt. [2]
Se även
[redigera | redigera wikitext]Referenser
[redigera | redigera wikitext]Följande två artiklar beskriver i detalj hur SIFT fungerar och hur det kan tillämpas inom objektigenkänning.
Följande artikel utgör originalreferens för att detektera skalinvarianta intressepunkter utifrån skalrumsextrema av det skalnormaliserade Laplace-svaret (Lowe använder en approximation till detta i termer av differenser mellan Gauss-utjämnade bilder):
- Lindeberg, Tony (29 november 1998). ”Feature detection with automatic scale selection”. International Journal of Computer Vision "30" (2): ss. 79–116. doi:. http://www.nada.kth.se/cvap/abstracts/cvap198.html.