Wysłano mnie tutaj z tego pytania w przepełnieniu stosu , przepraszam, jeśli pytanie jest zbyt szczegółowe i nie ma tu manier :)
Zadanie polega na znalezieniu szklanki z określonym płynem. Pokażę ci zdjęcia, a następnie opiszę to, co próbuję osiągnąć, i jak starałem się osiągnąć w opisie poniżej zdjęć.
Zdjęcia : (wydaje się, że potrzebuję co najmniej 10 reputacji, aby publikować zdjęcia i linki, więc linki będą musiały zrobić :( w przeciwnym razie możesz spojrzeć na pytanie o przepełnienie stosu)
Szczegółowy opis : Próbowałem zaimplementować algorytm, który wykryłby szkło o określonym kształcie w opencv (szkło może zostać przekształcone przez inny kąt strzału kamery / odległość). Będą też inne okulary o innych kształtach. Szkło, którego szukam, będzie również wypełnione kolorową cieczą, która odróżni go od szklanek zawierających inne kolory.
Do tej pory próbowałem użyć ekstraktora funkcji SIFT, aby znaleźć niektóre funkcje w szkle, a następnie dopasować je do innych zdjęć z umieszczoną w nim szkłem.
To podejście działało tylko w bardzo specyficznych warunkach, w których miałbym szkło w bardzo konkretnej pozycji, a tło przypominałoby obrazy edukacyjne. Problem polega również na tym, że szkło jest obiektem 3d i nie wiem, jak z niego wydobyć cechy (może kilka zdjęć pod różnymi kątami jest jakoś połączonych?).
Teraz nie wiem, jakiego innego podejścia mogę użyć. Znalazłem kilka wskazówek na ten temat (tutaj /programming/10168686/algorithm-improvement-for-coca-cola-can-shape-recognition#answer-10219338 ), ale linki wydają się być zepsute.
Innym problemem byłoby wykrycie różnych „poziomów pustki” w takim szkle, ale nawet nie byłem w stanie prawidłowo znaleźć samego szkła.
Jakie byłyby twoje zalecenia dotyczące podejścia do tego zadania? Czy lepiej byłoby użyć innego sposobu znalezienia funkcji lokalnego obiektu 3D? Czy może lepiej byłoby zastosować inne podejście? Słyszałem o algorytmach „uczących się” obiektu z zestawu wielu zdjęć, ale nigdy nie widziałem tego w praktyce.
Wszelkie porady będą mile widziane