(Jasna) linia między wizją komputera a przetwarzaniem obrazu


14

Pracuję i uczę się zarówno o wizji komputerowej, jak i przetwarzaniu obrazu od kilku lat i wierzę, że nie jestem już kompletnym początkującym.

Mimo to po tylu latach trudno mi powiedzieć w jakiejkolwiek części mojej pracy, czy jest to związane głównie z wizją komputerową, czy też z przetwarzaniem obrazu . Po prostu nie widzę linii - kiedy pracuję, studiuję i badam, czytam materiały referencyjne zawierające oba słowa kluczowe.

Tak więc interesuje mnie definicja pól widzenia komputerowego i przetwarzania obrazu, z naciskiem na porównanie (różnice i nakładanie się) pól .

Dodatkowo uważam, że warto mieć przykład (praktycznych lub istniejących) praktycznych aplikacji, projektów i prac dotyczących / wykorzystania:

  • wyłącznie (lub głównie) komputerowe narzędzia i pomysły wizji
  • wyłącznie (lub głównie) narzędzia i pomysły do ​​przetwarzania obrazu
  • połączenie narzędzi i pomysłów z obu dziedzin

ze zwróceniem szczególnej uwagi na to, co czyni je jednym, a nie drugim , lub co czyni oba te elementy .

Rozumiem, że te pola są ściśle powiązane i że „linia” może nie być tak jasna, jak to pytanie, ale mam nadzieję, że rozumiesz, że celem tego pytania nie było zaprojektowanie prostej reguły decyzyjnej do klasyfikacji (mojej) pracować, ale raczej lepiej zrozumieć cel i cele tych dziedzin. Ponadto wszelkie dodatkowe informacje, które wydają się dotyczyć mojego tematu, są mile widziane, nawet jeśli nie poprosiłem o nie.


Co z „Machine Vision”? Czy uważasz to za synonim „Computer Vision”?
Alessandro Jacopson

@ uvts_cvs Szczerze mówiąc, nigdy nie uczyłem o „wizji maszynowej”… może to może mieć znaczenie „maszyn (z wbudowanymi systemami) specjalizujących się w wykonywaniu niektórych zadań wizji komputerowej”, np. czytałem kiedyś o kamerach zdolnych do rozpoznawania licencji talerze. Ale z drugiej strony mogę się mylić w tej sprawie :)
penelopa

Odpowiedzi:


12

Uważam, że Gonzalez i Woods są wystarczająco kompetentni, aby polegać na ich opinii:

Nie ma ogólnej zgody między autorami co do miejsca, w którym kończy się przetwarzanie obrazu i innych powiązanych obszarów, takich jak analiza obrazu i widzenie komputerowe. Czasami rozróżnia się definiowanie przetwarzania obrazu jako dyscypliny, w której zarówno wejście, jak i wyjście procesu są obrazami. Uważamy, że jest to granica ograniczająca i nieco sztuczna . Na przykład, zgodnie z tą definicją, nawet błahe zadanie obliczenia średniej intensywności obrazu (która daje pojedynczą liczbę) nie byłoby uważane za operację przetwarzania obrazu. Z drugiej strony istnieją pola takie jak widzenie komputerowe, których ostatecznym celem jest wykorzystanie komputerów do naśladowania ludzkiej wizji, w tym uczenie się i zdolność do wnioskowania i podejmowania działań na podstawie danych wizualnych. Sam ten obszar jest gałęzią sztucznej inteligencji (AI), której celem jest naśladowanie ludzkiej inteligencji. Rozwój AI jest na najwcześniejszym etapie niemowlęctwa, a postępy są znacznie wolniejsze niż pierwotnie oczekiwano. Obszar analizy obrazu pomiędzy przetwarzaniem obrazu a obrazowaniem komputerowym . (zwany także rozumieniem obrazu) jest włączony

Powiedziałbym więc, że podstawową różnicą są cele, a nie metody. Na przykład, jeśli celem jest ulepszenie obrazu do późniejszego wykorzystania przez ludzi, można to nazwać przetwarzaniem obrazu. A jeśli celem jest naśladowanie wzroku ludzkiego (rozpoznawanie obiektów, wykrywanie usterek lub automatyczne prowadzenie pojazdu), to jest on bliższy wizji komputerowej. Należy jednak pamiętać, że emulacja ludzkiego widzenia z definicji może również wymagać poprawy obrazu, więc w większości rzeczywistych przypadków widzenie komputerowe opiera się na przetwarzaniu obrazu .

Zrozumienie obrazu (ekstrakcja funkcji) może być równie dobrze wykorzystane zarówno w czystym przetwarzaniu obrazu, jak i wizyjnym.


Dobra uwaga ..
Spacey

bardzo ładna odpowiedź. po prostu idealny stosunek materiału odniesienia i interpretacji z doświadczenia. dzięki
penelopa

10

W moim rozumieniu celem przetwarzania obrazu jest uzyskanie (w jakiś sposób przekształconego) obrazu. Celem wizji komputerowej jest dowiedzieć się czegoś o tym, co jest w środku obrazie (jak to facet na zdjęciu szczęśliwy lub smutny, ile samochodów istnieją w obrazie i w jaki sposób są one jazdy).

wyłącznie (lub głównie) komputerowe narzędzia i pomysły wizji

Nie sądzę, że jest to możliwe, nie w sposób, w jaki rozumiem warunki.

wyłącznie (lub głównie) narzędzia i pomysły do ​​przetwarzania obrazu

Weźmy na przykład Adobe Photoshop: może zrobić zdjęcie i przekształcić je w obraz szczuplejszej osoby o lepszej skórze. Ale nic nie „wie” o przedmiotach przedstawionych na obrazie.


Dam ci przykład: Aktualnie pracuję nad wyszukiwaniem obrazów w oparciu o treść. Większość ludzi twierdzi, że to przetwarzanie obrazu. Nie jestem pewien, czy pasuje do twojej odpowiedzi (nie mówię, że to zła odpowiedź, tylko się zastanawiam)
penelopa

Jednym ze wskaźników jest: czy wynikiem twojego zadania jest obraz (IP) lub jakaś inna struktura danych (CV). W CBIR wynikiem jest inna struktura danych (np. Miara podobieństwa między obrazami), więc powiedziałbym, że to widzenie komputerowe. Wikipedia twierdzi również, że jest to również wizja komputerowa.
Niki Estner

Tam sam zrobiłem trochę google, znalazłem ten artykuł poglądowy i zacytowałem: „W tych systemach algorytmy przetwarzania obrazu (zwykle automatyczne) są używane do wyodrębnienia wektorów cech, które reprezentują właściwości obrazu, takie jak kolor, tekstura i kształt ”. Artykuł wygląda dla mnie dość solidnie ...
penelopa

2
Tak, każdy komputerowy system wizyjny wykorzystuje algorytmy przetwarzania obrazu.
Niki Estner

Nie zgadzam się z żadnym konkretnym punktem twojej odpowiedzi i / lub wyjaśnień ... To po prostu nie ... pasuje tak ładnie, jak bym chciał. Ale to zamienia się w dyskusję, która przynosi efekt przeciwny do zamierzonego. Mam więc nadzieję, że będą inne odpowiedzi na pytanie, które, mam nadzieję, dadzą inną / jaśniejszą perspektywę;)
penelopa
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.