Zastanawiałem się, jakie zalety mają języki ontologiczne RDFS / OWL w porównaniu do używania systemu znaczników / znaczników (takiego jak http://www.schema.org/ ) do zarządzania i tworzenia metadanych?
Zastanawiałem się, jakie zalety mają języki ontologiczne RDFS / OWL w porównaniu do używania systemu znaczników / znaczników (takiego jak http://www.schema.org/ ) do zarządzania i tworzenia metadanych?
Odpowiedzi:
Twoje pytanie nie ma sensu. RDFS jest bardzo podstawowym językiem schematu do wyrażania ograniczeń RDF. OWL jest bardziej zaawansowanym schematem do wyrażania skomplikowanej ontologii. Nie mają absolutnie nic wspólnego z XML, poza tym, że mogą być wyrażone w XML.
Nie można się bardziej zgodzić z odpowiedzią ZJR. Jest całkowicie niedoinformowany.
Lista typowych słowników OWL znajduje się poniżej:
Nadchodzi kolejne wydanie RDF, w tym nowe formaty serializacji, takie jak Turtle i RDFj
SPARQL 1.1 jest również natychmiastowo wymagalny. Federacja zapytań, wyrażenie ścieżki właściwości, aktualizacja SPARQL i wiele więcej.
BBC jest zbudowany na RDF. Interfejs API wykresów Facebooka zapewnia RDF (to prawda, możesz uszanować URI wykresu za pomocą nagłówka text / turtle Accepts i odzyskać RDF) i wielu innych dużych korporacji.
Podsumowując, Semantic Web, RDF, RDFS, OWL, SPARQL i wszystkie standardy Semantic Web są bardzo żywe i ekscytujące. Jeśli mi nie wierzysz, spójrz na całą aktywność na http://www.semanticoverflow.com
RDF<some-letter>
nomenklatura generuje zamieszanie i kłótnie przez cały czas.
RDF / OWL vs XML jest fałszywą alternatywą. W rzeczywistości jedną z popularnych serializacji jest użycie XML.
Również RDF / OWL vs mikroformaty jest fałszywą alternatywą. W rzeczywistości istnieją standardy, które pozwalają na użycie RDF jako mikroformatu, eRDF i oficjalny RDFa W3C ze standardowym sposobem osadzania go w HTML5 .
Tak naprawdę pytanie brzmi, jaka jest zaleta korzystania ze standardowych formatów zatwierdzonych przez W3C. Powody są następujące:
Ogólnie rzecz biorąc, nie widzę powodu, dla którego warto wybrać niestandardowy mikroformat inny niż W3C.
RDF i OWL to ustalone standardy kodowania danych semantycznych i ich schematów na znacznie głębszym i ogólnym poziomie niż znaczniki ad-hoc.
Na przykład za pomocą OWL możesz zdefiniować nowy schemat, który będzie przynajmniej częściowo zrozumiany przez inne narzędzia (ponieważ możesz mieszać różne schematy OWL / RDF razem). W ten sposób możesz wyeksportować z jednego zestawu danych różne „widoki” i umożliwić wszystkim współpracę. Możesz także po prostu „odkrywać” połączenia między obiektami i ich właściwościami.
W przypadku mikrodanych jest to w zasadzie doraźny, zaakceptowany zestaw rzeczy, które można zastosować, a nie ogólna platforma semantyczna.
Chciałbym zacząć od zauważenia, że ta odpowiedź nie jest napisana przez eksperta w tej dziedzinie. Chociaż jestem zwolennikiem semantycznych systemów rozproszonych, myślę, że zastosowania OWL są obecnie ograniczone. Chociaż dokładne opisanie niszy, w której można zastosować OWL, wykraczałoby poza zakres tej odpowiedzi, być może uda mi się ujawnić niektóre plusy i minusy.
OWL jest w zasadzie językiem, który pozwala wyrażać konstrukty semantyczne za pomocą klasyfikacji, podobnie jak klasy znane z OOP i ograniczenia między klasami i ich instancjami. Można to postrzegać jako bardziej formalny i bardziej uporządkowany sposób opisywania relacji, które znasz z relacyjnej bazy danych.
Aby opisać i komunikować ten język, należy go zserializować do określonego formatu. Istnieje kilka formatów, z których RDF jest tylko jeden.
Istnieją trzy różne poziomy OWL, pozwalające na zwiększenie ekspresji, ale ograniczające obliczalność (np. Czy możesz znaleźć możliwe rozwiązanie pytań, które zadajesz bazie wiedzy opisanej przez definicję OWL). Są to OWL Lite, DL i Full.
Najważniejszą zaletą korzystania z OWL / RDF jest wymiana wiedzy między różnymi bazami wiedzy (lub hierarchiami klasyfikacji) i tworzenie użytecznych wniosków bez konieczności wcześniejszego opracowywania wszystkich tych baz, aby umożliwić im komunikację. Odbywa się to częściowo poprzez zdefiniowanie klas równoważności. Korzystanie z przestrzeni nazw pozwala inżynierowi ustalić niepowtarzalność; przydatny paradygmat.
Kolejną zaletą jest stale rosnąca liczba mechanizmów wnioskowania i języków zapytań. W naszym sieciowym świecie istnieje zapotrzebowanie na rozproszoną wymianę wiedzy.
Być może istotną wadą jest względnie duża złożoność ustalenia obliczalności wnioskowania oraz ich ograniczeń przestrzennych i czasowych. Na przykład. w OWL full możesz poprosić o wnioski, których nie można udowodnić. Zatem z pewnością istnieje ograniczenie mocy OWL.
Wiedza OWL jest dyskretna ... nie ma półprawd ani systemów wierzeń. Posiadanie ich najprawdopodobniej spowodowałoby, że rozwiązania byłyby zbyt złożone.
Ale najważniejszą wadą mojego gustu jest to, że po prostu nie można znaleźć wielu dobrych inżynierów w tej dziedzinie. Potrzebujesz inżyniera wiedzy, jednego lub dwóch informatyków i małego zespołu programistów, aby zbudować nawet niewielką bazę wiedzy. Dlatego często znacznie tańszym i skuteczniejszym jest używanie tylko języków opisowych, takich jak schemat XML i opisywanie potrzebnej semantyki w dokumencie czytelnym dla człowieka.
RDFS polega na opisie danych strukturalnych. Byłoby o wiele bardziej przydatne, gdyby zawierał metody lub funkcje, abyśmy mogli opisać interfejsy z nim. Obecnie potrzebujesz dodatkowego słownika, aby to zrobić, na przykład WSDL lub Hydra przez usługi sieciowe. Wydaje mi się, że jest też słownictwo dla OOP, po prostu nie znam wielu słowników.
OWL przypomina XSD, chodzi o sprawdzanie poprawności danych, na przykład jeśli oczekujesz ciągu zawierającego co najwyżej 20 znaków, używasz OWL do opisania tej reguły i wygenerowania walidatora. Teoretycznie możesz zrobić to samo z RDFS i XSD, nie mam pojęcia, dlaczego ludzie musieli wymyślić OWL zamiast po prostu używać XSD. Być może dzieje się tak, ponieważ XSD nie jest oparty na RDFS, więc na przykład ciąg XSD nie jest potomkiem literału RDFS.
Schema.org opisuje popularne klasy, na przykład Person. Tworzą swój własny RDFS jak vocab, który zawiera Thing zamiast rdfs: Class, domainInclude zamiast rdfs: domain, rangeIncludes zamiast rdfs: range i tak dalej zamiast korzystania z RDFS. Ich ograniczone typy są również ad-hoc, używają tekstu i liczby bez ich definiowania lub łączenia ich przynajmniej z plikami rdfs: dosłownymi lub XSD. O ile wiem, nie używają XSD ani OWL do definiowania typów ograniczonych. Nie jestem pewien, czy są jakieś ograniczenia w ich słownictwie, ale jeśli tak, to chyba wspominają o tym w czytelnych dla ludzi opisach, więc nie będziesz w stanie wygenerować odpowiedniego walidatora przeciwko schema.org, co możesz zrobić, jeśli one użyłby XSD / OWL i RDFS.
Myślę więc, że zaletą korzystania ze standardów takich jak RDFS, XSD, OWL jest to, że można pisać biblioteki, których można używać ponownie w każdym dokumencie.
W celu opracowania przyszłych produktów, pliki RDFS / OWL XML należy uznać za prawie martwe i zniknęły.
Wymagają zbyt wiele pracy, aby wyrazić koncepcje, które niestandardowe rozwiązanie oparte na niestandardowych formatach tekstowych wyraziłoby lepiej , przy jednoczesnym zachowaniu czytelności i edytowalności danych zarówno dla ludzi, jak i maszyn. Nie dodają żadnej realnej wartości i tylko sprawiają, że życie jest trochę bardziej nieszczęśliwe dla każdego, kto się na nich natknie. (i musi poradzić sobie z nazewnictwem przestrzeni nazw)
Na ich podstawie istnieją jednak gigantyczne rozwiązania do obsługi dokumentów, które zostały niedawno opracowane, wdrożone i są w bieżącej eksploatacji. Grożą bardzo długo. Wielu programistów w przyszłości będzie niewątpliwie cierpieć na wiele WTF indukowanych przez RDF i OWL.
MICRODATA systemy (wersja walidator w obsłudze od mikroformatach ), takie jak te opisane w schema.org , obecny zamiast wiele korzyści dla deweloperów, wydawców, jak i czytelników, podobnie; zarówno ludzkie, jak i mechaniczne.
Pojęcia RDF (te, które warto oszczędzić) można bezboleśnie zmapować (i faktycznie są jawnie zmapowane) na reprezentacje mikrodanych.
Pozycje mikrodanych pozwalają autorom i systemom obsługi dokumentów wzbogacać komunikację w sposób, który jest dość łatwy (tak prosty jak CSS lub DOM) w obsłudze i dostosowaniu do czytnika.