Gdzie mogę znaleźć dobry skrypt sprawdzający plagiat? [Zamknięte]


1

Piszę rozprawę do mojego projektu z ostatniego roku i wiem, że niezależnie od tego, co piszę, będą podobieństwa do rzeczy w Internecie oraz w czasopismach naukowych i książkach. Na szczęście większość Google może z łatwością wykorzenić większość z nich, więc znalezienie darmowego skryptu sprawdzającego plagiat nie powinno być zbyt trudne.

Po trochę Googlingu natknąłem się na kilka naprawdę podstawowych kontrolerów, ale większość z nich to albo „podstawowe wersje”, które wymagają zapłaty za skrypt, który faktycznie działa, lub po prostu są ogólnie bezużyteczne. Znalazłem taki, który wydaje się działać dobrze w przypadku małych porcji danych, ale kończy się niepowodzeniem po przekazaniu dużego pliku.

Wszystko, co chcę zrobić, to móc przesłać dokument Word (lub po prostu wpisać tekst, jeśli nie są dostępne żadne opcje przesyłania) i powiedzieć mi, co wydaje się być skopiowane i skąd. Czy ktoś wie o dobrych kontrolerach plagiatu, które można pobrać za darmo lub uruchomić online?

EDYCJA: Aby wyjaśnić moje potrzeby, potrzebuję narzędzia, które może wziąć dokument Word i przeszukać go w całości, aby mógł oznaczyć każde wystąpienie, w którym dokument pasuje do innego dokumentu w Google.


3
Czekaj, teraz jestem zdezorientowany: martwisz się plagiatem we własnej rozprawie? Jeśli nie mówimy o wielu osobowościach, to nie jest to tak naprawdę plagiat, o który się martwisz. Być może martwisz się przypadkowym zapożyczeniem lub zwrotami (zrobiłem to w dokumentach), ale uważne ponowne przeczytanie własnej pracy (i pracy z Twoich źródeł) powinno cię przed tym uchronić.
Telemachus,

Zgodziłbym się, gdyby był to niewielki kawałek pracy, ale poza czystym plagiatem chciałbym takiego narzędzia jako formy kontroli jakości, aby upewnić się, że wszystko, co napisałem, jest własnymi słowami i tonem rozprawy nie różni się między tym, co wiem, a tym, co przeczytałem / sparafrazowałem w pracy naukowej. O wiele łatwiej byłoby pisać wysokiej jakości treści, gdybym wiedział, że to, co piszę, jest legalne, szczególnie gdy źródła zaczynają się montować. Wielu moich profesorów używa oprogramowania instytucji do sprawdzania swoich dokumentów, ale oczywiście nie mam tego luksusu.
Mike B,

1
Może się okazać, że różne narzędzia działają lepiej dla różnych tematów. Wykonano wiele prac badawczo-rozwojowych dotyczących identyfikacji kluczowych fraz dotyczących tematów medycznych (z wieloma terminami medycznymi). Może nie istnieć jedno narzędzie, które będzie działać za każdym razem.
Russell

Wyjaśnię to prosto: Aby sprawdzić plagiaty, chcesz użyć czyjegoś złożonego kodu, zbudowanego kosztem, bez płacenia za to?
Daniel R Hicks

Odpowiedzi:


4

Nie sądzę, że znajdziesz prawdziwe rozwiązanie w postaci skryptu lub darmowej aplikacji. Zastanów się, co chcesz, aby program zrobił: przeczytaj dokument i sprawdź - co? (Publikowane prace innych osób? Wymaga dużej bazy danych opublikowanych dzieł. Wariacja stylistyczna wykraczająca poza pewną normę statystyczną? Wymaga statystycznej normy stylu (prawdopodobnie opartej na słownictwie i długości zdania obliczonej w stosunku do znaczących słów - tj. Odfiltruj) i ”,„ lub ”,„ do ”,„ for ”itd.). Nie są to trywialne wymagania ani coś, co można po prostu ułożyć w kilkaset wierszy | wstaw-swój-skrypt-język-tutaj |.

Wiele szkół korzysta z Turnitin , a wiele szkół korzysta z Google do wyszukiwania opublikowanych prac. Ta metoda jest trafiona lub nieudana z oczywistych powodów. Turnitin nie jest darmowy, a Google to bardzo niedoskonałe rozwiązanie, ale są to dwa rozwiązania, które najczęściej widuję.


1
Google indeksuje wiele książek technicznych, a także wiele wiodących czasopism, więc sam Google prawdopodobnie znalazłby wszystko, czego potrzebuję. Szkoda tylko, że nie wydaje się, aby istniał darmowy program, który poradziłby sobie z czymś takim.
Mike B,

1
Wyodrębnianie fraz kluczowych nie jest nowym obszarem badań i wymaga wiele wysiłku, aby opracować potencjalne rozwiązania. Będą pobierać opłaty, aby otrzymać nagrodę za ich wysiłek, aby pomóc ci rozwiązać problem. ( google.com.au/… )
Russell

2

University of Virginia udostępnia to narzędzie: Copyfind .
Zarówno źródło, jak i plik wykonywalny są dostępne do pobrania.

Ten program sprawdza kolekcję plików dokumentów. Wyodrębnia części tekstowe tych dokumentów i przegląda je pod kątem pasujących słów we frazach o określonej minimalnej długości. Gdy znajdzie dwa pliki, które mają wystarczającą liczbę słów w tych frazach, copyfind generuje pliki raportów HTML. Raporty te zawierają tekst dokumentu z podkreślonymi pasującymi frazami.

Co potrafi copyfind: może znaleźć dokumenty, które dzielą duże ilości tekstu. Ten wynik może wskazywać, że jeden plik jest kopią lub częściową kopią drugiego lub że oba są kopiami lub częściowymi kopiami trzeciego dokumentu.

Czego copyfind nie może zrobić: Nie może wyszukiwać tekstu skopiowanego z jakiegokolwiek zewnętrznego źródła, chyba że umieścisz to zewnętrzne źródło w dokumentach, które przekazujesz copyfind. Działa tylko na danych wyłącznie lokalnych, nie może przeszukiwać Internetu ani Internetu w celu znalezienia pasujących dokumentów. Jeśli podejrzewasz, że zostało skopiowane określone źródło zewnętrzne, musisz utworzyć lokalny dokument zawierający ten materiał zewnętrzny i dołączyć ten dokument do zbioru dokumentów, które przekazujesz do copyfind.

W przypadku czeków internetowych możesz zajrzeć na:
Darmowy internetowy system wykrywania plagiatów, plagiat


1

Jest tu wiele dobrych sugestii, ale ogólny konsensus jest taki, że nie ma narzędzi, które mogłyby zrobić to, co chcę. Mimo to postanowiłem kontynuować korzystanie z podstawowej wersji The Plagiarism Checker . Działa prawie dokładnie tak, jak tego chcę, chociaż aby uzyskać niektóre z lepszych funkcji, musiałbym zapłacić.

To narzędzie korzysta z Google API i bardzo dobrze odnajduje skopiowany tekst. Znalazłem już dwa przypadki, w których napisałem frazy podobne do niektórych artykułów.

Ponieważ inni wymienili kilka innych świetnych przykładów, mogę w końcu napisać własny skrypt, aby robić to, co chcę, ponieważ mam doświadczenie w pracy z Google API i wygląda na to, że jest to najlepszy dostępny skrypt, z niektórymi z tych skryptów i technik są najlepsze do własnych zastosowań.


Zaakceptowałeś własną odpowiedź, która parafrazuje tę z tego, co oferował harrymc? Zamiast przyznać harrymcowi uznanie? Jak ironiczne jest to, że szukasz narzędzia, które pomoże ci dowiedzieć się, kiedy musisz zaoferować kredyt innym.
Bill Nace

1
@BillNace, o czym ty mówisz‽ Co odpowiedź Endera ma wspólnego z Harrym? Czy zawracałeś sobie głowę sprawdzaniem adresów URL / witryn? Oni są zupełnie inni . Czy męczyłeś się czytając tekst odpowiedzi? Gdzie w odpowiedzi Harry'ego coś mówi o interfejsie API Google, który jest wyraźnie widoczny w odpowiedzi Endera?
Synetech

@BillNace Sugeruję sprawdzenie, gdzie prowadzą linki, zanim rzucisz oskarżenia. Zaakceptowałem własną odpowiedź, ponieważ dla sprawdzenia ogólnego plagiatu była to najlepsza opcja poza zamkniętym rozwiązaniem, z którego korzystają uniwersytety.
Mike B

1

Niedawno zbadałem kilka z tych internetowych programów do sprawdzania plagiatu i dowiedziałem się, że większość tych bezpłatnych witryn używa interfejsu API Yahoo do sprawdzania plagiatu w backendie. Chociaż ten przegląd był całkiem dobry, osobiście korzystam z Google, ponieważ wyniki znacznie przewyższają wyniki w witrynach opartych na interfejsie API Yahoo.


0

Plagiarism-Checker autorstwa architshukla na github jest (głównie) otwartym skryptem do sprawdzania plagiatu napisanym (głównie) w pythonie, który reklamowo / rzekomo używa google api do n- gramowego sprawdzania dokumentów.

Nie testowałem tego, ale może mógłbyś to sprawdzić. Jest przeznaczony do pracy w systemach Windows i Linux.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.