Czy istnieje sposób wyszukiwania w Google za pomocą wyrażeń regularnych (regex)?


60

Byłoby bardzo przydatne, gdyby Google zapewniało wyszukiwanie wyrażeń regularnych .

Czy jest na to sposób?

(OBS: Nie mówię o fałszywych wyrażeń regularnych takich jak site:, filetype:, AND, ORlub "Text". Chciałbym aby wyszukiwać za pomocą wyrażenia regularnego jak .+[]^).

Na przykład, czy istnieje aplikacja, witryna lub narzędzie Google do wyszukiwania takich rzeczy *.stackexchange?

Odpowiedzi:


24

Ta funkcja nie jest dostępna w klasycznej wyszukiwarce Google i nie ma jej w mapie drogowej Google. Możesz dowiedzieć się więcej na ten temat, oglądając film Google. Czy Google wprowadzi możliwość wyszukiwania za pomocą wyrażeń regularnych?

Jest jednak jeden wyjątek. Wyszukiwarka kodów Google obsługuje wyrażenia regularne. Oczywiście cel wyszukiwania dla tej wyszukiwarki tematów jest ograniczony do samego kodu źródłowego.

Warto wspomnieć, że niektóre słowa kluczowe wyszukiwania Google mogą częściowo zastąpić wyrażenia regularne. Na przykład, jeśli chcesz wyszukać dowolną dwuliterową odmianę „szukaj TERM”, możesz użyć operatora wieloznacznego.

search *

znajdzie wyniki wyszukiwania i każdego innego (jednego) słowa. Często używam go do sprawdzania podstawowych zasad gramatyki angielskiej lub synonimów (np. „Tak łatwe jak *” ).



Ta odpowiedź jest teraz nieco nieaktualna: zobacz tę odpowiedź na przykład wyszukiwania wyrażeń regularnych w Google.
Anderson Green,

11

Wyszukiwarka Google może zwracać dopasowania niektórych prostych wyrażeń regularnych. Na przykład zapytanie wyszukiwania

"(gray|red) (wolf|fox)"

wydaje się być równoważny z

("gray wolf" OR "red fox" OR "red wolf" OR "gray fox")

Możesz zobaczyć wynik tego zapytania wyszukiwania tutaj .


Szukam nazwy leku lub substancji chemicznej. Mogę przeczytać „heme ?? llnate” - gdzie znaki zapytania są nieczytelne. Google nie może pomóc.
SDsolar,


5

Możesz napisać oprogramowanie do:

  1. Weź słowa kluczowe z wyrażenia regularnego;
  2. Google słowa kluczowe i uzyskać listę wyników;
  3. Przeszukuj każdy wynikowy identyfikator URI i filtruj go za pomocą pełnego wyrażenia regularnego.

Przeanalizujmy przypadek: site:gog.comznajdź wszystkie gry, które mają głos w języku hiszpańskim.

Wyrażenie regularne to:

Audio[^:]*:[^.,]*Spanish

Będzie pasować, na przykład:

Audio lanuage: English, German, Spanish, French.

I nie pasują:

Audio language: only-English. Text language: Spanish.

Krok 1. Pozwól oprogramowaniu przeszukać to w Google:

site:gog.com audio Spanish inurl:game

inurl:game oznacza to wyszukiwanie tylko na stronach z opisem gry

Krok 2. Zdobądź 300 powstałych linków i zaindeksuj do każdego z nich.

Krok 3. Filtruj wynik według podanego wyrażenia regularnego:

Audio[^:]*:[^.,]*Spanish

To powinno być łatwe do zbudowania. W rzeczywistości nie rozumiem, dlaczego nie mogłem znaleźć czegoś, co jest już zbudowane w ten sposób.

Ponieważ wyszukiwarki nie mogą sobie pozwolić na zasób do skanowania swoich danych za pomocą wyrażeń regularnych, ta brudna robota spada na twoją stronę, a twój komputer powinien to zrobić za pomocą tego, co już zapewniają wyszukiwarki.


+1. Wielkie dzięki. W rzeczywistości jest to bardzo interesujący pomysł. Głównym problemem jest to, że prawdopodobnie będziemy potrzebować klastrów o wysokiej wydajności, aby zrobić coś naprawdę interesującego.
GarouDan

Heh, piszę teraz to rozszerzenie.
Navin

4

Nie, niestety nie :(. Teoretycznie możesz stworzyć własną wyszukiwarkę i to zrobić, ale byłoby to dość trudne.


1

Tylko dla odniesienia, pomoc Google na temat operatorów wyszukiwania jest tutaj .

Co ciekawe, „-” jest nadal operatorem wykluczania słów, ale usunęli „+” jako operatora, używanego w przeszłości, aby wymagać określonego wyszukiwanego hasła. Najwyraźniej „Operator + został wycofany, gdy uruchomiono Google+, ponieważ + był potrzebny jako postać, którą można przeszukiwać, a nie jako operator.” ( Https://support.google.com/websearch/answer/2466433 )




-3

Jeśli znasz VBA, możesz napisać kod, aby pobrać dane z Internetu do Excela. Prowadzę program dzień i noc i mogę uzyskać miliony wyników. Następnie możesz odfiltrować te wyniki.


2
o Boże ... wybacz nam nasze grzechy
beppe9000,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.