Czy istnieje sposób na filtrowanie tabel Wikipedii?


12

Szukam sposobu na filtrowanie tabel często spotykanych w artykułach w Wikipedii, więc mogę porównać tylko te wiersze (i kolumny), które mnie interesują.

Czy tam też jest?

  1. wbudowana funkcja silnika Wikipedii, o której nie wiem
  2. lub wtyczka do przeglądarki, która to obsługuje

Funkcje, o których mogę myśleć to:

  • Filtruj według wartości kolumny
  • Ukryj kolumny
  • Sortowanie wielopoziomowe

Ahhh ... off-topic pole minowe. Patrz punkt 3 w pierwszej tabeli. Proszę o coś konkretnego dla Wikipedii. W rzeczywistości zrobiłby to skrypt Greasemonkey, ale nie był w stanie go znaleźć
pufferfish

Odpowiedzi:


8

Umieszczenie tej formuły w komórce w Arkuszu Google spowoduje zeskrobanie danych tabelarycznych z linku do tego artykułu z Wikipedii: http://en.wikipedia.org/wiki/Demographics_of_India

=IMPORTHTML("http://en.wikipedia.org/wiki/Demographics_of_India", "table", 4)

Gdy znajdziesz dane w Arkuszu Google, możesz filtrować według wartości kolumny (wybierz nagłówek kolumny, wybierz Filtr z menu Dane ) i ukryj kolumnę (wybierz kolumnę, wybierz Ukryj kolumnę z menu kontekstowego)

Zrzut ekranu z Arkuszy Google


1

Stoły Masz na myśli infoboksy? Prawdopodobnie powinieneś użyć Wikidata http://wikidata.org/w/api.php i wyodrębnić stamtąd informacje (będzie czystsze), a następnie przedstawić je tak, jak wolisz.

W przeciwnym razie możesz posypać display: nonewszędzie odpowiednimi identyfikatorami i klasami dla danych tabel, ale będzie to niekończąca się pogoń za nieustrukturyzowanymi informacjami.


1

Filtr Wikipedia Tabela Greasemonkey skrypt robi to, co chcesz:

Podsumowanie skryptu: Filtruje tabele wikipedii, usuwając wszystkie wiersze o niepożądanej wartości lub usuwając określone wiersze i kolumny.

Może być konieczne dodanie httpswersji adresu URL wikiedia do listy filtrów stron zawartych w skrypcie, aby działał.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.