Pytania otagowane jako dataset

Żądania dotyczące zestawów danych są w tej witrynie nie na temat. Użyj tego znacznika do pytań dotyczących tworzenia, przetwarzania lub utrzymywania zestawów danych.

2
Wytyczne dotyczące zapewniania jakości i kontroli jakości (QA / QC) dla bazy danych
tło Nadzoruję wprowadzanie danych z literatury podstawowej do bazy danych . Proces wprowadzania danych jest podatny na błędy, szczególnie dlatego, że użytkownicy muszą interpretować projekt eksperymentalny, wyodrębniać dane z grafiki i tabel oraz przekształcać wyniki w znormalizowane jednostki. Dane są wprowadzane do bazy danych MySQL przez interfejs sieciowy. Dotychczas uwzględniono …

10
Zestawy danych w sieciach społecznościowych
Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Szukam zestawów danych sieci społecznościowych (Twitter, Friendfeed, Facebook, Lastfm itp.) Do zadań klasyfikacyjnych, najlepiej w formacie ARFF. Moje wyszukiwania za pośrednictwem UCI i Google jak …

2
Obliczanie 95. percentyla: porównanie podejść do rozkładu normalnego, R Quantile i Excela
Próbowałem obliczyć 95 percentyl na podstawie następującego zestawu danych. Natknąłem się na kilka internetowych odniesień do robienia tego. Podejście 1: na podstawie danych przykładowych Pierwszy mówi mi, w celu otrzymania TOP 95 Percentzbioru danych, a następnie wybierz MINlub AVGotrzymanego zestawu. Robienie tego dla następującego zestawu danych daje mi: AVG: 29162 …
17 r  dataset  quantiles  sql 

6
Gdzie znaleźć duży korpus tekstowy? [Zamknięte]
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 6 lat temu . Szukam dużego (> 1000) korpusu tekstu do pobrania. Najlepiej z wiadomościami ze świata lub raportami . Znalazłem tylko jednego z patentami. …
16 dataset 

5
Jaki wpływ ma zwiększenie danych treningowych na ogólną dokładność systemu?
Czy ktoś może podsumować dla mnie możliwe przykłady, w jakich sytuacjach zwiększenie danych treningowych poprawia cały system? Kiedy wykrywamy, że dodanie większej ilości danych treningowych może nadmiernie dopasować dane i nie dać dokładności danych testowych? To bardzo niespecyficzne pytanie, ale jeśli chcesz odpowiedzieć na konkretne pytanie w konkretnej sytuacji, zrób …


5
Czy lepiej jest przeprowadzać eksploracyjną analizę danych tylko w zestawie danych szkoleniowych?
Wykonuję eksploracyjną analizę danych (EDA) na zbiorze danych. Następnie wybiorę niektóre funkcje, aby przewidzieć zmienną zależną. Pytanie brzmi: czy powinienem wykonywać EDA tylko na moim zestawie danych szkoleniowych? A może powinienem dołączyć do zestawu danych szkoleniowych i testowych, a następnie wykonać na nich EDA i wybrać funkcje oparte na tej …

4
Darmowy hosting danych w interesie publicznym? [Zamknięte]
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 4 lata temu . Mam raporty godzinowe i dzienne temperatury dla wielu stacji na stronie http://data.barrycarter.info/ Zachęcam ludzi do pobrania, ale przy 6.6G zużywa dużo …
14 dataset 

3
Jak przeprowadzić rozbudowę danych i rozdzielić walidację pociągu?
Dokonuję klasyfikacji obrazów przy użyciu uczenia maszynowego. Załóżmy, że mam pewne dane treningowe (obrazy) i podzielę dane na zestawy szkoleniowe i walidacyjne. Chcę też rozszerzyć dane (tworzyć nowe obrazy z oryginalnych) przez losowe obroty i wstrzykiwanie szumu. Augmentacja odbywa się offline. Jaki jest właściwy sposób na powiększanie danych? Najpierw podziel …

6
Szybkie sposoby w R, aby uzyskać pierwszy wiersz ramki danych pogrupowany według identyfikatora [zamknięty]
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 2 lata temu . Czasami muszę uzyskać tylko pierwszy wiersz zestawu danych pogrupowany według identyfikatora, tak jak przy pobieraniu wieku i płci, gdy na osobę …
14 r  dataset  aggregation  plyr 

2
Jak pasuje k-krotnie walidacja krzyżowa w kontekście zestawów szkoleniowych / walidacyjnych / testowych?
Moje główne pytanie dotyczy prób zrozumienia, w jaki sposób k-krotna walidacja krzyżowa pasuje w kontekście posiadania zestawów szkoleniowych / walidacyjnych / testowych (jeśli w ogóle pasuje w takim kontekście). Zwykle ludzie mówią o podziale danych na zestaw treningowy, walidacyjny i testowy - powiedzmy w stosunku 60/20/20 na kurs Andrew Ng …



4
Oddzielenie dwóch populacji od próbki
Próbuję oddzielić dwie grupy wartości od jednego zestawu danych. Mogę założyć, że jedna z populacji jest normalnie rozmieszczona i ma co najmniej połowę wielkości próbki. Wartości drugiego są zarówno niższe, jak i wyższe niż wartości pierwszego (rozkład jest nieznany). Staram się znaleźć górne i dolne granice, które obejmowałyby normalnie rozłożoną …

4
Najlepsze sposoby na agregację i analizę danych
Niedawno zacząłem uczyć się uczenia maszynowego i analizy danych. Uderzam w ścianę z powodu potrzeby tworzenia i wyszukiwania dużych zestawów danych. Chciałbym pobrać dane, które gromadzę w życiu zawodowym i osobistym, i przeanalizować je, ale nie jestem pewien, jak najlepiej wykonać następujące czynności: Jak powinienem przechowywać te dane? Przewyższać? SQL? …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.