Jestem ciekaw powtarzalnych procedur, które mogą być wykorzystane do odkrywania postaci funkcyjnej funkcji y = f(A, B, C) + error_term, gdzie jest mój tylko wejście jest zbiorem obserwacji ( y, A, Bi C). Należy pamiętać, że funkcjonalna forma fjest nieznana.
Rozważ następujący zestaw danych:
AA BB CC DD EE FF == == == == == == 98 11 66 84 67 10500 71 44 48 12 47 7250 54 28 90 73 95 5463 34 95 15 45 75 2581 56 37 0 79 43 3221 68 79 1 65 9 4721 53 2 90 10 18 3095 38 75 41 97 40 4558 29 99 46 28 96 5336 22 63 27 43 4 2196 4 5 89 78 39 492 10 28 39 59 64 1178 11 59 56 25 5 3418 10 4 79 98 24 431 86 36 84 14 67 10526 80 46 29 96 7 7793 67 71 12 43 3 5411 14 63 2 9 52 368 99 62 56 81 26 13334 56 4 72 65 33 3495 51 40 62 11 52 5178 29 77 80 2 54 7001 42 32 4 17 72 1926 44 45 30 25 5 3360 6 3 65 16 87 288
W tym przykładzie załóżmy, że o tym wiemy FF = f(AA, BB, CC, DD, EE) + error term, ale nie jesteśmy pewni co do formy funkcjonalnej f(...).
Jakiej procedury / jakich metod użyłbyś do znalezienia funkcjonalnej formy f(...)?
(Punkt bonusowy: Jak najlepiej zgadnąć przy fpodaniu powyższych danych? :-) I tak, istnieje „poprawna” odpowiedź, która da R^2ponad 0,99.)
R^2 >= 0.99chciałbym znaleźć tę o najlepszym stosunku wydajności do złożoności (i oczywiście bez dopasowania próbki). Przepraszam, że nie napisałem tej

FFbyła „wydajnością spalania” iAAbyła ilością paliwa iBBbyła ilością tlenu, szukałbyś współdziałającego terminuAAiBB