Laptop działa o około 30 ° cieplej niż normalnie; Procesor / obciążenie jest podobno normalne. Co może to powodować i jak mogę to zdiagnozować?


10

Korzystam z najnowszego Arch Linuxa na moim laptopie ThinkPad t420 i mam sporadyczny problem z wysoką temperaturą, w którym moja temperatura wzrośnie z typowego ~ 45 ° C do ~ 75-90 ° C i pozostanie tam do momentu ponownego uruchomienia.

Zabrakło mi kilka narzędzi diagnostycznych, w tym oczywiste htopi innym, że googling zasugerował, w tym powertop, iostatsi na pewno inni nie pamietam. Do tej pory nie znalazłem żadnych oczywistych problemów i pozornie żadnych różnic w odczytach, czy moja maszyna działa normalnie, czy w tym gorącym stanie.

Zabiłem też najbardziej podejrzane procesy jeden po drugim (bazy danych i inne demony), mając nadzieję na znalezienie ukrytego winowajcy, bezskutecznie.

Poza tymi próbami nie wiem od czego zacząć rozwiązywanie problemów . Mam nadzieję, że ktoś wskaże mi właściwy kierunek, aby zacząć szukać głębszego problemu.

Mówiąc ściślej, moje pytanie nie dotyczy tego, jak schłodzić moją maszynę, ale co może spowodować stałą zmianę temperatury o ponad 30 stopni w systemie, w którym (podobno) procesor i obciążenie są normalne? I jakich narzędzi / praktyk mogę użyć do zdiagnozowania?

Kilka notatek, które mogą być pomocne:

  • I może chłodzić system (np poprzez odłączenie sterowania wentylatora całkowicie), ale natychmiast nagrzewa się ponownie, jeśli sam. Wydaje się to sugerować, że zatrzymywanie ciepła nie jest problemem, ale raczej coś ciągle wytwarza ciepło.
  • Wykorzystanie i obciążenie procesora są zgłaszane htopnormalnie po przejściu w ten gorący stan. Obejmuje to wątki jądra. Zgodnie z tym htop, system jest w zasadzie bezczynny (użycie procesora w całym systemie 1-2%, obciążenie 0,10).
  • Moje urządzenie korzysta ze zintegrowanej grafiki Intel HD i nie ma innej karty graficznej . Jak zauważyła @braiam, karta nVidia była opcją dla tego modelu; Nie zdecydowałem się na to.
  • @terdon przywołał ustawienia regulatora procesora. Moje procesory są ustawione napowersave
  • Mój konkretny procesor to 2,7 GHz Core i7-2620M.

Edycja : W chwili pisania tego pytania mój fancontrol nie działał poprawnie i działał nieprzerwanie przy średnim zakresie obrotów (3900 RPM), nawet w wysokich temperaturach. Na sugestie @Alex i @JustDanyul zostało to naprawione. Jednak podstawowy problem nadal pozostaje.


1
Jak sugeruje slm, jeśli procesor jest bezczynny, ale temperatura rdzenia jest zbyt wysoka, jedynym możliwym wyjaśnieniem jest to, że nadmiar ciepła nie został rozproszony po pewnym zdarzeniu - jedyną rzeczą, która może wytwarzać znaczne ciepło, jest procesor. Pomyśl o włączeniu pełnego palnika kuchennego, aby zagotować trochę wody, a następnie nałożeniu na niego pokrywki i obniżeniu palnika do niskiego poziomu: woda ciągle gotuje się, ponieważ ciepło nie może rozproszyć się tak szybko, jak niski palnik zastępuje ją tak długo, jak pokrywa jest włączony . Rozłóż go na części i oczyść, jeśli jest tak źle, po prostu dmuchanie powietrza prawdopodobnie nie pomoże w tym momencie.
goldilocks,

Zdecydowanie rozłożę go na części i wyczyszczę, ponieważ podejrzewam, że mam pewne problemy z przepływem powietrza, ale ponieważ tak jest, procesor będzie utrzymywał stałą wysoką temperaturę przez czas nieokreślony po jakimkolwiek zdarzeniu, które spowoduje ekstremalną zmianę temperatury. Nawet jeśli pozostawisz pokrywkę na garnku, temperatura wody spadnie w pewnym momencie. Moja temperatura uderza w liczbę i po prostu pozostaje tam, konsekwentnie pod tym numerem, na zawsze, dopóki nie uruchomię się ponownie. Nie ma stopniowego wytwarzania ciepła, które sugerowałoby problemy z rozpraszaniem. Cały ranek pracowałem pod pełnym obciążeniem i siedzę w 41 stopniach.
liczby1311407,

Innymi słowy, moja temperatura będzie się normalnie regulować pod oczekiwanym obciążeniem. Jeśli robię trochę trudnej kompilacji, może nagrzewać się do 60, 70 stopni, ale kiedy to się skończy, ostygnie.
liczby1311407,

Oprócz wentylatora możesz ponownie zastosować pastę termiczną. Tańsza pasta termiczna z czasem się rozproszy.
BlueRaja - Danny Pflughoeft

1
Być może jest to głupie pytanie, ale czy przypadkiem wyłączyłeś ACPI? Miałem podobne problemy ze starym komputerem, który nie uruchomił się z włączoną tą opcją, po wyłączeniu go w końcu się uruchomił, ale również się przegrzał.
Alko,

Odpowiedzi:


6

Wentylator

Mój też to robi, uruchamiając Fedorę 14. Spróbuj zdobyć sprężoną puszkę powietrza i wydmuchać otwory wentylacyjne z tyłu i z boku obudowy.

Również okresowo będziesz chciał usunąć klawiaturę i wydmuchać sprężone powietrze bezpośrednio na łopatki wentylatora. Oblepiają się pyłem i zaczynają wpływać na jego skuteczność, obciążając go.

Najlepsze w Thinkpadach są instrukcje serwisowe! Pokazują, jak zniszczyć laptopa i złożyć go z powrotem.

Zły proces

Inną rzeczą, którą zauważyłem, jest to, że od czasu do czasu mam proces, który nie działa prawidłowo i zużywa 100% jednego z rdzeni. Zabicie tego procesu zwykle przywraca temperaturę do normy.

Możesz użyć htoplub, topaby zobaczyć, jaki to proces i zabić go z ich lub z terminala, używając go PID.

co jeszcze?

Zobacz moją odpowiedź na te pytania i odpowiedzi dotyczące U&L, aby uzyskać więcej wskazówek na temat uzyskiwania odczytów temperatury dla różnych komponentów laptopa. Pytania i odpowiedzi są zatytułowane: Jak uzyskać temperaturę rdzenia rdzeni haswell i7 w i3status .


To zdecydowanie coś, co powinienem zrobić, ale dziwne dla mnie jest to, że czasami przechodzi w stan gorący i utrzymuje się aż do ponownego uruchomienia, co natychmiast rozwiązuje problem. Wygląda na to, że coś się dzieje, co powoduje utrzymującą się zmianę temperatury. Uruchomiłem htop bezskutecznie. Użycie procesora jest normalne.
numery1311407,

Może niektóre sygnały budzą się w jądrze?
Braiam

1
@slm dzięki, nie próbowałem tego. Zrobię to następnym razem, gdy zacznie działać na gorąco i podam wyniki.
numery1311407,

1
@ numbers1311407: Ponowne uruchomienie może rozwiązać problem, ponieważ powoduje to wyłączenie procesora na kilka sekund, umożliwiając obniżenie temperatury poniżej punktu odcięcia. Procesor jest zawsze gorętszy od otoczenia, niezależnie od tego, jakie jest „otoczenie”.
goldilocks,

1
Pamiętaj, że w toppoleceniu możesz nacisnąć „1”, aby zobaczyć obciążenie poszczególnych rdzeni.
Christian Stewart,

3

To raczej długi komentarz, ale powinieneś rzucić okiem na thinkwiki.org , jest to zasób dla Linuksa na ThinkPadach. Jeśli chodzi o temperaturę, miałem podobne problemy z moim t4500 i rozwiązałem go, bawiąc się

  1. Regulator procesora sterujący skalowaniem częstotliwości procesora. Do wyboru są:

    • Wydajność utrzymuje procesor na najwyższej możliwej częstotliwości
    • Powersave utrzymuje procesor na najniższej możliwej częstotliwości
    • Przestrzeń użytkownika eksportuje dostępne informacje o częstotliwości do poziomu użytkownika (poprzez system plików / sys) i umożliwia kontrolę częstotliwości procesora w przestrzeni użytkownika
    • Ondemand skaluje częstotliwości procesora zgodnie z wykorzystaniem procesora (podobnie jak demony skalujące częstotliwość przestrzeni użytkownika, ale w jądrze)
    • Konserwatywne zachowują się jak na żądanie, ale krok po kroku zwiększają częstotliwość

    W systemie ondemand procesor będzie działał z najwyższą prędkością tylko wtedy, gdy będzie to konieczne. Idealnie byłoby to dla ciebie całkowicie przezroczyste, maszyna będzie po prostu działać tak szybko, jak to konieczne do bieżących zadań. Aby to aktywować, zrób to

    sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
    
  2. Kontrola wentylatora Istnieje bardzo ładne narzędzie o nazwie „ Simple ThinkPad Fan Control ”, które pozwala precyzyjnie dostroić temperatury wyzwalania, które zmieniają prędkość wentylatora. Przejrzyj również informacje tutaj .


Dzięki, to bardzo pomocne. Natknąłem się na tę wiki wcześniej, ale tak naprawdę nigdy nie zauważyłem, co to dokładnie było.
numery1311407,

Dla przypomnienia, wszystkie moje procesory są uruchomionepowersave
liczby 1311407

1

Myślę, że jest problem z tym, co postrzegasz jako „gorące”. Dla Thinkpad t420 ( według forów ) wynosi około 80-85 ° C i pozwala zapomnieć o karcie nVidia, która może również spowodować wzrost temperatury (w rzeczywistości konfiguracja Optimusa może nie działać dobrze, zmuszając procesor do pracy na GPU). Że powiedzmy, maksymalna CPU tolerowane temperatury 100C (jeśli robi się tam zamknięcie systemu wola), a atmosfera jest około 10,0 ° C do 35,0 ° C . To powiedziawszy, jeśli twój laptop jest w zasięgu, wszystko jest w porządku (z wyjątkiem żywotności baterii i laptopa).

Teraz chciałeś wskazać potencjalnych podejrzanych. W tym aspekcie powiedziałbym, że słaba implementacja nVidii z Linuksem może rzucić pracę na twój procesor, który nie pokaże się w htopie (lub gdziekolwiek indziej) z powodu niesławnego systemu Optimus, który wydaje się pasować do twojej obecnej sytuacji ( działa dobrze do momentu, po prostu rozpoczyna ogrzewanie bez kontroli). Powinieneś aktualizować instalację, dopóki Bumblebee nie będzie w pełni skonfigurowany. Możesz użyć karty, bbswitchaby dezaktywować kartę nVidia do woli i zobaczyć, jak idzie.

Aby zainstalować Bumblebee for Arch , możesz znaleźć pakiet w repozytorium. Jeśli nadal go nie zainstalowałeś.


Nie wybrałem karty nVidia na tym komputerze. Przepraszam, powinienem był wyjaśnić to w pytaniu. I chociaż 80-85 nie jest zbyt gorące , wciąż jest cieplejsze niż w połowie lat 40., na co zwykle działa mój komputer przy typowym niewielkim obciążeniu. Mój problem próbuje ustalić, w jakim stanie fantomowym „włącza się” i powoduje, że mój spójny 45 jest spójny 80-85.
numery1311407,

1

czujniki pokazują, że mój wentylator brzęczy przy ~ 3900 RPM

Nawet przy temp. ~ 75-90 ° C?

ponieważ ręczne zwiększenie wentylatora tymczasowo ochłodzi maszynę

Więc jednym problemem jest to, że prędkość wentylatora nie działa automatycznie?

Zapomnij o automacie, możesz poprawnie odczytać temperaturę i ręcznie kontrolować prędkość wentylatora, prawda? Jeśli tak, wszystko, co musisz zrobić, to znaleźć działający skrypt sterujący wentylatorem lub wdrożyć własny (sprawdź temperaturę i ustaw prędkość zgodnie z tabelą temp[i]=speed[i], gdy ustawisz wyższą prędkość, zachowaj ją przez chwilę, nawet jeśli temperatura spadnie , gdy musisz zwolnić prędkość, rób to powoli i krok po kroku).

Jeśli chodzi o ankietę, najlepiej byłoby mieć demona monitorującego temperaturę, który wyzwala zdarzenia zmiany termicznej, i skrypt sterujący wentylatorem nasłuchujący / czekający na te zdarzenia, myślałem (może niesłusznie) raz, acpidale teraz nie wiem.

W obu przypadkach (własny / istniejący skrypt), mimo że nie jesteś pewien rozwiązania, zawsze miej oko na temperaturę i obroty, wentylator nie może się zatrzymać.

autoNajpierw rozwiąż ten problem, a jeśli utrzyma się przegrzanie, możesz skupić się na przyczynie.

edytować

Możesz wypróbować narzędzie, takie jak lttngzbieranie statystyk całego systemu z upływem czasu, ale konfiguracja może być trudna i może być kosztowna pod względem przechowywania, jeśli musisz zbierać przez długi czas.


Masz rację, że mój fancontrol działa słabo, jeśli w ogóle. Zastanowię się, czy nie zareaguje prawidłowo, ale naprawienie go nie rozwiąże podstawowej przyczyny. Mógłbym pozwolić temu na poluzowanie przy maksymalnym 6400 rpms przez cały dzień i trochę się ochłodzić, ale to jest przyczyna, którą próbuję rozwiązać.
numery1311407,

1

Ponieważ ręczne zwiększenie wentylatora rozwiązuje problem, byłoby to doskonałe miejsce do rozpoczęcia rozwiązywania problemów, ponieważ wydaje się to sugerować, że automatyczne sterowanie wentylatorem nie działa.

Teraz uruchamiasz arch Linux, który jest świetną dystrybucją (tak, ja też go uruchamiam) ze wspaniałą wiki. Więc muszę zapytać, czy RTFM? ; p

https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans

O ile widzę, musisz:

  1. włącz moduł jądra thinkpad_acpi
  2. zainstaluj i skonfiguruj aplikację thinkfan z AUR
  3. włącz usługę systemową thinkfan

Czy to wszystko zostało zrobione?

AKTUALIZACJA Cieszę się, że Twój wentylator działa teraz poprawnie, a nie tylko obraca się na szczęśliwym medium. (Rozumiem, że to rozwiązało problem działania twojej maszyny w temperaturach powyżej 80 stopni?)

Jeśli chodzi o odpowiedź na pytanie, jaka jest podstawowa przyczyna zmiany temperatury o 30 stopni, cóż, mam pokusę, aby zapytać: czy nie mogło być tak z powodu faktu, że twój wentylator nie działał poprawnie?

Postulujmy to,

  • procesor nie pracuje ciężej niż normalnie
  • fluktuacje temperatury są teraz zastępowane fluktuacjami prędkości wentylatora

Czy nie byłoby bezpiecznie założyć, że może nie być żadnego problemu i że problem polegał na tym, że wentylator pracował na poziomie, na którym ledwo sobie radził? A małe zmiany temperatury otoczenia itp., Czy przekraczają granice swoich możliwości?

Na przykład miałem laptopa Acer, a w ciepłe dni wentylator „ciągle” wirował w górę iw dół. Założę się, że jeśli mój fan nie byłby w stanie sam się dostosować, widziałbym również dość duże wahania temperatury :)


Właśnie zainstalowałem thinkfan. Dzięki za informacje na ten temat. Tak, szczegółowa arch wiki jest świetnym dodatkiem do dystrybucji. Byłem tam tysiące razy, ale nigdy nie natknąłem się na stronę ani nie pomyślałem o poszukiwaniu strony poświęconej mojemu dokładnemu modelowi i nigdy nie widziałem wspomnianego thinkfan. Miły mały skrypt. To powiedziawszy, to nie rozwiązuje mojego rzeczywistego problemu: jak zdiagnozować przyczynę mojej niezwykle wysokiej temperatury? Nawet jeśli wyłączyłem fancontrol i zwolniłem rzecz przy maksymalnej prędkości obrotowej, to tylko stawia bandaidę na prawdziwym problemie tajemniczego upału.
numery1311407,

Nie, problem nadal istnieje bez zmian. Siedzę tutaj teraz w 42 stopniach. Kiedy wystąpi mój stan cieplny, będę uruchamiał te same procesy, otoczenie będzie równoważne, nic pozornie się nie zmieni, ale moja temperatura wzrośnie z konsekwentnego 42 do spójnego 75+. Mogę to ochłodzić: załóż ją na lodówkę laptopa, wyłącz fancontrol, pozwalając na obracanie się z prędkością 6500 RPM itp. Ale jeśli przestanę, nagrzeje się z powrotem do 75+. Wentylator przy maksymalnej prędkości jest tylko trochę szybszy niż i tak. Naprawienie tego było dobrą rzeczą, ale nie rozwiązaniem podstawowego problemu.
numery1311407,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.