Това ме мъчи от известно време. ThinkPad машината ми доста прегрява, обаче нямам нужното време, за да я отворя и да сменя пастата. Такова време ще имам едва в края на следващия месец.
Проблемът ми беше, че когато процесорът започне да прегрява, systemd решава да се сети, че съм на лаптоп и съответно да предприеме мерки по изцеряването на машината. Когато все пак се сети, че трябва да намали температурата, едно от странните решения е да рестартира някоя услуга, която харчи много CPU. На лаптопа ми има над 30 контейнера, за чието съществуване не мога да дам добро обяснение. Когато systemd реши да се опита да рестартира lxd, а не да го пребие, както прави oom-killer, в общи линии машината страда извънредно много, като горе-долу така стоят нещата в syslog:
Dec 11 15:09:00 lethe kernel: [24483.428811] mce: CPU1: Core temperature above threshold, cpu clock throttled (total events = 147270)
Dec 11 15:09:00 lethe kernel: [24483.428813] mce: CPU0: Core temperature above threshold, cpu clock throttled (total events = 147459)
Dec 11 15:09:00 lethe kernel: [24483.428815] mce: CPU3: Package temperature above threshold, cpu clock throttled (total events = 263573)
Dec 11 15:09:00 lethe kernel: [24483.428818] mce: CPU4: Package temperature above threshold, cpu clock throttled (total events = 263589)
Dec 11 15:09:00 lethe kernel: [24483.428820] mce: CPU5: Package temperature above threshold, cpu clock throttled (total events = 263737)
Dec 11 15:09:00 lethe kernel: [24483.428821] mce: CPU2: Package temperature above threshold, cpu clock throttled (total events = 263559)
Dec 11 15:09:00 lethe kernel: [24483.428822] mce: CPU0: Package temperature above threshold, cpu clock throttled (total events = 263735)
Dec 11 15:09:00 lethe kernel: [24483.428824] mce: CPU6: Package temperature above threshold, cpu clock throttled (total events = 263736)
Dec 11 15:09:00 lethe kernel: [24483.428826] mce: CPU7: Package temperature above threshold, cpu clock throttled (total events = 263740)
Dec 11 15:09:00 lethe kernel: [24483.428828] mce: CPU1: Package temperature above threshold, cpu clock throttled (total events = 263546)
Dec 11 15:09:00 lethe kernel: [24483.430796] mce: CPU0: Core temperature/speed normal
Dec 11 15:09:00 lethe kernel: [24483.430797] mce: CPU1: Core temperature/speed normal
Dec 11 15:09:00 lethe kernel: [24483.430799] mce: CPU3: Package temperature/speed normal
Dec 11 15:09:00 lethe kernel: [24483.430801] mce: CPU6: Package temperature/speed normal
Dec 11 15:09:00 lethe kernel: [24483.430802] mce: CPU7: Package temperature/speed normal
Dec 11 15:09:00 lethe kernel: [24483.430804] mce: CPU5: Package temperature/speed normal
Dec 11 15:09:00 lethe kernel: [24483.430805] mce: CPU4: Package temperature/speed normal
Dec 11 15:09:00 lethe kernel: [24483.430806] mce: CPU2: Package temperature/speed normal
Dec 11 15:09:00 lethe kernel: [24483.430807] mce: CPU1: Package temperature/speed normal
Dec 11 15:09:00 lethe kernel: [24483.430808] mce: CPU0: Package temperature/speed normal
Dec 11 15:09:00 lethe systemd[1]: Starting Laptop Mode Tools - Battery Polling Service...
Dec 11 15:09:00 lethe systemd[1]: Starting Clean php session files...
Dec 11 15:09:00 lethe systemd[1]: Starting Service for snap application lxdmosaic.lxdmosaic-cron...
Dec 11 15:09:00 lethe systemd[1]: Reloading Laptop Mode Tools.
Dec 11 15:09:00 lethe systemd[1]: lmt-poll.service: Succeeded.
Dec 11 15:09:00 lethe systemd[1]: Finished Laptop Mode Tools - Battery Polling Service.
Моментът, в който решава да направи рестартиране на lxdmosaic от своя страна води до това да се стартират всички контейнери накуп, а това води до out of memory. Най-грубо казано, всичко стига до забиване на машината.
Ако трябва да съм честен, за първи път седнах да разследвам този проблем, но най-дървеното решение, до което стигнах е да спра laptop-mode.service, понеже така или иначе не смятам, че да се рестартира някакъв service е най-доброто решение.
Leave a Reply