#1 Le 30/12/2012, à 14:27
- Compte anonymisé
Limite de température du CPU puis Kernel Panic
Bonjour.
J'ai Ubuntu Server 10.04 sur mon serveur, avec un noyau compilé fraichement à la main (3.7.1). Mais c'est bizarre, quand je stresse mon CPU, sa température plafonne à 70°C, et après un certain temps j'ai un Kernel Panic.
Je ne comprends pas trop d'où vient cette limite de température... Vu que le processeur est physiquement capable de monter à 100°C. Donc ça me bloque pendant mon OC.
Puis le PWM n'est pas super efficace, le ventilateur mouline à 2200tr/min maximum, alors qu'il est capable de monter à 4000tr/min. J'ai pourtant bien activé le support du PWM dans le noyau.
Est-ce que c'est un paramètre dans le noyau dont je suis passé à côté, ou bien s'agit-il d'autre chose ?
Merci d'avance, bonne journée.
Dernière modification par X0rg (Le 30/12/2012, à 14:28)
#2 Le 30/12/2012, à 15:04
- JLK
Re : Limite de température du CPU puis Kernel Panic
Salut.
Que se passe-t-il quand tu remets le noyau d'origine ?
Il est possible qu'un processus prenne 100% des ressources CPU... Repère avec la commande top (ou htop si tu l'as déjà installé).
Dernière modification par JLK (Le 30/12/2012, à 15:06)
Hors ligne
#3 Le 30/12/2012, à 19:53
- Compte anonymisé
Re : Limite de température du CPU puis Kernel Panic
Idem avec le noyau d'origine.
Oui, normal que le CPU soit utilisé à 100%, c'est le principe même du stress : tester la stabilité du CPU en lui en demandant un maximum.
#4 Le 30/12/2012, à 21:38
- JLK
Re : Limite de température du CPU puis Kernel Panic
Attends une minute : tu fais tourner ta machine à fond en utilisant un processus genre boinc qui utilise 100% du CPU ? Dans ce cas, ce n'est pas étonnant que l'ordinateur chauffe... Pour le kernel panic, je ne sais pas si c'est lié à la température, parce que les CPU supportent des températures supérieures à 70°C...
Hors ligne
#5 Le 30/12/2012, à 22:07
- Compte anonymisé
Re : Limite de température du CPU puis Kernel Panic
L'idée est là oui : une commande placée dans un script monopolise le processeur et l'utilise à 100% pendant une heure. C'est la commande "stress" d'ailleurs. Le but c'est simplement de torturer le processeur, de le faire calculer et donc de le faire chauffer à mort, pour simplifier.
Ensuite deux cas :
- au bout d'une heure, la machine est toujours OP, le test à réussis, donc la machine est stable.
- avant l'heure, le test s'est arrêté, suite à un Kernel Panic par exemple, ce qui prouve que la machine n'est pas stable. Dans ce cas, on peut augmenter le vCore, ou diminuer la fréquence du CPU, ou bien moi j'essaye de comprendre pourquoi j'ai ce Kernel Panic et comment faire pour ne plus l'avoir.
En fait, ce n'est pas la température du CPU qui me pose problème, loin de là, c'est ce Kernel Panic assez étrange, d'ailleurs je ne sais même pas si c'est un Kernel Panic, ça ressemble à ça mon erreur :
[ 212.736012] [<c1xxxxxxx>] ? xxxxxxxxxxxx
BUG: unable top handle kernel NULL pointer dereference at 00000001
IP: [<00000001>] 0x0
*pde = 0000000
Oops: 0000 [#4] SMP
Bref, je ne vais pas tout écrire. Les "x" c'est pour des variables, je tiens à préciser.
Pour faire simple, c'est clairement lié au Kernel et à la température, car si je lance le test normalement, ça va crasher après un petit quart d'heure, alors que si j'arrête manuellement le ventilateur, ça crashe dans la minute, et la température est à peine au dessus de 70°C à ce moment là, alors que le processeur est physiquement capable d'encaisser 100°C (sur du très court terme, bien entendu).
Je sais que mon processeur est chaud, mais c'est un serveur, donc je préfère qu'il chauffe, plutôt qu'il s'arrête sur ce type de message, car ce n'est pas pratique un serveur qui ne répond pas...
#6 Le 31/12/2012, à 00:35
- JLK
Re : Limite de température du CPU puis Kernel Panic
En ayant un serveur qui chauffe, tu limites sa durée de vie, non ?
Hors ligne
#7 Le 31/12/2012, à 01:23
- Compte anonymisé
Re : Limite de température du CPU puis Kernel Panic
Oui, mais c'est pour chez moi... Un serveur de boot PXE sur lequel je fais mes backups, autant dire qu'il tourne moins d'une fois par mois... Mais c'est dommage quand ça crash en pleine sauvegarde.
Dernière modification par X0rg (Le 31/12/2012, à 01:24)