Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 16/03/2011, à 19:29

libfy

Ubuntu 64 Server

Bonsoir à tous,

un petit souci qui en devient un énorme dès lors qu'il apparaît : sur des serveurs Dell PE1950 ou R310, j'ai des Ubuntu Server 64 qui tournent.

Ils nous servent d'Appliances "maison" gérant une multitude de services : FW, VPN, Routage, etc...

Depuis le passage en Ubuntu Server 64 LTS (nous étions en Debian pure avant), nous rencontrons un très gros problème avec un process qui se nomme ksoftirqd.
Dès lors qu'un transfert de fichier est initié via l'un des tunnels VPN gérés par racoon, ce process monte à 100% de CPU, et écroule l'appliance : plus personne ne peut travailler correctement.

Ce point est totalement bloquant.

J'ai recompilé le keepalived car je pensais que c'était lui.
J'ai cherché du côté des cartes réseau (Broadcom) en basculant certains VLAN concernés par la connexion VPN sur des cartes Intel.

Racoon tourne parfaitement pour une multitude de connexion sur la même machine, mais dès lors qu'une activité réseau importante est générée dans le tunnel, ksoftirqd passe à 100% et plombe tout.
Pour info, la même config, à la ligne près, ne pose aucun souci avec une Debian Sarge ! :-(

Mon ami google ne m'a pas donné grand'chose.

Si vous aviez une piste, ça m'aiderait beaucoup...

Librement,

Libfy !
Alors peut-être


Librement,
Libfy
_______________________________________________________
"Il vaut mieux mobiliser son intelligence sur des conneries, que mobiliser sa connerie sur des choses intelligentes"

Hors ligne

#2 Le 16/03/2011, à 19:34

Frédéric Stemmelin

Re : Ubuntu 64 Server

Je ne connais pas ce processus, mais le nom me fait penser à un daemon du kernel. C'est donc lié à ton noyau.
Il doit surement y avoir de la doc dans les sources de ton noyau, sources qu'il faudra peut-être installer.

Voici un thread intéressant:

http://forum.ubuntu-fr.org/viewtopic.php?id=315505&p=1

Ce serait un pb lié au matériel non reconnu et/ou à l'acpi ...

Dernière modification par Frédéric Stemmelin (Le 16/03/2011, à 19:46)

Hors ligne

#3 Le 16/03/2011, à 20:45

libfy

Re : Ubuntu 64 Server

Merci Frédéric,

j'avais déjà vu ce thread...

Mais mon problème n'est pas régulier... Loin de là... L'appliance peut être très calme pendant des heures durant...
Mais dès que le trafic à travers le tunnel VPN devient trop important, le process prend 100% du CPU...

Un détail supplémentaire qui est assez troublant (rapport ou pas...)

un tcpdump -ni any balance des infos bizarres :

20:38:49.421547 IP 10.83.169.13.445 > 10.84.21.225.1071: Flags [P.], seq 3737:3776, ack 4408, win 65535, length 39WARNING: Short packet. Try increasing the snap length by 3
SMB PACKET: SMBntcreateX (REPLY)

20:38:49.421551 Out 84:2b:2b:5c:01:09 ethertype Unknown (0x0228), length 99:
        0x0000:  0000 0800 4500 004f 71e7 4000 7d06 b82c  ....E..Oq.@.}..,
        0x0010:  0a53 a90d 0a54 15e1 01bd 042f a9f0 0558  .S...T...../...X
        0x0020:  207f 9df1 5018 ffff fcb0 0000 0000 0023  ....P..........#
        0x0030:  ff53 4d42 a23a 0000 c098 07c8 0000 0000  .SMB.:..........
        0x0040:  0000 0000 0000 0000 0118 f00f 0328 c015  .............(..
20:38:49.421889  In 00:02:55:7b:08:00 ethertype Unknown (0x238a), length 132:
        0x0000:  0000 0800 4500 0070 6278 4000 8006 6094  ....E..pbx@...`.
        0x0010:  0a64 1214 0a54 10b0 01bd 0423 4097 24f3  .d...T.....#@.$.
        0x0020:  5319 5b2e 5018 fa6f e45c 0000 0000 0044  S.[.P..o.\.....D
        0x0030:  ff53 4d42 3200 0000 0098 07c8 0000 89f7  .SMB2...........
        0x0040:  0bef 12ef 646a 0000 0450 1809 0390 06e3  ....dj...P......

Alors qu'un tcpdump -ni eth0.103 (par exemple) :
# tcpdump -ni eth0.103 not vrrp and not ah
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on eth0.103, link-type EN10MB (Ethernet), capture size 96 bytes
20:39:57.455505 IP 195.6.12x.xxx.3027 > 192.19x.xx9.37.500: isakmp:
20:39:57.471916 IP 192.19x.xxx.500 > 195.6.xxx.x00.3027: isakmp: phase 2/others ? inf[E]
20:39:58.075068 IP 195.6.1xx.xxx > 21x.xxx.x.x12: ESP(spi=0x327f217a,seq=0x703), length 100

Dernière modification par libfy (Le 16/03/2011, à 20:45)


Librement,
Libfy
_______________________________________________________
"Il vaut mieux mobiliser son intelligence sur des conneries, que mobiliser sa connerie sur des choses intelligentes"

Hors ligne

#4 Le 16/03/2011, à 21:48

Frédéric Stemmelin

Re : Ubuntu 64 Server

Ok, la cause semble quand même être une saturation à cause d'interruptions trop fréquentes.

Tu pourrais par exemple désactiver dans le BIOS tout ce qui n'est pas nécessaire au fonctionnement du serveur (pot infra-rouge, port série, etc ... pour libérer des irq).
Tu pourrais aussi installer le paquet irqbalance pour répartir les irq sur les différents cores du cpu.

Normalement il semble y avoir un tel process par core, donc si tu as un cpu multi-cœurs seul un cœur devrait être touché ?
Tu pourrais aussi changer de carte réseau et ne pas utiliser la carte réseau intégrée à la carte mère. Tu peux aussi voir sur le schéma de la carte mère pour ne pas partager le port PCI avec un autre périphérique comme le contrôleur disque, pour que la carte réseau ait son irq propre.

Une carte réseau typé serveur peut aussi faire du TCP offload, à voir.
Il existe aussi un truc dans le BIOS appelé NMI, non masquable interrupt, à voir.

Tu peux aussi regarder du coté tuning du noyau, avec des fichiers du style /etc/sysctl.conf

Voila les quelques pistes que j'avais. J'ai pas plus de temps pour creuser le sujet malheureusement.

Hors ligne

#5 Le 16/03/2011, à 21:59

libfy

Re : Ubuntu 64 Server

Merci pour les pistes et le temps que tu m'as consacré...

Je vais checker ça asap et faire un retour !!!

Merci


Librement,
Libfy
_______________________________________________________
"Il vaut mieux mobiliser son intelligence sur des conneries, que mobiliser sa connerie sur des choses intelligentes"

Hors ligne