Dépannage Natalia Analyse

Guide opérationnel des erreurs les plus fréquentes. Chaque entrée renvoie à un code erreur documenté dans la référence complète. Cas non listé ? Contactez [email protected].

Matrice ports & firewall

Référence pour l'équipe réseau. La VM agent n'ouvre jamais de port entrant. Tout est sortant, initié par l'agent.

Source Destination Port Protocole Sens Obligatoire ?
Agent VM PBX OXE 22 TCP / SSH Sortant OUI (mode OXE)
Agent VM PBX OXO 443 ou 30443 TCP / HTTPS Sortant OUI (mode OXO)
Agent VM api.getnatalia.com 443 TCP / HTTPS Sortant OUI
Aucun port entrant requis sur la VM agent Bonne pratique sécurité

→ Modèle de menace complet dans l'architecture sécurité.

Erreurs opérationnelles par code (NAT-AGT-001 → 010)

Tableau de fix rapide. Référence complète (codes API inclus) : codes erreur.

Code Symptôme Cause Résolution
NAT-AGT-001 SCP timeout vers le PBX Split réseau ou firewall bloquant 22 Retry auto (backoff exponentiel). Vérifier firewall.
NAT-AGT-002 Licence Taxation absente sur OXE spadmin -l ne liste pas le paquet account Contacter votre intégrateur Alcatel-Lucent
NAT-AGT-003 Permission denied SCP /etc/shells ou ACL sur /usr4/account/ setfacl -R -m u:natalia-collector:r /usr4/account/
NAT-AGT-004 SSH connection refused SSH non activé sur l'OXE netadmin -m → Security → SSH
NAT-AGT-005 /usr4/account path introuvable Install OXE non-standard find /usr -name "TAXA*.DAT"
NAT-AGT-006 JWT OXO expiré Polling > 60 min (TTL JWT) Régler le polling à 30 min
NAT-AGT-007 Buffer disque > 80% API down ou polling trop fréquent Attendre la reprise API, ou drainer la queue
NAT-AGT-008 Buffer disque > 95% — polling PAUSE API cloud inaccessible ~3 jours Restaurer l'API, polling reprend automatiquement
NAT-AGT-009 Mot de passe admin perdu vTPM absent sur l'hôte Redéployer une OVA neuve (irrécupérable par conception)
NAT-AGT-010 Parser CDR failed .DAT non décompressé avant parsing gunzip sur l'agent, remettre fichier en queue

Erreurs SCP OXE — messages shell bruts

Table inverse : message d'erreur shell vers cause racine et fix. Utile pour reproduire l'appel SCP manuellement depuis la VM agent (scp natalia-collector@<IP-OXE>:/usr4/account/...).

Message d'erreur shell Cause racine Résolution
ssh: connect to host ... port 22: Connection refused SSH non activé sur l'OXE netadmin -m → Security → SSH → activer
Permission denied (publickey,password) Login/mot de passe incorrect Vérifier /etc/passwd + trusted hosts
scp: No such file or directory Licence Taxation absente — aucun fichier .DAT produit spadmin -l | grep -i account
scp: ... Permission denied ACL restrictive sur /usr4/account/ setfacl -R -m u:natalia-collector:r /usr4/account/
ssh_exchange_identification: Connection closed IP agent absente de /etc/hosts.allow sur OXE Ajouter l'IP de l'agent via netadmin
Warning: Remote host identification has changed OXE remplacé / re-keyé ssh-keygen -R <OXE-IP> sur la VM agent
Connexion OK mais 0 fichier .DAT Accounting non configuré dans OMC Vérifier la configuration Accounting dans OMC
.DAT fichier non parsable Binaire compressé lu comme CSV file TAXA*.DAT puis gunzip

Comportement buffer & rétention

Comportement de l'agent quand l'API Natalia Cloud est down plusieurs heures/jours

L'agent buffer jusqu'à 3 jours en local et retente avec backoff exponentiel. L'interface web affiche un badge « Synchro retardée » avec le compteur de fichiers en attente. Au-delà de 3 jours, le PBX garde ses tickets (OXE conserve 31 jours dans /usr4/account/), donc aucune donnée perdue même dans le pire cas.

Comportement de l'agent quand son buffer se remplit

Au-delà de 80% disque (NAT-AGT-007), une alerte email part. Au-delà de 95% (NAT-AGT-008), le polling stoppe pour éviter la corruption. La rétention PBX prend le relais jusqu'au retour de la connectivité.

Plus de contexte : le glossaire (SCP, vTPM, JWT, WMC...) ou la référence complète des codes erreur.

Dernière mise à jour :

Suggérer une modification