Dépannage Natalia Analyse
Guide opérationnel des erreurs les plus fréquentes. Chaque entrée renvoie à un code erreur documenté dans la référence complète. Cas non listé ? Contactez [email protected].
Matrice ports & firewall
Référence pour l'équipe réseau. La VM agent n'ouvre jamais de port entrant. Tout est sortant, initié par l'agent.
| Source | Destination | Port | Protocole | Sens | Obligatoire ? |
|---|---|---|---|---|---|
| Agent VM | PBX OXE | 22 |
TCP / SSH | Sortant | OUI (mode OXE) |
| Agent VM | PBX OXO | 443 ou 30443 |
TCP / HTTPS | Sortant | OUI (mode OXO) |
| Agent VM | api.getnatalia.com |
443 |
TCP / HTTPS | Sortant | OUI |
| Aucun port entrant requis sur la VM agent | — | — | — | Bonne pratique sécurité | |
→ Modèle de menace complet dans l'architecture sécurité.
Erreurs opérationnelles par code (NAT-AGT-001 → 010)
Tableau de fix rapide. Référence complète (codes API inclus) : codes erreur.
| Code | Symptôme | Cause | Résolution |
|---|---|---|---|
| NAT-AGT-001 | SCP timeout vers le PBX | Split réseau ou firewall bloquant 22 | Retry auto (backoff exponentiel). Vérifier firewall. |
| NAT-AGT-002 | Licence Taxation absente sur OXE | spadmin -l ne liste pas le paquet account |
Contacter votre intégrateur Alcatel-Lucent |
| NAT-AGT-003 | Permission denied SCP | /etc/shells ou ACL sur /usr4/account/ |
setfacl -R -m u:natalia-collector:r /usr4/account/ |
| NAT-AGT-004 | SSH connection refused | SSH non activé sur l'OXE | netadmin -m → Security → SSH |
| NAT-AGT-005 | /usr4/account path introuvable |
Install OXE non-standard | find /usr -name "TAXA*.DAT" |
| NAT-AGT-006 | JWT OXO expiré | Polling > 60 min (TTL JWT) | Régler le polling à 30 min |
| NAT-AGT-007 | Buffer disque > 80% | API down ou polling trop fréquent | Attendre la reprise API, ou drainer la queue |
| NAT-AGT-008 | Buffer disque > 95% — polling PAUSE | API cloud inaccessible ~3 jours | Restaurer l'API, polling reprend automatiquement |
| NAT-AGT-009 | Mot de passe admin perdu | vTPM absent sur l'hôte | Redéployer une OVA neuve (irrécupérable par conception) |
| NAT-AGT-010 | Parser CDR failed | .DAT non décompressé avant parsing |
gunzip sur l'agent, remettre fichier en queue |
Erreurs SCP OXE — messages shell bruts
Table inverse : message d'erreur shell vers cause racine et fix. Utile pour reproduire l'appel SCP manuellement depuis la VM agent (scp natalia-collector@<IP-OXE>:/usr4/account/...).
| Message d'erreur shell | Cause racine | Résolution |
|---|---|---|
ssh: connect to host ... port 22: Connection refused |
SSH non activé sur l'OXE | netadmin -m → Security → SSH → activer |
Permission denied (publickey,password) |
Login/mot de passe incorrect | Vérifier /etc/passwd + trusted hosts |
scp: No such file or directory |
Licence Taxation absente — aucun fichier .DAT produit | spadmin -l | grep -i account |
scp: ... Permission denied |
ACL restrictive sur /usr4/account/ | setfacl -R -m u:natalia-collector:r /usr4/account/ |
ssh_exchange_identification: Connection closed |
IP agent absente de /etc/hosts.allow sur OXE | Ajouter l'IP de l'agent via netadmin |
Warning: Remote host identification has changed |
OXE remplacé / re-keyé | ssh-keygen -R <OXE-IP> sur la VM agent |
| Connexion OK mais 0 fichier .DAT | Accounting non configuré dans OMC | Vérifier la configuration Accounting dans OMC |
.DAT fichier non parsable |
Binaire compressé lu comme CSV | file TAXA*.DAT puis gunzip |
Comportement buffer & rétention
Comportement de l'agent quand l'API Natalia Cloud est down plusieurs heures/jours
L'agent buffer jusqu'à 3 jours en local et retente avec backoff exponentiel. L'interface web affiche un badge « Synchro retardée » avec le compteur de fichiers en attente. Au-delà de 3 jours, le PBX garde ses tickets (OXE conserve 31 jours dans /usr4/account/), donc aucune donnée perdue même dans le pire cas.
Comportement de l'agent quand son buffer se remplit
Au-delà de 80% disque (NAT-AGT-007), une alerte email part. Au-delà de 95% (NAT-AGT-008), le polling stoppe pour éviter la corruption. La rétention PBX prend le relais jusqu'au retour de la connectivité.
Plus de contexte : le glossaire (SCP, vTPM, JWT, WMC...) ou la référence complète des codes erreur.