Comment le modèle reste-t-il dans notre périmètre ?
Nous déployons un LLM open-weights sur l'infrastructure que vous contrôlez - vos serveurs, votre VPC ou un environnement air-gapped. Aucun trafic sortant n'est configuré. L'inférence, le fine-tuning et la récupération se font sur des systèmes déjà internes à votre réseau. Nous vous livrons les artefacts ; vous les exploitez.
Et les mises à jour et le ré-entraînement ?
Les mises à jour du modèle sont livrées sous forme d'artefacts signés que votre équipe applique au rythme que vous décidez. Pas de canal d'auto-update, pas de télémétrie, pas de phone-home. Le ré-entraînement tourne sur votre infrastructure, sur vos données - nous ne demandons aucun export.
En quoi est-ce différent de faire tourner ChatGPT dans votre tenant ?
Les modèles hébergés, même en tenant dédié, restent derrière le control plane d'un éditeur. Logs, métadonnées et payloads transitent généralement par l'infrastructure de l'éditeur sous ses CGU. Un déploiement Vectra ne fait transiter aucune de ces données - les fichiers du modèle vivent sur votre disque, l'inférence tourne sur vos CPU/GPU, la piste d'audit vous appartient.
Quels modes de déploiement supportez-vous ?
- On-prem. Inférence sur du matériel que votre équipe possède et patche.
- VPC. Inférence à l'intérieur de votre compte AWS, GCP ou Azure, isolée par vos contrôles réseau existants.
- Air-gapped. Aucun réseau. Mises à jour livrées par média signé ; les déploiements de ce type acceptent les compromis opérationnels qui en découlent.
Avec quels référentiels êtes-vous alignés ?
Nous concevons les déploiements pour s'intégrer à SOC 2, ISO 27001 et aux référentiels sectoriels pertinents (HIPAA, PCI-DSS, BSA/AML pour les workflows financiers). Nous ne certifions pas votre environnement - nous vous livrons les artefacts et la documentation dont votre auditeur a besoin.