Architectures de pointe, entrainement de modeles custom, deploiement edge & cloud. Detection, segmentation, OCR, détection de profondeur, anomaly detection — nous couvrons l'integralite du spectre CV.
Deux offres complémentaires pour les institutions culturelles, les chercheurs et les professionnels du patrimoine.
Chaque probleme visuel a sa topologie optimale. Nous selectionnons et adaptons les architectures les plus performantes en fonction de vos contraintes : latence, precision, volume, edge ou cloud.
Detection multi-classe temps reel avec les architectures les plus performantes. Fine-tuning sur vos donnees metier avec augmentation avancee.
Segmentation semantique, d'instance et panoptique. Masques pixel-perfect pour l'analyse fine de scenes complexes.
Extraction intelligente de texte, layout parsing, table detection. Pipelines robustes pour documents scannes, manuscrits ou degrades.
Estimation de profondeur monoculaire, reconstruction 3D, NeRF et Gaussian Splatting. Du point cloud au mesh exploitable.
Suivi multi-objets, analyse de flux video en temps reel, action recognition. Pipelines optimises pour le streaming haute cadence.
Detection de defauts, controle qualite visuel, surveillance industrielle. Apprentissage few-shot et unsupervised sur vos lignes de production.
Nous operons sur l'ensemble de l'ecosysteme Computer Vision moderne : des fondations aux frameworks de deploiement.
Les modeles de fondation constituent le socle de toute pipeline CV moderne. Nous exploitons les representations visuelles pre-entrainees les plus puissantes pour maximiser les performances downstream avec un minimum de donnees annotees.
Au-dela des backbones, chaque tache CV requiert des heads et decoders specialises. Nous assemblons les architectures optimales pour chaque probleme, en tenant compte du trade-off precision/latence specifique a votre cas d'usage.
L'ingenierie de production est aussi critique que la recherche. Nous maitrisons la chaine complete : entrainement distribue, optimisation de modeles, containerisation et deploiement multi-target.
Un modele pre-entraine ne suffit pas. Nous construisons des pipelines d'entrainement sur mesure, optimisees pour vos donnees, vos metriques et vos contraintes de deploiement.
Analyse de vos donnees existantes : distribution des classes, biais, qualite d'annotation, data drift potentiel. Identification des gaps et strategie de collecte complementaire.
Selection du backbone et du head optimaux en fonction du trade-off precision / latence / taille. Etablissement d'une baseline reproductible avec les hyperparametres par defaut.
Pipelines d'augmentation adaptes au domaine : Mosaic, MixUp, CutMix, Copy-Paste, augmentations geometriques et photometriques. Curriculum learning pour les datasets desequilibres.
Entrainement distribue multi-GPU avec mixed precision (bf16/fp16). Recherche d'hyperparametres via Optuna ou Ray Tune. Monitoring temps reel sur Weights & Biases.
Quantization (INT8/FP16), pruning, knowledge distillation. Export multi-format : ONNX, TensorRT, CoreML, TFLite. Benchmarking sur hardware cible avant livraison.
Deploiement containerise avec Triton ou BentoML. Monitoring de data drift et de performance degradation en production. Boucle de re-training automatisée.
La Computer Vision transforme chaque industrie ou l'information visuelle est sous-exploitee. Quelques verticales ou nous intervenons.
Contrôle qualité visuel automatisé, détection de défauts sur lignes de production, mesure dimensionnelle sans contact, suivi de production en temps reel.
Analyse d'imagerie medicale (radiologie, pathologie, dermatologie), segmentation de structures anatomiques, aide au diagnostic assistee par CV.
Visual search, reconnaissance produit, essayage virtuel, comptage de fréquentation et heatmaps comportementales.
Analyse de flux de circulation, détection d'incidents, LAPI (lecture automatique de plaques), supervision d'infrastructures urbaines par camera.
IA appliquée au patrimoine culturel français : analyse computationnelle d'œuvres littéraires et visuelles, OCR de manuscrits anciens, médiation culturelle augmentée.
Découvrir Thot →Veille permanente sur arxiv, conferences CVPR/ECCV/ICCV/NeurIPS. Chaque recommandation technique est adossée à un benchmark reproductible, pas a un argumentaire commercial.
La rigueur du laboratoire, au rythme de la production. Nous pensons cout GPU et maintenabilite des le premier jour. Pas de PoC qui ne peut pas scaler.
La vision est le premier pas vers la comprehension. Nous investissons dans les pipelines d'annotation, le nettoyage, l'augmentation et l'active learning avant d'iterer sur l'architecture.
Code versionne, experiences trackees, modeles registres. Vous repartez avec la propriete complete du code, des poids et de la documentation technique.
Décrivez-nous votre problématique visuelle. Nous revenons vers vous sous 24h avec une première analyse de faisabilité et une proposition d'approche.