AI Neural Network Visualization
Computer Vision Engineering

Computer Vision,
l'intelligence visuelle, à l'échelle industrielle.

Architectures de pointe, entrainement de modeles custom, deploiement edge & cloud. Detection, segmentation, OCR, détection de profondeur, anomaly detection — nous couvrons l'integralite du spectre CV.

YOLOv9SAM 2DINOv2Florence-2 Grounding DINORT-DETRDepth Anything V2 SegGPTEfficientViTCLIP Stable DiffusionMamba VisionConvNeXt V2 YOLOv9SAM 2DINOv2Florence-2 Grounding DINORT-DETRDepth Anything V2 SegGPTEfficientViTCLIP Stable DiffusionMamba VisionConvNeXt V2
Object detection bounding boxes on urban scene
Object Detection
Semantic segmentation visualization
Segmentation
Face recognition and depth mapping
3D & Depth
Industrial quality control with computer vision
Anomaly Detection
// Nos solutions IA & Culture

L'IA au service du patrimoine culturel

Deux offres complémentaires pour les institutions culturelles, les chercheurs et les professionnels du patrimoine.

IA & Culture
Thot.

L'intelligence artificielle au service du patrimoine culturel français. Analyses computationnelles d'œuvres littéraires, vision par ordinateur pour l'art, médiation culturelle augmentée.

Proust Jules Verne Vision par ordinateur OCR manuscrits Médiation augmentée
Découvrir Thot
Plateforme professionnelle
L.I.S.A.
Lecture Intelligente des Sources et des Archives

Plateforme de traitement automatique de documents patrimoniaux. Double pipeline d'analyse par IA — modulaire et vision-langage — adossé à une base de connaissances muséale mondiale.

490k
œuvres
40k
Iconclass
72B
VLM
14ms
par page
En savoir plus

Expertise technique

Chaque probleme visuel a sa topologie optimale. Nous selectionnons et adaptons les architectures les plus performantes en fonction de vos contraintes : latence, precision, volume, edge ou cloud.

Object detection on autonomous vehicle scene

Object Detection

Detection multi-classe temps reel avec les architectures les plus performantes. Fine-tuning sur vos donnees metier avec augmentation avancee.

YOLOv9RT-DETRCo-DETRDINO
Semantic segmentation mask visualization

Segmentation

Segmentation semantique, d'instance et panoptique. Masques pixel-perfect pour l'analyse fine de scenes complexes.

SAM 2Mask2FormerSegGPTOneFormer
Document scanning and OCR processing

OCR & Document AI

Extraction intelligente de texte, layout parsing, table detection. Pipelines robustes pour documents scannes, manuscrits ou degrades.

PaddleOCRTrOCRDocTRLayoutLMv3
3D point cloud reconstruction

3D Vision & Depth

Estimation de profondeur monoculaire, reconstruction 3D, NeRF et Gaussian Splatting. Du point cloud au mesh exploitable.

Depth Anything V23D Gaussian SplattingNeRFMiDaS
Multi-object tracking on video stream

Tracking & Video

Suivi multi-objets, analyse de flux video en temps reel, action recognition. Pipelines optimises pour le streaming haute cadence.

ByteTrackBoT-SORTCo-TrackerVideoMAE V2
Industrial quality inspection with computer vision

Anomaly Detection

Detection de defauts, controle qualite visuel, surveillance industrielle. Apprentissage few-shot et unsupervised sur vos lignes de production.

PatchCoreEfficientADAnomalyGPTWinCLIP
Neural network architecture visualization
"Voir, c'est savoir. — Honore de Balzac"

Stack technologique

Nous operons sur l'ensemble de l'ecosysteme Computer Vision moderne : des fondations aux frameworks de deploiement.

GPU server infrastructure for model training
01

Foundation Models & Backbones

Les modeles de fondation constituent le socle de toute pipeline CV moderne. Nous exploitons les representations visuelles pre-entrainees les plus puissantes pour maximiser les performances downstream avec un minimum de donnees annotees.

DINOv2 Self-supervised ViT features — zero-shot transfer
CLIP / SigLIP Vision-language alignment — open-vocabulary classification
Florence-2 Unified vision foundation model — multi-task prompting
ConvNeXt V2 Modernized CNN backbone — FCMAE pre-training
EfficientViT Linear attention ViT — mobile & edge deployment
Mamba Vision State-space model backbone — linear complexity scaling
02

Task-Specific Architectures

Au-dela des backbones, chaque tache CV requiert des heads et decoders specialises. Nous assemblons les architectures optimales pour chaque probleme, en tenant compte du trade-off precision/latence specifique a votre cas d'usage.

YOLOv9 / YOLOv10 Real-time detection — PGI & GELAN architecture
RT-DETR Transformer detection — NMS-free, end-to-end
SAM 2 Segment Anything in images & video — promptable
Grounding DINO Open-set detection — text-guided visual grounding
Depth Anything V2 Monocular depth estimation — metric & relative
Mask2Former Universal segmentation — semantic, instance, panoptic
03

Frameworks, Infra & Deployment

L'ingenierie de production est aussi critique que la recherche. Nous maitrisons la chaine complete : entrainement distribue, optimisation de modeles, containerisation et deploiement multi-target.

PyTorch / Lightning Training framework — distributed, mixed-precision
Hugging Face Model hub, Transformers, Datasets, Accelerate
ONNX / TensorRT Graph optimization — GPU inference acceleration
Triton Inference Server Model serving — batching, ensemble, multi-GPU
MLflow / W&B Experiment tracking, model registry, lineage
Label Studio / CVAT Data annotation — active learning loops

Entrainement de modeles custom

Un modele pre-entraine ne suffit pas. Nous construisons des pipelines d'entrainement sur mesure, optimisees pour vos donnees, vos metriques et vos contraintes de deploiement.

Deep learning model training on GPU cluster
01

Audit & Data Assessment

Analyse de vos donnees existantes : distribution des classes, biais, qualite d'annotation, data drift potentiel. Identification des gaps et strategie de collecte complementaire.

Distribution des classes Qualite d'annotation Detection de doublons Analyse de biais
02

Architecture Selection & Baseline

Selection du backbone et du head optimaux en fonction du trade-off precision / latence / taille. Etablissement d'une baseline reproductible avec les hyperparametres par defaut.

Benchmark multi-architectures mAP@50:95 Latence P99 Parametres & FLOPs
03

Data Augmentation & Curriculum

Pipelines d'augmentation adaptes au domaine : Mosaic, MixUp, CutMix, Copy-Paste, augmentations geometriques et photometriques. Curriculum learning pour les datasets desequilibres.

Mosaic / MixUp / CutMix Copy-Paste Albumentations Curriculum Learning
04

Training & Hyperparameter Optimization

Entrainement distribue multi-GPU avec mixed precision (bf16/fp16). Recherche d'hyperparametres via Optuna ou Ray Tune. Monitoring temps reel sur Weights & Biases.

DDP multi-GPU bf16 mixed-precision Optuna / Ray Tune W&B Monitoring
05

Optimization & Export

Quantization (INT8/FP16), pruning, knowledge distillation. Export multi-format : ONNX, TensorRT, CoreML, TFLite. Benchmarking sur hardware cible avant livraison.

INT8 / FP16 Quantization Structured Pruning ONNX / TensorRT CoreML / TFLite
06

Deployment & Monitoring

Deploiement containerise avec Triton ou BentoML. Monitoring de data drift et de performance degradation en production. Boucle de re-training automatisée.

Triton / BentoML Data Drift Detection Active Learning Auto Re-training

Domaines d'application

La Computer Vision transforme chaque industrie ou l'information visuelle est sous-exploitee. Quelques verticales ou nous intervenons.

Industrial production line quality inspection

Industrie & Manufacturing

Contrôle qualité visuel automatisé, détection de défauts sur lignes de production, mesure dimensionnelle sans contact, suivi de production en temps reel.

Medical imaging brain scan MRI

Medical & Life Sciences

Analyse d'imagerie medicale (radiologie, pathologie, dermatologie), segmentation de structures anatomiques, aide au diagnostic assistee par CV.

Retail store shelf analytics

Retail & E-commerce

Visual search, reconnaissance produit, essayage virtuel, comptage de fréquentation et heatmaps comportementales.

Smart city traffic monitoring

Smart City & Mobilité

Analyse de flux de circulation, détection d'incidents, LAPI (lecture automatique de plaques), supervision d'infrastructures urbaines par camera.

Ancient library with classical architecture

Culture & Patrimoine Thot

IA appliquée au patrimoine culturel français : analyse computationnelle d'œuvres littéraires et visuelles, OCR de manuscrits anciens, médiation culturelle augmentée.

Découvrir Thot →
Technology circuit board close-up
"La rigueur du laboratoire, au rythme de la production."

Notre approche

Research papers and scientific analysis
01

Research-Driven

Veille permanente sur arxiv, conferences CVPR/ECCV/ICCV/NeurIPS. Chaque recommandation technique est adossée à un benchmark reproductible, pas a un argumentaire commercial.

Server room GPU infrastructure
02

Production-First

La rigueur du laboratoire, au rythme de la production. Nous pensons cout GPU et maintenabilite des le premier jour. Pas de PoC qui ne peut pas scaler.

Data analytics dashboard visualization
03

Data-Centric

La vision est le premier pas vers la comprehension. Nous investissons dans les pipelines d'annotation, le nettoyage, l'augmentation et l'active learning avant d'iterer sur l'architecture.

Team collaboration and code review
04

Transparent & Reproductible

Code versionne, experiences trackees, modeles registres. Vous repartez avec la propriete complete du code, des poids et de la documentation technique.

Démarrons votre projet

Décrivez-nous votre problématique visuelle. Nous revenons vers vous sous 24h avec une première analyse de faisabilité et une proposition d'approche.

Adresse 60 rue François 1er
75008 Paris, France
Paris cityscape