Files
rpa_vision_v3/docs/reference/START_HERE.md
Dom a27b74cf22 v1.0 - Version stable: multi-PC, détection UI-DETR-1, 3 modes exécution
- Frontend v4 accessible sur réseau local (192.168.1.40)
- Ports ouverts: 3002 (frontend), 5001 (backend), 5004 (dashboard)
- Ollama GPU fonctionnel
- Self-healing interactif
- Dashboard confiance

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-29 11:23:51 +01:00

3.6 KiB

🚀 START HERE - Documentation Architecture RPA Vision V2

Date : 22 novembre 2024
Version : 1.1 (avec enrichissements)


📖 Par Où Commencer ?

Si tu découvres le projet

1. Lis d'abord : README.md (5 min)

  • Vue d'ensemble du dossier
  • Guide de navigation

2. Puis consulte : ARCHITECTURE_INDEX.md (5 min)

  • Index complet
  • Navigation rapide

3. Ensuite explore : ARCHITECTURE_VISION_COMPLETE.md (30-45 min)

  • Architecture complète
  • 5 couches détaillées
  • Exemple concret

4. Enfin approfondis : ARCHITECTURE_ENRICHISSEMENTS.md (20-30 min)

  • 8 enrichissements majeurs
  • Concepts production-ready

🎯 Par Objectif

Je veux comprendre l'architecture

ARCHITECTURE_VISION_COMPLETE.md

Je veux implémenter

ARCHITECTURE_VISION_COMPLETE.md § Plan de Migration

Je veux les formats JSON

ARCHITECTURE_VISION_COMPLETE.md + ARCHITECTURE_ENRICHISSEMENTS.md

Je veux les enrichissements

ARCHITECTURE_ENRICHISSEMENTS.md

Je veux un résumé rapide

ENRICHISSEMENTS_RESUME.md


📚 Documents Disponibles

Document Taille Description
ARCHITECTURE_VISION_COMPLETE.md 1323 lignes Architecture complète 5 couches
ARCHITECTURE_ENRICHISSEMENTS.md 800 lignes 8 enrichissements production-ready
ARCHITECTURE_INDEX.md 145 lignes Index de navigation
ENRICHISSEMENTS_RESUME.md 200 lignes Résumé des enrichissements
README.md 100 lignes Guide du dossier
SESSION_COMPLETE_22_NOV.md 250 lignes Récapitulatif session

Total : ~2800 lignes de documentation


Ce que tu vas apprendre

Architecture (5 Couches)

  1. RawSession - Capture brute des événements
  2. ScreenState - Analyse multi-modale (4 niveaux)
  3. UIElement Detection - Détection sémantique
  4. State Embedding - Fusion multi-modale
  5. Workflow Graph - Modélisation en graphe

Enrichissements (8 Concepts)

  1. Grammaire du temps - Épisodes de workflow
  2. Marquage du bruit - Classification sémantique
  3. Layout Signature - Robustesse aux variations
  4. Identité stable - Tracking d'éléments
  5. Actionnabilité - Scores de cliquabilité
  6. Versioning d'espaces - Migration de modèles
  7. Variables métier - Paramétrage
  8. Nœuds d'erreur - Gestion explicite

Formats JSON (20+)

  • RawSession (avec segments)
  • ScreenState (avec layout signature)
  • UIElement (avec stable_id)
  • State Embedding (avec space versioning)
  • WorkflowNode (avec variables)
  • WorkflowEdge (avec conditions)
  • Workflow complet (avec erreurs)

🚀 Prochaines Étapes

  1. Lire la documentation
  2. Valider les formats
  3. Créer JSON Schema
  4. Implémenter structures Python
  5. Tester avec données réelles
  6. Migrer progressivement

💡 Points Clés

Philosophie : "Observer → Comprendre → Apprendre → Agir"

Learning States : OBSERVATION → COACHING → AUTO_CANDIDATE → AUTO_CONFIRMÉ

Robustesse : Matching sémantique, détection de changements, safety rules

Production-Ready : Gestion d'erreurs, versioning, variables métier, tracking temporel


Créé le : 22 novembre 2024
Statut : Documentation Complète
Prêt pour : Implémentation

Bonne lecture ! 📚