fix(vision): seuils grounding assouplis pour VWB cross-résolution
Some checks failed
security-audit / Bandit (scan statique) (push) Successful in 11s
security-audit / pip-audit (CVE dépendances) (push) Successful in 11s
security-audit / Scan secrets (grep) (push) Successful in 8s
tests / Lint (ruff + black) (push) Successful in 14s
tests / Tests unitaires (sans GPU) (push) Failing after 14s
tests / Tests sécurité (critique) (push) Has been skipped

MAX_DISTANCE_PX 120→500 (ancre peut être loin si résolution différente)
MIN_CLIP_SCORE 0.55→0.50 (tolérance basique suffisante)
MIN_COMBINED_SCORE 0.5→0.45 (accepter les matchs raisonnables)

L'icône Chrome à 81% de confiance était rejetée à cause de la distance.
Les workflows VWB manuels capturent sur un écran et s'exécutent
potentiellement sur un autre — la tolérance de distance doit être large.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
Dom
2026-04-18 17:09:08 +02:00
parent f34eca20f9
commit f30461b88c

View File

@@ -224,10 +224,11 @@ class IntelligentExecutor:
- MIN_COMBINED_SCORE: Score combiné minimum (0.6)
"""
# === SEUILS ÉQUILIBRÉS ===
# Permet des variations raisonnables tout en évitant les faux positifs
MAX_DISTANCE_PX = 120 # Rejeter tout élément > 120px de la position originale
MIN_CLIP_SCORE = 0.55 # Score CLIP minimum requis (0.55 = similarité raisonnable)
MIN_COMBINED_SCORE = 0.5 # Score combiné minimum pour accepter un match
# VWB workflows manuels : l'ancre peut être loin de la position d'origine
# (résolution différente, écran différent, fenêtre déplacée)
MAX_DISTANCE_PX = 500 # Tolérance large pour VWB cross-résolution
MIN_CLIP_SCORE = 0.50 # Score CLIP minimum (0.50 = ressemblance basique)
MIN_COMBINED_SCORE = 0.45 # Score combiné minimum pour accepter un match
try:
# Essayer d'importer et utiliser CLIP