Files
rpa_vision_v3/data/primitives/click_anchor.yaml

59 lines
1.8 KiB
YAML

schema_version: 1
id: click_anchor
kind: primitive
marker_or_action: action
version: 1
intent:
fr: cliquer sur un element UI identifie par ancre
executor_kind: click
parameters_schema:
anchor_ref:
type: dict_or_string
required: true
description: reference vers l'element a cliquer par id d'ancre ou criteres de resolution, jamais par coordonnees ecran
button:
type: str
required: false
default: left
description: bouton souris a utiliser
constraints:
enum: [left, right, middle]
click_count:
type: int
required: false
default: 1
description: nombre de clics successifs sur la meme ancre
constraints:
min: 1
max: 2
relative_offset:
type: dict
required: false
description: offset relatif dans la bbox resolue, sous forme x_pct/y_pct ou dx/dy, jamais en pixels absolus
context_guard:
type: dict
required: false
description: precondition d'ecran avant clic
expected_effect:
type: str
required: false
description: effet observable attendu par la competence appelante
failure_message_template:
intention: cliquer sur la cible nommee
attendu: la cible nommee doit etre visible et cliquable au moment de l'action
vu: "{observed_human_state}"
demande: me montrer la cible a cliquer, ou me donner son libelle visible
notes:
- "La primitive ne resout pas l'ancre. La resolution est faite par la cascade Grounding au runtime."
- "anchor_ref string = reference stable d'ancre; anchor_ref dict = description multi-critere."
- "relative_offset est rare. Par defaut, clic au centre de la bbox resolue."
- "click_count=2 represente un double-clic. Triple-clic non supporte."
- "Aucune coordonnee ecran absolue dans le YAML. Les positions sources restent uniquement dans les traces."
created_at: "2026-05-28T15:35:00+02:00"