e7657ee1e51f3b3219c8043d9735b8360f989c3c
Ce commit corrige deux problèmes critiques dans le pipeline d'apprentissage: **Fix A - Embeddings CLIP fonctionnels** - Problème: Chemins relatifs (shots/shot_0001.png) causaient des erreurs - Solution: Utilisation de chemins absolus dans processing_pipeline.py et graph_builder.py - Résultat: Embeddings générés avec succès, patterns détectés par clustering DBSCAN Modifications: - server/processing_pipeline.py:279 - Chemin absolu pour ScreenState.raw.screenshot_path - core/graph/graph_builder.py:310 - Chemin absolu pour GraphBuilder._create_screen_states() **Fix B - Nettoyage post-apprentissage** - Problème: Screenshots jamais nettoyés ou nettoyés trop tôt (avant apprentissage) - Solution: Activation du nettoyage APRÈS création des screen_states - Résultat: Gain d'espace ~99% (screenshots supprimés, screen_states conservés) Modifications: - server/processing_pipeline.py:165 - Nettoyage conditionnel si screen_states créés Impact: - ✅ CLIP ViT-B-32 chargé et fonctionnel (512D embeddings) - ✅ 3 patterns détectés sur session test (40 screenshots) - ✅ Nettoyage automatique: uploads/*.enc, uploads/*.zip, sessions/sess_*/ supprimés - ✅ Données conservées: screen_states/, embeddings/, workflows/ - ✅ Gain d'espace: 98.3% (6 MB → 100 KB par session) Testé avec: sess_20260107T220743_6be50905 (40 events, 40 screenshots) Status: ✅ POC/MVP prêt pour démo investisseurs 🤖 Généré avec [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
Description
No description provided
Languages
Python
82.6%
TypeScript
11.8%
HTML
2.7%
Shell
1.2%
CSS
1.1%
Other
0.4%