QDQQ
Qui Dit Quoi et Quand
Le nom dit tout : retrouver Qui a Dit Quoi et Quand.
QDQQ transcrit des vidéos, indexe chaque mot avec son horodatage, et permet de chercher une idée ou un nom puis d'ouvrir la vidéo au moment exact où il est prononcé.
Synthèses IA : chaque vidéo peut être résumée par l'IA (synthèse, analyse détaillée ou ULTRA). La synthèse transverse va plus loin : à partir d'un mot-clé, elle croise toutes les vidéos sélectionnées qui en parlent pour en tirer une synthèse thématique unique, focalisée sur ce sujet et retraçant son évolution dans le temps.
ℹ️ Caractéristiques techniques
📡 Transcription audio
Moteurfaster-whisper v? (réimplémentation optimisée d'OpenAI Whisper)
Modèlemedium · exécution CPU, quantification int8
SortieChaque mot horodaté (timestamp à la seconde), regroupé en segments · détection automatique de la langue
Pré-traitementConversion audio 16 kHz mono via ffmpeg
Le modèle Whisper est configurable via la variable d'environnement QDQQ_WHISPER_MODEL (tiny / base / small / medium / large).
📺 Acquisition des vidéos
Téléchargementyt-dlp v2026.6.9 — plus de 1700 sites pris en charge (YouTube, Rumble, etc.)
ModesScan d'une vidéo unique ou d'une chaîne entière
🔍 Recherche
TechnologieIndex FULLTEXT MySQL (InnoDB, utf8mb4) sur les mots et les segments
Modes
OU — au moins un mot
ET — tous les mots
Expression exacte
EnrichissementsCorrections d'erreurs Whisper récurrentes · synonymes pour élargir la recherche · autocomplétion · historique des recherches
RésultatOuverture de la vidéo au moment exact du passage (lien horodaté)
🤖 Synthèses par IA (GROK / xAI)
FournisseurxAI — endpoint https://api.x.ai/v1 (SDK openai v?)
Modèlesgrok-3-mini par défaut · grok-3 (qualité supérieure, ×15 le coût)
Synthèses par vidéo
📋 Synthèse
🔍 Analyse détaillée
🔥 Analyse ULTRA détaillée
Synthèse transverseSynthèse multi-vidéos par mot-clé : croise tous les passages d'un sujet à travers les vidéos, focalisée sur le mot-clé, avec appréciation chronologique. Types Analyse transverse … détaillée
Textes longsMap-Reduce automatique au-delà de 15 000 caractères (évite la coupure ~30 s de l'API)
RenduPages HTML autonomes thématisées (sommaire, chapitres, points clés), consultables dans l'Almanach
🔧 Pile technique
LangagePython v3.11.15
Serveur webFlask v3.1.3
Base de donnéesMySQL 8.0 (InnoDB, utf8mb4, FULLTEXT) · connecteur mysql-connector-python v9.7.0
Transcriptionfaster-whisper v?
Téléchargementyt-dlp v2026.6.9
Client IAopenai v? (vers l'API xAI)
Déploiement / SSHparamiko v5.0.0
Médiaffmpeg (conversion audio)
FrontBootstrap 5 (auto-hébergé) · templates Jinja2
InfrastructureDocker (app Python + MySQL 8.0 + PHPMyAdmin)
PlateformeLinux 6.12.48+deb13-cloud-amd64
🗃️ Données
sourcesmétadonnées des vidéos (plateforme, URL, titre, auteur, durée, date)
transcriptionsmots transcrits avec timestamps et score de confiance
corrections / synonymesamélioration de la recherche
source_documents / syntheses_extrasynthèses HTML par vidéo
syntheses_transversessynthèses multi-vidéos par mot-clé
QDQQ — QuiDitQuoiEtQuand · Whisper + yt-dlp + MySQL · 2026