67 votes
Obj : 300 000 Légende Discutez, votez et aidez-nous à atteindre cet objectif !
Vos votes sont importants : ils alimentent le jeu de données CompaRAG mis à disposition librement pour évaluer les outils RAG.
Ce commun numérique contribue à une meilleure évaluation objective des outils RAG.

Modalités d’utilisation

1. Champ d’application

L’accès à la plateforme est gratuit, sans inscription et entraîne l’application de conditions spécifiques, listées dans les présentes modalités d’utilisation.

2. Définitions

« Utilisateur » désigne toute personne physique consultant la plateforme et qui bénéficie de ses services.

« Éditeur » désigne le mainteneur du projet open source CompaRAG.

« Plateforme » désigne le site web qui rend les services accessibles.

« Outils RAG » désigne les pipelines de Retrieval-Augmented Generation comparés sur la plateforme — chacun combine un mécanisme de récupération d'information et un modèle de langage pour produire une réponse.

« Services » désigne les fonctionnalités offertes par la plateforme pour répondre à ses finalités.

3. Description de la plateforme

CompaRAG est une plateforme de comparaison en aveugle d'outils RAG, adressée au grand public dans le but (1) de mesurer la qualité réelle des outils RAG sur des questions posées par des utilisateurs, (2) de collecter les préférences humaines pour produire un jeu de données ouvert, et (3) de classer les outils selon ces préférences.

L'utilisateur ou l'utilisatrice pose une question (et optionnellement uploade un document) et obtient les réponses de deux outils RAG anonymes. Il ou elle vote pour la réponse qui répond le mieux à sa question. À tout moment, des données sont collectées dans le respect de la vie privée, et les jeux de données qui en résultent sont publiés en open source.

Ces jeux de données seront rendus accessibles sous licence ouverte, notamment pour favoriser des usages de recherche.

4. Fonctionnalités

Afin de répondre au double objectif d'éclairer les choix d'architecture RAG et de collecter les préférences des utilisateurs et utilisatrices, les services rendus par la plateforme sans restriction d'accès sont les suivants :

  • Une interface humain-machine permettant de poser une question simultanément à deux outils RAG et de voter pour la réponse préférée.

Les outils RAG intégrés à la plateforme sont déployés sur leurs propres serveurs ou exposés via le protocole MCP. La plateforme les interroge en parallèle sur la question de l'utilisateur, sans mémoriser leur identité avant le vote.

  • Une interface de comparaison d'outils RAG.

L'utilisateur peut consulter la liste des outils RAG intégrés au comparateur et accéder à leurs caractéristiques (framework, choix d'architecture, performance).

  • Partage, mise à disposition et valorisation des jeux de données issus de la collecte des préférences des utilisateurs.

Le service collecte les données de comparaison (questions, réponses des deux outils RAG) et les préférences des utilisateurs (vote, métadonnées associées). Ces données servent à constituer un jeu de données ouvert et à établir un classement public des outils RAG affiché sur la plateforme.

L'éditeur publie sous licence ouverte les données de dialogue et de préférence des utilisateurs sur Hugging Face : huggingface.co/datasets/ArthurSrz/comparag-tool-votes.

5. Responsabilités

L’utilisateur est responsable des données ou contenus qu'il ou elle saisit dans l’invite offert par la plateforme.

La plateforme n’a pas vocation à être utilisée pour générer des contenus illicites ou contraires à l’ordre public et plus généralement toute génération de contenu contrevenant au cadre juridique en vigueur.

A cet égard, l’utilisateur ne saisit pas dans l’invite des contenus ou informations contraires aux dispositions légales et réglementaires en vigueur.

Les données saisies par l’utilisateur sur la plateforme ayant vocation à être mises à disposition, il ou elle s’engage à ne pas transmettre d’informations permettant de l’identifier ou d’identifier un tiers.

En tout état de cause, l’éditeur s’engage à mettre en œuvre les moyens permettant de s'assurer de l'anonymisation des données de dialogue avant leur mise à disposition. Si, malgré les efforts de l'éditeur, des données sensibles venaient à être publiées dans les jeux de données, vous pouvez le signaler immédiatement via ce formulaire : [https://adtk8x51mbw.eu.typeform.com/to/B49aloXZ](https://adtk8x51mbw.eu.typeform.com/to/B49aloXZ).

De manière générale, l’éditeur se dégage de toute responsabilité en cas d’utilisationnon-conforme aux modalités d’utilisation.

6. Code et licences

Le code source de la plateforme est libre et disponible ici : https://github.com/betagouv/languia

Les outils RAG utilisés pour alimenter les services sont régis par les licences suivantes :

Outil RAGLien vers la notice des outilsLicence
Apertus 70B Instructhttps://huggingface.co/swiss-ai/Apertus-70B-Instruct-2509Apache 2.0
Claude 4.5 Sonnethttps://www.anthropic.com/news/claude-sonnet-4-5proprietary
Claude 4.6 SonnetNon disponibleproprietary
DeepSeek R1 0528https://huggingface.co/deepseek-ai/DeepSeek-R1-0528MIT
DeepSeek V3.2https://huggingface.co/deepseek/deepseek-v3.2Apache 2.0
EuroLLM 22B Instructhttps://huggingface.co/utter-project/EuroLLM-22B-Instruct-2512Apache 2.0
Gemini 3 Flashhttps://blog.google/products/gemini/gemini-3-flash/proprietary
Gemini 3 Prohttps://blog.google/products/gemini/gemini-3/#note-from-ceoproprietary
Gemini 3.1 Flash Litehttps://deepmind.google/models/model-cards/gemini-3-1-flash-lite/proprietary
Gemini 3.1 ProNon disponibleproprietary
Gemma 3 12Bhttps://huggingface.co/google/gemma-3-12b-itGemma
Gemma 3 27Bhttps://huggingface.co/google/gemma-3-27b-itGemma
Gemma 3 4Bhttps://huggingface.co/google/gemma-3-4b-itGemma
Gemma 3n 4BNon disponibleGemma
GLM 4.7https://z.ai/blog/glm-4.7MIT
GLM 5https://huggingface.co/zai-org/GLM-5MIT
GPT 5.3Non disponibleproprietary
GPT 5.4https://developers.openai.com/api/docs/models/gpt-5.4proprietary
GPT 5.4 Minihttps://developers.openai.com/api/docs/models/gpt-5.4-miniproprietary
GPT 5.4 Nanohttps://developers.openai.com/api/docs/models/gpt-5.4-nanoproprietary
GPT OSS-120BNon disponibleApache 2.0
GPT OSS-20BNon disponibleApache 2.0
Grok 4.1 Fasthttps://x.ai/news/grok-4-1-fastproprietary
Hermes 4 70BNon disponibleLlama 3.1
Kimi K2https://huggingface.co/moonshotai/Kimi-K2-InstructMIT
Kimi K2 Thinkinghttps://moonshotai.github.io/Kimi-K2/thinking.htmlMIT
Kimi K2.5https://www.kimi.com/blog/kimi-k2-5.htmlMIT
LFM 2 8B A1Bhttps://www.liquid.ai/blog/lfm2-8b-a1b-an-efficient-on-device-mixture-of-expertsLFM 1.0
Llama 3.3 70Bhttps://huggingface.co/meta-llama/Llama-3.3-70B-InstructLlama 3.3
Llama 4 Scouthttps://huggingface.co/meta-llama/Llama-4-Scout-17B-16E-InstructLlama 4
Llama 4 MaverickNon disponibleLlama 4
MiniMax M2https://www.minimax.io/news/minimax-m2MIT
MiniMax M2.5https://huggingface.co/MiniMaxAI/MiniMax-M2.5Modified MIT
Mistral 3 Largehttps://mistral.ai/news/mistral-3Apache 2.0
Mistral Medium 3.1https://mistral.ai/news/mistral-medium-3.1proprietary
Mistral Small 3.2Non disponibleApache 2.0
Mistral Small 4https://huggingface.co/mistralai/Mistral-Small-4-119B-2603Apache 2.0
Nemotron 3 Super 120B-A12Bhttps://huggingface.co/nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-BF16Nemotron Open
Olmo 3 32B Thinkhttps://allenai.org/blog/olmo2-32bApache 2.0
Qwen3 Coder Nexthttps://huggingface.co/Qwen/Qwen3-Coder-NextApache 2.0
Qwen 3 Maxhttps://qwen.ai/blog?id=241398b9cd6353de490b0f82806c7848c5d2777d&from=research.latest-advancements-listproprietary
Qwen 3.5 35B A3Bhttps://huggingface.co/Qwen/Qwen3.5-35B-A3BApache 2.0
Qwen 3.5 397Bhttps://huggingface.co/Qwen/Qwen3.5-397B-A17BApache 2.0
Trinity Largehttps://huggingface.co/arcee-ai/Trinity-Large-PreviewApache 2.0

La liste des outils RAG intégrés à la plateforme est susceptible d’évoluer au cours du temps et est mise à jour à chaque modification.

7. Disponibilité des services

La plateforme est accessible, sauf cas de force majeure ou d’évènement hors de contrôle de son éditeur.

L’éditeur se réserve le droit de suspendre, d'interrompre ou de limiter, sans avis préalable, l'accès à tout ou partie des services, notamment pour des opérations de maintenance et de mises à jour nécessaires au bon fonctionnement du service et des matériels afférents, ou pour toute autre raison, notamment technique.

Il n’est pas garanti que le service soit exempt d’anomalies ou d'erreurs. Le service est donc mis à disposition sans garantie sur sa disponibilité et ses performances.

A ce titre, l’éditeur ne saurait être tenu responsable des pertes ou préjudices, de quelque nature qu’ils soient, qui pourraient être causés à la suite d’un dysfonctionnement ou une indisponibilité du service. De telles situations n'ouvriront droit à aucune compensation financière.

8. Évolution des modalités d'utilisation

Les modalités d’utilisation peuvent être modifiées ou complétées à tout moment, sans préavis, en fonction des modifications apportées aux services, de l’évolution de la législation ou pour tout autre motif jugé nécessaire.

Ces modifications et mises à jour s’imposent à l’utilisateur ou l’utilisatrice qui doit, en conséquence, se référer régulièrement à cette rubrique pour vérifier les modalités générales en vigueur.

9. Contact

Pour toute question sur le service, vous pouvez écrire à https://github.com/ArthurSrz/CompaRAG/issues.