05 / 06 · IA conversationnelle 100% open source Inférence en France

Un copilote interne
qui connaît vos données.

Pas un chatbot générique de plus. Un assistant branché sur vos e-mails, vos tickets Redmine ou Jira, votre wiki, votre Gitea. Il répond avec des sources, en français, depuis nos serveurs. Aucune donnée n'atterrit chez OpenAI, Anthropic ou Google.

Cas d'usage

Du support interne
à la recherche métier.

Mêmes briques, mêmes modèles : on adapte l'agent à la donnée qui compte chez vous. Voici les usages qui sortent du lot.

01 - Support N1 augmenté

Le bot répond avant le ticket

Branché sur votre Helpdesk, votre base Confluence et vos runbooks Gitea. 60 à 80% des questions internes (RH, IT, compta) sont traitées en self-service, avec citation de la source pour l'auditabilité.

02 - Recherche transverse

Une seule barre, tous vos outils

Pose une question, l'agent va chercher dans vos mails, Redmine, Jira, Notion, Slack ou Mattermost. Réponse synthétique, sources cliquables, contexte préservé. Fin des dix recherches Ctrl+F par jour.

03 - Synthèse et triage

Classification automatique

Tickets, mails entrants, retours client : le modèle catégorise, priorise, propose une réponse. L'agent humain valide et corrige. Le modèle apprend de vos corrections, hébergé chez nous, sans fuite.

04 - Assistant métier

Spécialiste de votre domaine

Un chatbot fine-tuné sur votre vocabulaire, vos process, vos procédures qualité. Juridique, médical, industriel : l'agent répond comme votre meilleur expert, disponible 24/7, en français, sans confondre votre métier avec un autre.

05 - Génération assistée

Brouillons, mails, comptes-rendus

Réponses pré-rédigées à partir de l'historique client, comptes-rendus de réunion à partir des transcripts Whisper, synthèses de longs documents. Les humains gardent la main, le modèle dégrossit.

06 - Copilote de code interne

Comme Copilot, chez vous

Modèles type Codestral ou Qwen Coder, branchés sur votre Gitea privé. Suggestions de complétion, revue de PR, génération de tests. Vos secrets et votre propriété intellectuelle ne quittent jamais votre infrastructure.

Modèles open source mobilisés

Le meilleur du libre,
au service de votre métier.

On choisit le bon modèle pour chaque tâche - et on l'héberge chez nous. Mistral en priorité (made in France), Llama 3.3 pour le multilingue, Qwen pour le code, modèles plus légers quand la latence prime.

Généraliste FR Mistral Large
Léger & rapide Mistral Small
Vision Pixtral
Code Codestral
Multilingue Llama 3.3
Polyvalent Qwen 2.5
Compact Gemma 2
Edge Phi-4
Raisonnement DeepSeek V3
Embeddings BGE-M3
Voix Whisper
Base vectorielle Qdrant
Stack et connecteurs

On se branche à vos outils, internes comme externes.

L'agent va chercher la donnée là où elle vit aujourd'hui : sur vos outils self-hostés (Redmine, Gitea, Mattermost, Nextcloud, Outlook) comme sur vos SaaS du marché (Slack, GitLab, Jira, Notion, Confluence, Gmail). Passer sur une stack 100% souveraine reste notre recommandation - on vous y accompagne à votre rythme, sans en faire un prérequis pour démarrer. Connecteur sur-mesure si votre source est exotique.

Interface Open WebUI
Alternative LibreChat
RAG LangChain
Indexation LlamaIndex
Inférence vLLM
Orchestration Kubernetes
Méthode

Trois étapes, du POC à la production.

01 2 semaines

Cadrage & cas d'usage

On identifie 1 ou 2 cas d'usage à fort ROI, on cartographie vos sources de données, on choisit les modèles. Livrable : spécifications fonctionnelles et techniques, devis ferme.

02 3 à 6 semaines

POC sur vos données

Déploiement d'un premier assistant sur un périmètre limité, avec ingestion réelle de vos sources. Vos équipes testent, on ajuste le prompt, le retrieval, les modèles. KPIs mesurés.

03 Mensuel

Mise en production & exploitation

Passage en production sur notre infrastructure HDS, SSO, supervision, garde-fous (PII redaction, logging, quotas). Mises à jour des modèles, ré-indexation, support.

Prochaine étape

Parlons de votre premier assistant.

Décrivez votre contexte en quelques lignes. Premier retour sous 48h ouvrés, devis ferme sous 10 jours après cadrage du périmètre.

Démarrer un projet