What is AI consulting?

AI consulting helps organizations design and implement artificial intelligence systems as core operational infrastructure. Unlike off-the-shelf software, custom AI consulting aligns AI capabilities directly with your business objectives, existing data architecture, and long-term scalability requirements.

Does Mosaic AI work with enterprises in Quebec and across Canada?

Yes. Mosaic AI is headquartered in Quebec, Canada and serves enterprise clients across the country. We offer bilingual service in English and French, and we are familiar with Quebec's specific data governance requirements under Loi 25 and federal PIPEDA obligations.

What types of AI systems does Mosaic AI build?

Mosaic AI builds decision support systems, autonomous AI agents, knowledge management platforms, and integrated data architectures tailored to each organization's operational needs.

How long does an AI consulting engagement typically take?

A focused AI readiness assessment or proof-of-concept typically takes 4 to 8 weeks. A full custom AI system deployment generally runs 3 to 6 months.

How does Mosaic AI handle data privacy and security?

Mosaic AI follows Quebec's Loi 25 and federal PIPEDA standards. We design AI systems with privacy-by-design principles and prefer on-premise or private cloud deployments where sensitive data is involved.

L'histoire de l'IA depuis le transformeur — Mosaic AI

Le 12 juin 2017, huit chercheurs de Google publient un article intitulé Attention Is All You Need. Après sa sortie, à peine quelques centaines de personnes dans le monde le lisent.

À ce moment-là, presque personne en dehors des milieux spécialisés n'imagine ce que ce texte va déclencher. Dans les entreprises, l'intelligence artificielle n'est pas un sujet stratégique. On la voit plutôt comme un chantier de recherche, quelque chose d'intéressant en théorie, mais encore loin des opérations réelles.

Ce papier introduit le transformer. Avant ça, les modèles de langage traitaient surtout le texte dans l'ordre, un mot à la fois. Ça fonctionnait, mais dès qu'on voulait aller plus loin, les limites apparaissaient vite. C'était plus lent, plus difficile à entraîner à grande échelle, et moins efficace pour capter les relations entre des mots éloignés dans une phrase ou dans un texte.

Le transformer change ça. Au lieu d'avancer mot par mot, il permet de traiter une séquence beaucoup plus efficacement et de mieux mesurer les liens entre les différents éléments du texte. Dit simplement, ce n'est pas un petit raffinement technique. C'est une autre base de départ. Et c'est sur cette base que la suite va se construire.

En 2018, les choses commencent à bouger. Google publie BERT. OpenAI publie GPT-1. On voit apparaître des modèles qui comprennent mieux le contexte et qui donnent des résultats nettement meilleurs sur plusieurs tâches liées au langage.

En 2019, OpenAI présente GPT-2. L'annonce fait plus de bruit que d'habitude, notamment parce que l'entreprise explique au départ qu'elle ne diffusera pas immédiatement la version complète du modèle. Avec le recul, l'épisode a sans doute eu plus d'effet médiatique que technique, mais il a contribué à ramener l'IA dans les discussions publiques.

Puis GPT-3 arrive en 2020. Là, pour beaucoup de gens qui suivent le domaine de près, quelque chose change vraiment. Le modèle n'est pas simplement meilleur. Il donne l'impression d'avoir franchi un cap. Il peut rédiger, résumer, traduire, répondre à des questions, générer du code, reformuler un texte, s'adapter à un ton. Et surtout, il peut le faire avec très peu d'exemples.

C'est à ce moment-là que beaucoup commencent à comprendre que ces modèles ne seront pas seulement de meilleurs outils de recherche. Ils vont probablement devenir des outils généralistes.

Cela dit, GPT-3 reste encore peu accessible. Son utilisation passe principalement par une API. Le grand public n'y touche pas vraiment, et dans les entreprises, le sujet reste encore assez loin des opérations.

En 2021, d'autres avancées viennent confirmer que le rythme s'accélère. DALL-E montre qu'on peut générer des images à partir de texte. GitHub Copilot commence à assister des développeurs directement dans leur travail. Les modèles de diffusion progressent rapidement. Les démonstrations deviennent plus convaincantes. Les usages commencent à sortir du cadre strictement expérimental.

Malgré ça, dans beaucoup d'organisations, on continue de regarder tout ça de loin. On trouve ça impressionnant, mais pas encore assez concret pour en faire un vrai sujet de direction.

Puis arrive ChatGPT, le 30 novembre 2022.

Ce qui change à ce moment-là, ce n'est pas seulement le modèle. C'est surtout la façon d'y accéder. Tout à coup, n'importe qui peut ouvrir une interface, poser une question en langage naturel, et obtenir une réponse utilisable en quelques secondes. Plus besoin d'API, plus besoin d'environnement de développement, plus besoin de comprendre ce qu'il y a derrière.

C'est ce basculement-là qui fait entrer l'IA dans le quotidien.

En quelques jours, tout le monde essaie. Des étudiants, des développeurs, des consultants, des équipes marketing, des dirigeants, des employés de support. Très vite, le sujet sort des équipes techniques et remonte dans les entreprises. On commence à se demander ce que ces modèles peuvent faire concrètement, où ils peuvent s'intégrer, ce qu'ils vont changer, et à quelle vitesse.

En 2023, le marché s'élargit rapidement. GPT-4 sort. Claude arrive. Meta publie LLaMA, ce qui élargit fortement l'accès aux modèles open source. D'autres acteurs prennent de l'importance. Ce qui, quelques années plus tôt, relevait surtout d'un petit nombre de laboratoires devient un marché beaucoup plus large.

Mais le vrai changement n'est pas seulement là. Il est dans la manière dont les organisations commencent à aborder le sujet.

Au début, l'IA était perçue comme un thème à surveiller. Ensuite comme quelque chose à tester. Puis comme un enjeu à encadrer. Aujourd'hui, dans les entreprises les plus avancées, c'est déjà un sujet d'exécution.

Depuis 2024, on voit de plus en plus de systèmes construits autour de ces modèles. Ils ne servent plus seulement à produire du texte dans une interface de démonstration. Ils sont branchés à des outils, à des bases de données, à des logiciels internes, à des processus métier. Ils trient, rédigent, classent, analysent, assistent, déclenchent des actions et, dans certains cas, prennent en charge des pans entiers d'un flux de travail.

C'est là que l'écart commence réellement à se creuser.

Certaines organisations ont déjà accumulé plusieurs années d'expérience. Elles ont testé, raté, corrigé, recommencé. Elles ont appris ce qui fonctionne, ce qui ne fonctionne pas, où la technologie crée de la valeur et où elle en détruit. Elles savent mieux comment intégrer ces outils dans la réalité des opérations.

D'autres commencent à peine à se poser les bonnes questions.

Et cet écart ne se rattrape pas d'un coup. Parce qu'il ne dépend pas seulement de l'accès aux modèles. Il dépend de l'expérience accumulée, de la qualité des cas d'usage choisis, de la vitesse d'exécution, et de la capacité à transformer une technologie nouvelle en avantage concret.

En 2026, la ligne de séparation n'est plus entre ceux qui ont entendu parler de l'IA et les autres.

Elle est entre ceux qui ont déjà commencé à construire avec elle, et ceux qui sont encore en train d'en discuter.

L'histoire de l'IA depuis le transformeur

Prêt à passer à l'action ?