L’accord de Google avec Stack Overflow est la preuve la plus récente que les géants de l’IA paieront pour des données.

L’année dernière, Stack Overflow est devenu l’un des premiers sites web à annoncer qu’il facturerait l’accès aux géants de l’IA pour le contenu utilisé pour former des chatbots. Maintenant, le service populaire de questions-réponses pour les codeurs a enregistré son premier client, Google, dans ce que le PDG Prashanth Chandrasekar qualifie de début d’un nouveau flux de revenus « significatif ». L’accord est important, car il reste incertain dans quelle mesure Google et d’autres développeurs d’IA paieront pour le contenu nécessaire pour les projets d’IA. Des millions de livres et de sites web ont alimenté le développement de systèmes d’IA, mais la plupart des éditeurs n’ont pas été rémunérés, et certains intentent des poursuites pour ce qu’ils considèrent comme un usage abusif. De nombreux éditeurs, y compris Stack Overflow, semblent menacés par ChatGPT et d’autres produits d’IA générative, qui peuvent répondre à des requêtes qui auraient autrefois envoyé des codeurs vers eux. L’accord verra la division cloud de Google utiliser des questions et réponses de Stack Overflow concernant les services Google Cloud pour fournir une assistance au codage et un support technique via une version du chatbot Gemini de Google. Les clients de l’informatique en nuage de Google pourront également poser des questions via l’interface en ligne de commande de Google Cloud. « Leur IA ne possède pas toutes les réponses, et nous avons donc une immense capacité à compléter cette boucle », déclare Chandrasekar. « Nous sommes le plus grand endroit où les connaissances de la communauté sont organisées et validées. » Gemini résumera les réponses tirées de Stack Overflow avec ses propres mots mais inclura le logo de l’entreprise, un lien vers le matériel original et le nom d’utilisateur du contributeur du site qui l’a fourni. Les entreprises prévoient de présenter le système lors de la conférence annuelle sur le cloud de Google Cloud Next en avril et de le lancer peu après. Chandrasekar dit qu’il n’y a pas de restrictions significatives sur la façon dont Google Cloud peut utiliser les données de Stack Overflow, ce qui signifie qu’elles peuvent être utilisées pour former de grands modèles de langage et d’autres systèmes d’IA. « Ce sur quoi nous voulons être fermes, ce sont des éléments non négociables pour nous : la confiance, la précision, la qualité et l’attribution aux sources de ces sorties d’IA », dit-il. Il a refusé de dire combien Google paye Stack Overflow pour les données. « Cela constituera une offre commerciale significative pour nous à court terme, moyen terme et long terme », déclare Chandrasekar.

Share the Post: