this post was submitted on 07 Jun 2026

1 points (100.0% liked)

France

3637 readers

14 users here now

La France et les Français

Le pass BnF pour accéder à la presse : https://jlai.lu/post/4214444

Communautés principales

Nous rejoindre sur Zulip: https://jlailu.zulipchat.com/

Règles

Multi-lingual community: posts in other languages than French are allowed. 🚀
Tous les francophones sont bienvenus. 🐌
Remember the human : pas d’insultes, pas d’agressivité, pas de harcèlement entre utilisateurs. 🤖
Xénophobie, racisme et autre forme de discrimination sont interdits.🌈 Lien vers le code de conduite de l'instance: https://jlai.lu/post/5
Pas de doublon. Pas de spam. Évitez les paywalls autant que possible.☔
Utilisez la fonction "Report" pour signaler le contenu contrevenant aux règles.🏴
Le contenu doit être en rapport avec la France ou la population française.🇨🇵

FAQ, guides et ressources :

https://jlai.lu/post/541698

Actualité internationale

Loisirs:

Vie Pratique:

Société:

Villes/Régions

Pays:

Humour:

Fedivers:

!testfediverse@jlai.lu

Communauté de secours:

!jlailu_statut@sh.itjust.works

founded 3 years ago

MODERATORS

Professeur_Falken@jlai.lu

leftascenter@jlai.lu

Une IA vient de faire une découverte mathématique majeure (et personne n'en parle) (www.youtube.com)

submitted 3 weeks ago by keepthepace@tarte.nuage-libre.fr to c/france@jlai.lu

88 comments fedilink hide all child comments

Comme d'habitude, Mr Phi a bien fouillé les articles sur le sujet et donne un état de l'art sur les preuves mathématiques par des LLMs

you are viewing a single comment's thread
view the rest of the comments

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 3 weeks ago (1 children)

Je pense pas que l'ambiance soit giga AI bro ici, c'est plus un mix entre "l'usage de l'IA pour tout et n'importe quoi a un impact social et écologique énorme" et "il faut bien admettre que dans certains domaines l'IA semble permettre des découvertes"

Cette vidéo penche plus du deuxième côté, mais je pense que tout le monde a bien conscience des conséquences négatives de l'IA.

[–] keepthepace@tarte.nuage-libre.fr 0 points 3 weeks ago (2 children)

Franchement, quantifiez l'impact écologique de l'IA avant de le dire "énorme".

Il y a énormément d'activités humaines qui ont un impact nul, voire négatif, qui ont un impact écologique bien plus grand.

Quant à l'impact social, oui, il me paraît clair qu'il est énorme, il est gigantesque. Par contre, il ne m'apparaît pas évident qu'il soit négatif à long terme. Si on sort enfin de la tyrannie du travail et de l'obligation de travailler pour avoir droit à la survie, ce sera la plus grande avancée sociale de notre vivant.

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 3 weeks ago (1 children)

Ouais, j'ai hésité à mettre impact énorme "dans les années qui viennent".

C'est sûr que d'un côté, l'impact écologique réel de l'IA est discutable, c'est impossible de s'y retrouver. Il y a des exagérations dans les deux sens : oui, ça ne consomme pas tant que ça comparé à d'autres secteurs, mais ça be génère pas 0 émissions contrairement à ce qui a pu être sous-entendu. Entre les impacts de construction de datacenters et l'apports d'électricité produite par des sources fossiles (sachant que même les sources decarbonées ont un coût écologique à leur construction, qui est infime une fois étalé sur leur production mais qui existe), il y a forcément un impact à considérer, même s'il est relativisé.

Les apports de l'impact social, on verra bien, j'aimerais être aussi positif que toi. Jusqu'ici toutes les révolutions technologiques n'ont pas vraiment réduit la quantité de travail par rapport à une vie humaine, elles ont juste changé l'organisation du travail et la productivité. Peut-être que celle-ci est la bonne, mais je ne veux pas me faire de faux espoirs perso

[–] keepthepace@tarte.nuage-libre.fr 0 points 3 weeks ago (1 children)

Moi, je veux bien parler des gains et des coûts. Et je veux bien qu'on regarde le résultat net. Mais je refuse de le faire avec des gens qui ne veulent pas quantifier. La comparaison que je faisais à une époque et qui m'apparaissait assez pertinente, c'est que les gros modèles open source émettaient à peu près en CO2 autant qu'un avion faisant un vol transatlantique. J'utilisais cette base pour dire qu'une conférence internationale sur un sujet de recherche, c'était à peu près le même bilan carbone.

Il y a un certain consensus pour dire que les conférences internationales de recherche, c'est quand même un truc utile. Je pense qu'on peut probablement trouver plus d'avancées dans la recherche liées à des modèles d'IA que dans leur équivalent CO2 en conférences internationales. Je veux dire, rien que Alpha Fold nous fait faire une telle avancée qu'on a un offset pour un petit moment.

Et cette vidéo parle entre autres d'un aspect dont quiconque a fait un petit peu de recherche réalise la portée: Les LLMs aujourd'hui ont une immense culture scientifique dans tous les domaines et sont très bons pour faire de la recherche documentaire dans des domaines très différents. Le boost que ça donne en recherche d'avoir l'équivalent de 5 à 10 personnes qui font ta biblio, Je pense qu'il y a 10 ans, tous les chercheurs en rêvaient.

Jusqu’ici toutes les révolutions technologiques n’ont pas vraiment réduit la quantité de travail par rapport à une vie humaine

Bah quand même, si, et ce graphe ne tient pas compte des années de retraite et d'étude, bien plus nombreuses qu'il y a un siècle.

On notera quand même que toutes les professions qui avaient pour but principal d'utiliser la force musculaire ont disparu. Il y a toujours des gens qui font de la manutention, mais ils le font avec des machines. Et ça démultiplie leurs capacité de transport.

Le progrès technologique, lui, a tenu ses promesses, mais ce qui s'est passé, qui a fait louper le calcul qui nous promettait la fin du travail, c'est qu'on s'est rendu compte que les gens préfèrent avoir beaucoup plus de confort plutôt que de travailler moins. C'est enfin un calcul dont on est un petit peu en train de sortir avec la critique de la société de consommation. Mais aujourd'hui, si tu veux vivre comme quelqu'un de 1880 dans un logis insalubre (selon nos standards) sans eau et sans électricité, ça ne te coûtera pas très cher et tu peux travailler à temps très partiel pour ça.

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 3 weeks ago (1 children)

Ouais, déjà qu'en quantifiant le débat est loin d'être tranché, sans quantifier c'est juste donner son ressenti on est d'accord.

Je ne relève pas particulièrement la comparaison avec les vols internationaux, je ne comprends pas bien si c'est l'usage total, un usage personnel ou l'entraînement du modèle qui correspond à un vol transatlantique. Quoiqu'il en soit, d'accord sur deux points : c'est pire de prendre l'avion, et à peu près autant utile, et on peut trouver des domaines où l'IA est particulièrement utile.

Sur la réduction du temps de travail, oui on est en pente descendante depuis le XIXe siècle, mais à l'échelle de l'histoire de l'humanité globale, c'est pas drastiquement descendu. Certaines révolutions ont contribué à le diminuer (notamment l'usage du pétrole), mais d'autres l'ont fait augmenter (la révolution industrielle et le travail en usine). C'est touchy, ça nécessite de définir le travail (faire ton potager ou ton asso le soir après le boulot, c'est du travail ?), mais à très grande échelle je juge que ça stagne, avec une tendance à l'amélioration récemment.

On notera quand même que toutes les professions qui avaient pour but principal d’utiliser la force musculaire ont disparu.

MDR, je ne peux qu'espérer que c'est une généralisation dont l'excès est assumé, parce que clairement non. Déjà, on va mettre de côté les pays en voie de développement. Mais même dans notre société, je sors de ma journée dans les vignes, j'ai pioché, j'ai ébourgeonné, j'ai cisaillé des branches. Oui, le secteur s'est énormément motorisé, mais y'a toujours de quoi bosser avec tes mains (on est d'ailleurs plus nombreux.ses côté ouvriers viticoles que côté tractoristes). Pour l'anecdote, les machines conduisent à de nouvelles tâches, ou en rendent certaines essentielles : par exemple, les machines à vendanger ne font pas le tri entre grappes et merdes qui traînent dans la vignes, donc c'est essentiel de virer certaines plantes qui résistent aux produits et seraient récoltées en même temps que le raisin, et pour ça on pioche. En vendanges à la main, ce serait pas un problème.

Sur l'équilibre confort / travail, on est plutôt d'accord, même s'il faut quand même souligner que c'est pas uniquement "les gens préfèrent du confort que de travailler moins", c'est "la société a imposé le confort", imposé à la fois au sens de suggérer massivement (société de consommation, pubs, toussa toussa) et au sens d'empêcher ou de complexifier le manque de "confort" (aujourd'hui, vivre sans voiture peut être un handicap majeur selon ta situation, et vivre sans téléphone/ordi idem).

Et dans le même bloc, à nouveau, la comparaison avec le XIXe siècle est légitime, mais ça reste une des pires périodes de l'humanité. Si je veux vivre aujourd'hui comme au Moyen-Âge (matériellement, pas dans l'organisation sociale), bah c'est vachement compliqué en fait. Je vais pas te mentir, perso avoir une vieille bicoque, un potager, et un boulot dans les champs du village, même sans eau courante et sans électricité, ça me chauffe bien, mais je suis bloqué pour l'accès au logement, l'accès au bois, l'accès à l'eau (rivières turbo-polluées, sources contrôlées par la communauté, etc.). Ça me va que les choses soient comme ça, qu'il faille faire avec, mais qu'on ne vienne pas me dire que je choisis tout ça parce que j'aime mon petit confort, j'ai pas eu mon mot à dire, et les masses non plus.

[–] keepthepace@tarte.nuage-libre.fr 0 points 3 weeks ago (1 children)

MDR, je ne peux qu’espérer que c’est une généralisation dont l’excès est assumé, parce que clairement non.

Chaque fois, il y a ce malentendu, alors que pourtant, j'essaie de prendre des précautions oratoires. Je ne dis pas que les métiers musculairement fatigants ont disparu. Je dis que les métiers où tu es deux fois productif quand tu es deux fois plus fort, eux, ont disparu. Être capable de porter un sac de 80 kg au lieu d'un sac de 40 kg, ça rendait un docker deux fois plus productif.

Reste quelques déménageurs, reste quelques métiers au niveau de la récolte en effet. Contre ce qu'était la grande majorité des boulots autrefois.

mais à l’échelle de l’histoire de l’humanité globale, c’est pas drastiquement descendu.

Je doute que les esclaves étaient aux 35 heures et partaient à la retraite à 60 ans.

Et dans le même bloc, à nouveau, la comparaison avec le XIXe siècle est légitime, mais ça reste une des pires périodes de l’humanité.

Il y a un mouvement dont je me méfie beaucoup qui est une espèce de romantisation des périodes antérieures sur lesquelles justement on n'a pas de stats. Ça ne coûte rien d'affirmer que les paysans du Moyen-Âge ne travaillaient que deux heures par jour en moyenne. Dans les faits, j'ai de gros doutes.

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 3 weeks ago (2 children)

Pour éviter un malentendu, j'éviterais l'usage du mot "toutes" et "disparu". Parce que même dans ta nouvelle explication, la phrase prise pour son sens immédiat est fausse : les gars deux fois plus costaud que moi sont deux fois plus loin dans les rangées. Ce genre d'effet n'a pas "disparu".

Ceci étant dit, j'ai été très à cran sur l'usage d'une tournure absolue, et je te présente mes excuses pour ça, c'est un déclencheur chez moi. Je reconnais que ton argument tiens même quand on le réduit aux faits : les machines nous rendent plus productifs et rendent le travail moins pénible dans son ensemble. Je pense pas qu'on ait besoin de dire que "tous les métiers musculairement pénibles ont disparu".

Les esclaves étaient certainement pas aux 35 heures, mais c'est pas garanti qu'iels bossaient plus que les ouvriers du XIXe. Ça dépend beaucoup des cas, mais dans l'idée, ton esclave, c'est ta propriété, s'iel crève, c'est ton patrimoine que tu perds, donc tu as intérêt à bien lea traiter et à pas trop lea fatiguer. Tes ouvriers et ouvrières, tu t'en fous, s'iels crèvent, d'autres viendront.

Le risque de romantisation des périodes antérieures est avéré, ceci dit il faut lui adosser le phénomène inverse, ces périodes ont souvent été dépeintes comme des périodes horribles, la vérité est sans doute quelque part entre les deux. Je maintiens qu'à mes yeux, les conditions matérielles de vie se sont détériorées pour l'humanité à deux moments de son histoire au moins : la sédentarisation et la révolution industrielle. A chaque fois, je pense qu'on peut en faire la même analyse à gros traits : ce ne sont pas les bonnes conditions de vie pour toutes et tous qui permettent l'émergence ou le renforcement de pouvoirs, ni l'avantage reproductif d'une partie de la population. En d'autres termes, ce n'est pas nécessairement parce que les gens sont plus heureux qu'iels se reproduisent plus, ni que des structures sociales fortes émergent. A mon sens, les deux fois, il y a eu un gain de productivité qui a impliqué une dégradation des conditions de vie immédiates, mais a permis une amélioration sur le très long terme.

Et comme j'ai précisé, je ne parle pas des structures sociales du Moyen-Âge (donc du nombre d'heures de travail), mais bien du niveau de vie matériel. Si tu y rajoutes les connaissances médicales d'aujourd'hui, je maintiens que c'est clairement un niveau de vie qui m'irait, et que je ne peux pas juste le choisir librement aujourd'hui.

[–] keepthepace@tarte.nuage-libre.fr 0 points 3 weeks ago (1 children)

Bien noté, désolé je réponds un petit peu en rafale de façon abrupte à plein de personnes en même temps.

C'est tout à fait possible que le XIXe siècle représente le pic de la proportion de temps vivant travaillé. Mais il faut quand même noter qu'on n'a pas de stats qui permettent de l'affirmer avec certitude. C'est le pic de ce qu'on mesure, mais c'est aussi l'origine de ce qu'on mesure.

Et force est de constater que depuis ce pic, ça diminue.

L'autre chose à constater, c'est que la production, elle, ne baisse pas en quoi que ce soit.

en valeur, en volume. On produit toujours plus en travaillant toujours moins.

Alors il me paraît très clair que les mouvements sociaux ont joué un grand rôle dans la diminution du temps de travail. Mais il me semble également clair que le progrès technologique est la raison pour laquelle cette diminution du temps de travail a été possible sans diminuer la production.

Il y a un jeu à somme nulle entre l'augmentation du salaire horaire et les dividendes qu'on peut extraire du travail des employés. On n'a jamais vraiment réussi à tirer la corde suffisamment pour que la part des dividendes baisse en absolu. Mais on arrive à faire augmenter le salaire horaire. C'est largement les augmentations de productivité liées aux améliorations technologiques qui permettent aux deux quantités d'augmenter simultanément.

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 3 weeks ago (1 children)

Pas de soucis pour le mode de réponse.

Pour les difficultés à mesurer le temps travaillé, elles existent, mais on a quand même des indices. Je crois me souvenir d'une vidéo de NotaBene sur le temps de travail médiéval qui concluait par "c'était sans doute plus que nos 35h, mais pas autant plus que ce qu'on s'imagine". Et je me souviens aussi de reportages sur les sociétés de chasseurs cueilleurs actuelles et disparues qui en déduisaient que le temps de travail était d'entre 30h et 40h, mais qui soulignaient que le travail a des sens différents dans les deux cas. Bref, ça reste des indices vagues, mais mon argument n'a pas besoin de chiffrages précis, il a besoin de tendances.

Sur l'augmentation en production liée au progrès technique, je suis d'accord que ce phénomène existe, je ne cherche pas à le nier, mais à le nuancer. J'estime qu'il s'accompagne d'une évolution, partiellement choisie et imposée, partiellement souhaitable et criticable de ce qu'on considère comme nécessaire et confortable. Je pense qu'une grande partie de la persistance des problèmes sociaux, voire leur intensification, malgré les progrès techniques est due à cette adaptation des demandes. Ça porte un nom comme paradoxe je crois, en gros quand qqch est plus efficace, on en vient pas à l'utiliser moins, mais à s'habituer à le consommer plus. Et ça me paraît tout à fait pertinent d'appliquer ça à l'IA, en plus du fait qu'elle est aux mains d'élites dont les intérêts ne sont pas ceux de l'humanité dans son ensemble, pour alerter sur les risques que les progrès sociaux soient reportés, voire empêchés.

Tout ceci est d'autant plus impactant je pense quand on ne regarde pas uniquement nos sociétés européennes mais le monde dans son ensemble. Oui, le progrès technique permet certains progrès sociaux, mais ça ne veut pas dire que tout progrès technique amène nécessairement, et encore moins immédiatement, du progrès social, encore moins du progrès social massif ou total. Genre les gamins qui meurent dans les mines de métaux, sont exploités dans les usines, pour qu'on puisse avoir cette discussion sur nos appareils numériques, et que l'IA puisse construire ses datacenters, bah c'est quand même un coût social monstre, dans tous les sens du termes.

[–] keepthepace@tarte.nuage-libre.fr 0 points 3 weeks ago (1 children)

Ça me paraît crédible que les ouvriers avaient des journées plus chargées que les paysans. Parce qu'après tout, le moteur de l'exode rural, c'était aller chercher du travail en ville, car la campagne n'arrivait pas à absorber toute la main d'oeuvre. Ça peut s'expliquer par justement un travail insuffisant à faire (et donc à se faire payer pour).

Je pense que le nom que tu cherches, c'est le paradoxe du rebond ou le paradoxe de Jevons, qui l'a énoncé en constatant que plus les machines à vapeur devenaient efficaces et produisaient davantage de travail pour la même quantité de charbon, plus on consommait de charbon.

Il faut une formulation assez précise pour considérer qu'il y a un paradoxe. C'est juste logique quand c'est énoncé sous la forme « dès qu'un process devient plus rentable, ce process est plus exploité ».

Ce que les gens qui invoquent ce paradoxe manquent souvent, c'est que ce n'est pas un effet absolu, mais c'est un effet économique. Il faut que l'efficacité économique de quelque chose augmente pour que l'effet de rebond se confirme.

L'effet Jevons peut s'appliquer aux IAs, mais il faut alors admettre que ça veut dire que c'est un process rentable, pas juste un truc inutile qui gâche du temps de calcul sans aucune utilité comme je le lis ailleurs. Si on admet que c'est un process créateur de richesse, on doit alors le comparer à ce qu'il remplace pour évaluer si c'est une bonne ou une mauvaise chose. Si en consommant 1 kWh tu évites 100 km de trajet à une voiture, c'est carrément rentable.

Et ça me paraît tout à fait pertinent d’appliquer ça à l’IA, en plus du fait qu’elle est aux mains d’élites

Le problème, c'est que ça, ce n'est pas vrai. L'IA n'est pas dans les mains d'élites. Et c'est ça qui me désespère et que je me tue à répéter dans toutes les conversations à ce sujet. Les technos utilisées, elles sont ouvertes, elles sont connues, les architectures sont connues, les architectures sont publiées. Et dans le top 5 des modèles les plus performants, on a généralement des modèles ouverts (ça change littéralement toutes les semaines) que vous pouvez faire tourner sur des machines sans payer un centime de royalties à qui que ce soit et sans demander l'autorisation à qui que ce soit. Vous avez le droit de les améliorer, d'en faire un produit commercial, vous avez le droit de les désosser, vous avez le droit d'enlever la censure chinoise ou les barrières éthiques comme le font plein de chercheurs.

Alors certes, si vous prenez un modèle du top 5, la machine pour faire tourner ça, elle est un petit peu chère. Mais elle n'est pas non plus excessive. C'est de l'ordre de 200 000 dollars. C'est quelque chose qui est à la portée d'énormément d'organisations. Les modèles plus modestes que je fais tourner, qui me permettent de faire contrôler par des non spécialistes des flux d'analyse d'image assez complexes, tourne sur un PC de gamer. Et je parle pas des modèles de vision, que j'entraîne en local rapidement, cette techno étant bien plus mature que les LLMs (la révolution IA, chez les spécialistes, elle a commencé dans le domaine de la vision en 2012 avec AlexNet, le langage naturel a été conquis bien plus tard)

OpenAI, Anthropic, ils ont leur petite sauce secrète qui leur permet de se maintenir en tête du classement pendant 3 à 6 mois, mais ils sont talonnés par les modèles ouverts, parce qu'absolument personne en ce moment n'a envie justement de laisser un tel pouvoir dans les mains d'élites. Et c'est une chose qui me désespère, c'est une des victoires les plus écrasantes, les plus flamboyantes du mouvement open source, de l'idée que la recherche doit être ouverte, de l'idée que les idées sont des patrimoines communs de l'humanité. C'est une victoire super importante, c'est une victoire qui nous épargne des tonnes de dystopies au sujet desquelles la science-fiction nous a tous mis en garde. Et les héros qui mènent cette lutte ne sont absolument pas soutenus par les gens qui vont en bénéficier le plus. Ça me rend fou.

Et vous savez qui finançait les efforts ouverts ? Au début, ça a été Meta. Oui Meta de Facebook.

Ils n'ont pas fait semblant de prétendre que c'était pour des raisons idéologiques ou parce que tout d'un coup ils sont devenus des paragons de vertu. Ils ont simplement expliqué que c'est parce que c'était financièrement logique, que c'était plus efficace, que c'était dans leur intérêt. Je ne sais pas si vous vous rendez compte, mais l'open source, c'est techniquement un projet anarcho-communiste(non coercitif et non propriétaire). Et là, vous avez une des plus grosses capitalisations boursières qui dit que, de toute façon, l'open source, c'est logique pour eux. C'est plus efficace. On pourrait célébrer ça à un moment!

Et qui a pris le relais de l'open source/weight (y a un débat sur le bon terme) depuis que Facebook a arrêté ? Le Parti communiste chinois.

Alors, je ne sais pas vous, mais Meta ou le PCC, déjà, c'est un petit peu le grand écart, mais je ne fais confiance à aucun des deux. Je trouverais ça cool quand même qu'il y ait un support un petit peu généralisé pour que cette recherche puisse continuer sur des bases un petit peu plus sereines, notament en France.

Mais quand on propose d'aider Mistral ou des modèles de recherche, c'est accueilli comme une proposition d'ouvrir un portail démonique au milieu d'une école maternelle.

respire respire

Pardon je vais prendre mes pillules roses

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 3 weeks ago (2 children)

Sur la nécessaire rentabilité des IA pour générer un effet de rebond : effectivement, mais c'est pas moi qui le dit que les IA vont être rentables (ce qui est impliqué par le fait qu'elle soient un progrès social), c'est toi. Je dis justement que même en cas de rentabilité, l'effet de rebond peut empêcher ou retarder le progrès social.

Sur les projets ouverts : Je trouve qu'il y a pas mal d'oeillères ou de mauvaise foi dans ce passage, en tout cas de ce que j'en interprète.

Trois points à te concéder avant de posee mes critiques : oui, on ne parle pas assez de la qualité des modèles ouverts. Oui, idéalement il faudrait financer des modèles alternatifs. Et oui, l'open source utilisé par les big tech, c'est une victoire (mais on a pas attendu l'IA pour ça, on a d'autres exemples, donc je trouve ça juste mais hors-jeu).

Premier point : il y a une différence entre ouvert et accessible. Les technologies pour faire des navigateurs sont ouvertes, et pourtant on reste bloqués avec des chromium-like, des Firefox-like et des Webview-like. Les autres options sont incroyablement loin derrière, et du coup quand Firefox fait de la merde, nos seules options sont des demies mesures genre Librefox, ou de changer de famille et d'avoir d'autres défauts. Pourquoi ? Parce que c'est complexe ses grands-morts. Techniquement, on a les connaissances pour construire nos propres voitures, nos propres téléphones. Mais qui fait ça ? C'est sûr qu'héberger des IA locales, c'est plus facile, mais tu l'as dit toi-même, les plus puissantes, càd précisément celles qui pourraient amener un changement social drastique, c' est compliqué, pour être gentil. Donc à mes yeux, quelque chose peut être à la fois ouvert et aux mains des élites, ce n'est pas mutuellement exclusif (tu as raison de rappeller qu'on peut concevoir un univers où ce n'est pas le cas, mais pour l'instant ce n'est pas le nôtre).

Deuxième point : je trouve quand même carrément abusé de venir dire "nan mais les IA ne sont pas au mains des élites", pour ensuite dire "j'aimerais bien une alternative à Meta et au PCC", et que l'alternative en question c'est Mistral. Genre, c'est pas aux mains des élites, mais c'est chiant que y'ait que des élites qui le financent, et si on finançait cette version privée détenue par un milliardaire ? Même des modèles de recherche, si ça passe par des universités et surtout si ça a besoin de gros financement, dans une société où les élites contrôlent les financement, bah c'est aux mains des élites (c'est sûr que je préfère les élites académiques, loin très loin devant les élites politiques, loin devant les élites économiques, mais c'est marrant à quel point le contrôle sur l'IA et surtout ses financement est inversement proportionnel à ma liste).

Honnêtement, je comprends qu'on puisse se passionner par les IA, et être frustré par tous les aspects positifs masqués par la vague anti-IA, qui est souvent bas du front. Désolé de te plonger dans une opposition si frustrante. Mais tous les arguments jusqu'ici, loin de me convaincre, me font dire que les anti-IA ont vraiment de bonnes raisons, derrière le discours "AI baaaad".

[–] PatteBlanche@jlai.lu 0 points 3 weeks ago (1 children)

Je pense que tu te trompes sur l'open source : les alternatives à la libreWolf n'ont pas pour objectif de remplacer Firefox mais de faire pression sur eux en les empêchant d'avoir un monopole. Les navigateurs web ne sont pas "aux mains des élites" justement parceque tout le monde peut voir ce qu'ils font et se barrer s'ils le désirent : c'est l'open-source qui permet un rapport de force entre les élites et les utilisateurs, rapport de force qui n'existe dans aucun autre domaine (ni dans l'automobile ni dans la téléphonie).

Le fait que les GAFAM ont plus de moyens techniques alloués au développement de modèles open sources que Jeanine, ta voisine, ne change rien à leur droit d'accès et de modification des modèles. Dans la pratique, Jeanine peut décider d'utiliser le modèle tel qu'il a été conçu par Meta ou tel qu'il a été modifié par des internautes pour passer outre la censure, retirer un watermark ou corriger des biais.

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 3 weeks ago (1 children)

C'est peut-être plus nuancé que ce que j'ai exprimé, mais j'ai quand même l'impression d'avoir compris, et d'avoir plutôt raison.

Déjà parce qu'il y a la différence entre capacité de modification et capacité de développement : on peut essayer de rattraper les dérives tant qu'elles sont superficielles, mais on ne peut pas corriger les modèles une fois entraînés, à ma connaissance. On peut peut-être tout modifier dans un navigateur, je me rends pas compte des possibilités techniques, mais si Firefox décide de devenir closed source, on sera bloqué avec ce qui existe actuellement, et bon courage pour la suite. Pareil pour les fonctionnalités implémentées, c'est en bonne partie ce que Firefox choisit de faire qui est fait. J'imagine qu'on peut aider en soumettant sdes contributions externes, mais sur les features les plus complexes, là où il faut des gros moyens, c'est elleux qui gèrent.

Et surtout parce qu'il y a une différence entre les faits et les possibilités offertes à Jeannine : combien de gens utilisent Firefox, et quelle proportion encore plus ridicule est passée à des alternatives ? Dans les chiffres, les élites ont la main mise. Oui, tout le monde peut changer, mais le capital s'est bien accomodé de cette possibilité, et ça l'a pas empêché de construire des quasi monopoles.

C'est comme les bagnoles, si on veut, on peut éviter les grands groupes et en fabriquer soi-même. Mais bon courage.

Vu que c'est une question de chiffres, c' est même comme notre système politique : oui, oui, c'est une démocratie, tu peux ne pas vivre aux mains des élites si tu réunis assez de personnes pour détricoter le système de concentration de richesses en place. Mais bon courage.

[–] PatteBlanche@jlai.lu 0 points 3 weeks ago (1 children)

Oui, tout le monde peut changer, mais le capital s’est bien accommodé de cette possibilité, et ça l’a pas empêché de construire des quasi monopoles.

C'est un contre sens : le capital ne s'est pas accommodé de l'open source (ils ferment leurs modèles dès qu'ils en ont les moyens), c'est la population qui s'est accommodé de dépendre des décisions de la bourgeoisie. La situation actuelle n'est pas causé par une limite de l'open source, mais par une limite de l'engagement de la population.

Et ce n'est pas comme la bagnole, justement, puisque les technologies de la bagnole sont fermés. Même des modifications extrêmement simple et superficielles (retirer un siège) sont strictement interdite et impossible à rendre légal dans la pratique. Le réactif limitant n'est pas la capacité de production de Jeanine, c'est juste que sa kangoo sera immobilisé si elle se fait prendre par la police.

Dans le cas des IAs, chercher à s'approprier la technologie en pointant du doigt la silicon valley est une diversion qui ne mènera nulle part car maintenant que ces entreprises sont obligés d'ouvrir leur code la seule chose qui reste à faire pour se les approprier c'est de mobiliser les gens, les former sur le "pourquoi" et sur le "comment" de l'utilisation de modèles open source. Les modèles sont là il suffit de se baisser, il n'y a pas de majorité à obtenir, pas de 49.3, il faut vaincre sa peur et télécharger LMStudio (j’exagère à peine).

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 3 weeks ago (1 children)

le capital ne s’est pas accommodé de l’open source Il me semble que si, c'est précisément ce qu'on disait avec keepthepace : d'un côté, le capital profite de l'open source, voire le finance activement quand ça l'arrange, de l'autre côté, le capital a construit des monopoles closed source ou des walled garden qui concurrencent de manière écrasante l'open source, et dans certains cas en bénéficient. Je ne crois pas qu'on puisse dire que le capital mène une guerre d'éradication contre l'open-source, je pense qu'il l'a acculé dans un coin où il le maîtrise et en tire profit, ce que j'appelle "s'en accommoder".

La situation actuelle n’est pas causé par une limite de l’open source, mais par une limite de l’engagement de la population. Alors, oui, on est d'accord, c'est bien la limite d'engagement qui est la cause immédiate du problème. Mais je pense que c'est une limite de l'open source justement, de ne pas générer assez d'engagement. Ce n'est pas un tort inné de l'open source, c'est juste que le capital vend de la simplicité que l'open source peine à produire aussi massivement.

ce n’est pas comme la bagnole, justement la comparaison est foireuse, oui, mon mauvais pour l'avoir choisie. Notamment parce qu'il y a des régulations légales derrière, c'est un bon point. J'imagine qu'on pourrait restreindre la question aux voitures/quads/tracteurs utilisés sur des terrains privés, mais la comparaison n'en vaut pas la peine.

la seule chose qui reste à faire pour [s']approprier [les IAs] c’est de mobiliser les gens Sauf erreur de ma part, même en excluant les quelques éléments qui restent closed source, on ne peut que s'approprier que le code et les modèles finaux, pas les données d'entraînement (en tout cas pas dans leur intégralité) ni les infrastructures pour l'entraînement ni les processus de fine-tuning. Comme la plupart des objets industriels, on connaît les principes et éventuellement les blueprints, on peut faire ce qu'on veut de l'objet fini, mais avoir la main sur les processus de création, c'est autre chose.

Même si je me trompe sur le point précédent, ça faisait justement partie de mon argument que même au-delà de la maîtrise technique, la mainmise des élites se joue au niveau de l'engagement des gens, et qu'à ce jeu là, le capital est très fort pour captiver les gens. C'est comme si quelqu'un était manipulé pour rester en prison : ce n'est pas parce qu'on a ouvert la grille qu'iel est libre. Idem ici, ce n'est pas parce qu'on a la capacité technique de sortir du joug du capital qu'on en est sorti.

[–] keepthepace@tarte.nuage-libre.fr 0 points 3 weeks ago (1 children)

Je ne savais pas trop comment évoquer ce point. Et en fait, je vois que vous en discutez ici, donc c'est parfait. Je vais m'inviter. Coucou, PatteBlanche, je viens poser des tartines :-)

libre vs propriétaire

Le monde du libre a plus ou moins vaguement conscience de s'opposer au monde propriétaire, ça c'est clair. Par contre, ce n'est pas particulièrement réciproque. Les entreprises de technologie, elles, sont avant tout opposées les unes aux autres et considèrent souvent que le libre les menace moins.

Entre deux boîtes technologiques qui se battent, souvent elles considèrent que financer une alternative libre à la solution propriétaire d'un concurrent, c'est un peu comme une politique de la terre brûlée: «Je ne peux pas avoir ce marché, alors tu ne l'auras pas non plus»

Quand Google a beaucoup aidé à pousser des standards libres sur le web, c'est parce qu'il n'avait absolument pas envie que Microsoft se fasse un pré-carré dedans. Idem quand Meta se met à beaucoup financer des modèles ouverts en IA, c'est parce qu'ils ne voulaient absolument pas dépendre d'un monopole de OpenAI.

C'est vraiment un bel exemple du capitalisme qui nous vend la corde pour les pendre.

Ce qui arrive dans le champ du libre est irréversible, à mon avis. Une fois que des utilisateurs se sont habitués à ne pas avoir à payer pour quelque chose et avoir un contrôle total sur leurs algorithmes et leurs logiciels, il faut un argument massue pour revenir en arrière. Et également, il y a une victoire idéologique assez fondamentale qui est que même les entreprises capitalistes de technologie admettent que le modèle open source et le modèle de collaboration, c'est tout simplement le meilleur pour maintenir une chose dont tout le monde a besoin.

C'est un mode dans lequel à la fois la théorie capitaliste classique et la théorie marxiste se rejoignent: Les rendements du capital diminuent parce que le marché devient de plus en plus efficace à faire des choses, c'est-à-dire arrive à extraire de moins en moins de profits au fur et à mesure qu'on apprend à faire les choses.

Alors dans une production industrielle, on a besoin d'extraire suffisamment de profits pour pouvoir payer à minimum les salaires des travailleurs. Et en général, il en reste un petit peu pour se payer des dividendes. Mais dans le monde du software, où là, produire la copie d'un logiciel coûte à peu près zéro, on arrive à une étape suivante: la sortie totale de la logique marchande.

Sauf erreur de ma part, même en excluant les quelques éléments qui restent closed source, on ne peut que s’approprier que le code et les modèles finaux, pas les données d’entraînement (en tout cas pas dans leur intégralité) ni les infrastructures pour l’entraînement ni les processus de fine-tuning.

les données d'entrainement

Il y a en effet tout un débat sur la définition d'un modèle ouvert. Et c'est pour ça qu'on parle souvent de modèle open weights plutôt qu'open source.

Il y a des groupes comme LLM360 qui, eux, essayent d'être vraiment open source.

Il se heurte à un problème légal et pour lequel on aimerait bien avoir le support de la population, mais en général, on ne se prend que des coups quand on en parle, c'est qu'un dataset, aujourd'hui, on n'a pas le droit de le faire de façon ouverte parce qu'il contient du contenu 'piraté'.

Il n'y a absolument aucun doute que tous les modèles de langage propriétaires intègrent des données sous copyright pour lesquelles les droits n'ont pas été sécurisés. Pour la bonne et simple raison d'ailleurs qu'il n'y a aucun processus pour sécuriser de tels droits.

Supposons que tu aies envie que ton modèle soit capable de discuter de Lord of the Rings. Comment tu dois faire ?

Tu ne vas pas négocier œuvre par œuvre pendant des années d'obtenir des droits à plusieurs millions comme tu devrais pour faire un film, par exemple. Mais c'est la seule option qui donnerait une sécurité légale totale et certaine. Ça fait 30 ans qu'on attend que les ayants droit se mettent d'accord pour nous donner un truc qui ressemble à la licence globale. Là, il faudrait une licence globale sous stéroïde. Il n'y a juste aucune chance que ça arrive.

Tu peux acheter les livres et les scanner ou les acheter sous forme d'e-book pour les injecter à ton modèle, mais ça, il n'y a aucune garantie que ce soit légal parce que les ayants droit vont arguer que tu fais une œuvre dérivée. Ce qui au passage, d'un point de vue légal, est très discutable (le coté "oeuvre", pas le coté "dérivé").

Des modèles qui s'interdiraient de faire ça seraient plus mauvais. Simplement, si jamais tu publies un dataset d'entraînement (et que tu ne t'appelles pas Nvidia, eux ont des avocats) tu as la garantie de te prendre tout l'arsenal anti-piratage dans la gueule.

Eleuther AI a essayé à un moment de trouver un moyen de publier des datasets utilisables par tout le monde sans qu'on puisse reconstruire les œuvres, notamment en saucissonnant les datasets d'une façon qu'il soit difficile de réassembler des livres complets à partir du dataset d'entraînement, ou alors de coder les embeddings directement, ce qui en plus rendait le debugging assez difficile.

Si on veut des modèles vraiment open source, il va falloir accepter l'hypocrisie actuelle, qui est qu'on accepte que entraîner des modèles tombe dans le scope du "fair use". Et ce serait bien qu'on reconnaisse ce droit aux gens qui font de l'open source autant qu'aux gens qui font des modèles propriétaires. Pour le coup, le flou, en l'occurrence, aide complètement les entreprises qui ont des armées d'avocats et handicapent complètement les labos qui essayent de faire des choses en mode libre et ouvert.

les processus de fine tuning

Une grande partie de la "sauce secrète" des modèles est en effet dans le fine tuning, mais le fine tuning est généralement plus facile à faire, demande moins d'infrastructures, moins de temps d'entraînement et surtout de l'intelligence au niveau de la formation des datasets.

Et il y a une communauté assez active qui fait ce genre de choses depuis longtemps (cough cough pour du roleplay érotique). Il y a en particulier quand tu veux les entraîner sur des données métiers assez spécialisées que tu ne souhaites pas partager avec d'autres, que ce soit du médical, de la finance.

Il y a également des techniques qui, là, pour le coup, proviennent complètement de labos et pas du tout de boîtes privées, qui s'amusent à enlever la censure politique de certains modèles (surtout chinois pour le coup). Et à le faire sans nécessité d'entraînement supplémentaire, juste par des opérations qui sont quasiment de la chirurgie fine dans ces modèles. C'est assez marrant à suivre.

infrastructures libres?

Je ne sais pas ce qu'on considérait être des infrastructures libres. Pour l'instant, je n'ai pas d'exemple de choses comme ça, à moins qu'on considère que les infrastructures publiques sont des infrastructures libres, ce qui me semble contestables.

Par contre, on a des choses non propriétaires dans le sens où on peut facilement changer de fournisseur.

Il faut savoir que les hébergeurs aujourd'hui se sont équipés en GPU pour fournir du token à des gens qui le demandent. Et là, on parle de fournisseurs qui, eux, n'entraînent pas du tout de modèle, ne sont pas des boîtes d'IA à proprement parler, juste des gens qui louent des machines.

Si aujourd'hui tu veux faire tourner un modèle open source énorme comme Qwen 3.7, tu n'as pas besoin d'acheter les 200 000 euros de machine, tu peux les louer à un tarif journalier qui a un prix de marché avec énormément de compétition et qui aujourd'hui a convergé à un prix assez proche de l'électricité consommée plus un amortissement sur un an des GPUs.

Tu peux également louer ces machines pour faire de l'entraînement de modèles. Les gens qui font des expériences de fine-tuning, en général, font ça. Ils vont louer pour quelques jours ou quelques semaines un gros cluster qu'ils n'ont pas les moyens de se payer. Et ça va leur coûter peut-être quelques centaines d'euros d'obtenir un modèle configuré et fine-tuné selon les datasets qu'ils ont mis au point.

Dans le monde de la recherche, il y a des supercalculateurs équipés des cartes adéquates qui sont accessibles à des labos de recherche. Alors, je ne connais pas le détail d'accessibilité de ces choses-là. Et comme tu te doutes dans notre autre conversation, je ne considère pas automatiquement comme libre les ressources dont l'État a le monopole.

Il y a, ceci dit, un projet qui existe pour de l'inférence surtout, il ne semble pas encore au point pour du training, qui s'appelle AI Horde, qui est la mise en réseau de machines de volontaires pour faire de l'inférence pour les gens qui n'ont pas de GPU. C'est ce qui se rapproche probablement le plus d'infrastructures réellement libres. Vu la taille que c'est, par rapport à la taille que ça devrait être, c'est pour l'instant plus au niveau de l'espoir que de l'effort réel crédible.

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 2 weeks ago* (last edited 2 weeks ago) (1 children)

Message super intéressant, merci encore (je te réponds bientôt sur l'autre je prends juste mon temps ;) )

Sur la relation libre/propriétaire

On est globalement d'accord, c'est vrai que dire que le capital a "acculé dans un coin" l'open source, c'est sans doute dépeindre le monde avec trop de conflit.

Je pense par contre qu'il y a carrément des manœuvres du capital pour que tout ne soit pas open source, à commencer par leurs propres projets, mais aussi en rachetant des projets et en les faisant passer propriétaires. C'est plus un entre deux je pense, où l'open source est favorisé par le capital là où ça l'arrange, comme tu le décris, mais combattu ailleurs.

C'est marrant cette formulation du capitalisme qui vend la corde pour se faire pendre, parce qu'en fait je pense que c'est le cas de tout capitalisme. Hors de l'exemple du patron de l'usine de corde qui littéralement fabrique aussi la corde pour se faire pendre, il y a deux aspects du capitalisme qui auraient dû mener à sa perte : la compétition d'un côté, qui a tendance à donner des avantages "contre" les entreproses, et la constitution du prolétariat de l'autre côté, c'est-à-dire des gens nécessaires aux profits du capital et qui pourraient pourtant s'en émanciper. C'est simplement contré par un jeu du bâton et de la carotte, du monopole de la violence et de la manipulation des désirs, pour que tout tienne en place. Et l'efficacité de ces procédés me rend très sceptique quand à la possibilité de pendre effectivement les capitalistes avec les cordes qu'iels nous offrent dans leur guerre de compétition.

Sur le triptyque dataset/fine-tuning/infrastructures

Très intéressant ces manipulations de modèle par intervention chirurgicale plutôt que fine-tuning, tu as des liens vers ces gens là ?

Globalement merci encore, j'apprends un paquet de trucs. J'en tire les conclusions suivantes, hésite pas à me corriger :

les entreprises gardent l'avantage sur les dataset, pour des raisons légalistes et d'intérêts des détenteurs de droits, pas mal liées au système en place et à comment le capitalisme exploite les oeuvres culturelles
les entreprises gardent l'avantage sur les fine-tuning généralistes, mais c'est pas un gros avantage parce que 1) le fine-tuning est pas la partie la plus complexe et 2) on a de bons exemples de fine-tuning spécialisés et ouverts
les entreprises ne gardent qu'un très léger avantage sur les infrastructures, parce qu'en réalité il suffit de peu de moyens pour accéder à des infrastructures correctes. J'imagine qu'elles ont toujours un avantage pour les très gros modèles, mais des gens qui réunissent suffisamment de moyens pourraient avoir accès à un équivalent correct.

Sur la question des datasets, j'imagine qu'on sera toujours bloqué comme ça, au sens où certaines données un peu sensibles pour X ou Y raison seront toujours plus accessibles pour des enteprises qui promettront de garder les originaux secrets que pour des entités qui promettront de publier les originaux en open-source. Mais on pourrait sans doute réduire grandement ce désavantage si le lobby des ayant-droits ne défendait pas si farouchement ses intérêts.

[–] keepthepace@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

le capital et la compétition

Alors juste pour faire mon relou qui aime bien utiliser des termes précis, en fait le capitalisme et la compétition ça va pas nécessairement de pair. C'est le modèle libéral qui marie les deux. Une économie de marché liée à un capitalisme, c'est ce qu'on appelle le "modèle capitaliste" actuel, mais tu peux tout à fait avoir un capitalisme corporatiste qui assoit des monopoles avec éventuellement de la violence. Ce n'est pas le système libéral dont on a l'habitude, mais c'est quand même un système capitaliste qui permet une accumulation de capital et la création de rentes.

C'est une idée qui peut choquer un petit peu, mais la compétition et l'économie de marché, c'est plutôt quelque chose qui tempère le capitalisme et qui, comme tu fais remarquer, l'incite à s'autodétruire dans une certaine mesure.

Bon, alors, j'explique sans excuser. Je considère que l'expérience libérale qui imaginait que le capitalisme serve un modèle plus démocratique grâce à l'économie de marché a largement échoué. Mais je garde quand même personnellement en tête que la compétition, c'est quelque chose qui vient tempérer le capitalisme plutôt que l'aggraver.

Et l’efficacité de ces procédés me rend très sceptique quand à la possibilité de pendre effectivement les capitalistes avec les cordes qu’iels nous offrent dans leur guerre de compétition.

Alors personnellement, c'est juste un espoir et une vision que j'ai, mais je pense que si le gâteau diminue, les capitalistes vont passer plus de temps à se disputer les parts qui restent qu'à essayer de l'agrandir. Je ne pense pas qu'il y ait besoin de pendre ou de détruire les entreprises capitalistes, juste de démontrer leur inefficacité exemple après exemple.

Si tu compares une entreprise qui a des actionnaires et doit avoir une marge suffisante pour leur fournir des dividendes, et que tu compares ça à une coopérative qui, elle, n'a pas cette nécessité, elle peut être beaucoup plus efficace comme ça. Je pense beaucoup plus que la fin du capitalisme arrivera par des coopératives qui sont plus efficaces que les entreprises à leur propre jeu économique que d'un grand soir ou d'une révolution.

Rappelons d'ailleurs qu'à une époque, on considérait que c'était logique pour un gouvernement de gauche de forcer une certaine quantité de la commande publique de passer par des SCOP, les coopératives ouvrières.

acheter un projet open source

mais aussi en rachetant des projets et en les faisant passer propriétaires.

C'est souvent très difficile au point d'être en pratique impossible dans la plupart des cas d'acheter un projet open source avec beaucoup de contributeurs. Ça arrive qu'un projet open source se ferme, mais ça nécessite d'y avoir réfléchi dès le début et d'avoir pris des précautions pour faire du dual licensing et vraiment s'assurer que toutes les contributions ajoutées soient d'accord avec ce pivot potentiel.

Il y a certaines licences que personnellement je trouve trop dangereuses à considérer ouvertes, comme la BSD ou la MIT, qui autorisent assez explicitement les entreprises à les prendre et à les intégrer à un projet fermé, voire à le revendre sous un autre nom. Mais des licences comme la GPL ou l'AGPL évitent ces écueils.

Mais même avec ces licences plus permissives, le public garde le droit de continuer à créer des forks, en général ce qu'ils appellent une version communautaire, et gardent le droit de continuer le développement du projet de leur côté. Le monde du libre et ses licences sont mieux ficelées qu'on ne l'imagine souvent.

Sur le reste, oui, c'est clair qu'il y a une opposition. Je ne veux pas donner l'impression que je pense que les boîtes privées et le monde du libre sont de grands amis. Mais on a deux avantages principaux. Le premier, c'est qu'il n'y a pas une seule force du capital. Il y a plein d'entreprises en compétition et parfois, la victoire de l'une fait avancer l'open source.

La deuxième, c'est que les licences agissent un peu comme un cliquet anti-retour. Les victoires du libre sont assez difficiles à contester plus tard. C'est toute la subtilité d'avoir adossé les licences publiques aux lois qui entourent le copyright.

On utilise les mêmes outils juridiques pour faire défendre les obligations liées aux licences du libre que les capitalistes n'utilisent pour lutter contre le piratage. Ce n'est pas par adhésion idéologique à ces outils, cc'est au contraire, une forme de subversion que je trouve particulièrement délicieuse.

Chirurgie sur modèles: activation steering

Mes sources sur ces manipulations de modèles ne sont pas très récentes, elles datent de l'époque de Llama 2.

Une recherche rapide me montre ce site qui peut t'amuser, je n'ai pas regardé en détail encore.

Mais là, tu vas voir l'exemple d'une petite modification qui montre qu'un modèle peut, sans entraînement supplémentaire, être amené à, dans cet exemple, donner des conseils pour de la fraude fiscale.

Tu peux cliquer sur leur icône Paper pour avoir la publie scientifique qui explique comment ils ont fait.

Ça ne marche que sur les modèles ouverts dont on peut voir les activations intermédiaires et que l'on peut triturer directement. Le but du jeu est de trouver quels vecteurs ajouter dans leurs "processus de réflexion" internes pour les pousser vers plus ou moins d'obséquiosité dans les expériences classiques. Mais également dans ce que j'ai pu voir sur les expériences sur les modèles chinois, vers moins de censure gouvernementale.

Sur le triptyque dataset/fine-tuning/infrastructures

Je suis d'accord avec tes conclusions :-)

Même pour les très gros modèles, je pense que les grosses boîtes n'ont pas davantage d'infrastructures. Avec juste une exception pour l'entraînement de ces gros modèles, où là c'est un savoir-faire encore un petit peu spécialisé j'ai l'impression, et où là aussi il y a l'air d'y avoir des sauces secrètes.

Il y a quand même un enjeu de souveraineté à avoir les infrastructures nécessaires pour entraîner les très gros modèles, les "modèles frontières".

Alors personnellement, je suis de l'opinion qu'ils arrêteront de grossir et que GPT-4 était vraisemblablement le plus gros modèle qu'on n'entraînera jamais. Mais c'est une opinion personnelle, ce n'est pas une certitude à 100%. Du coup, ce n'est pas idiot non plus de stratégiquement garder un savoir-faire de dataset en entraînement pour le cas où, dans deux ou trois ans, on se rende compte que des modèles dix fois plus gros sont nécessaires pour certaines tâches.

Sur les datasets, oui, je pense qu'à moins d'une réforme du copyright, on reste toujours bloqué comme ça.

J'essaie juste de donner un petit peu de perspective sur les accusations de pillage de droits d'auteur auxquels on a le droit dès que les gens commencent à comprendre comment sont assemblés ces datasets. Jetez pas la pierre à ceux qui avouent qu'ils le font, parce qu'ils le font vraiment tous. Et ne jetez pas non plus la pierre à ceux qui ne font que du open weight, parce que souvent, légalement, ils n'ont pas la possibilité de faire vraiment du vrai open source.

Assez curieusement, les meilleurs modèles complètement open source dont les datasets et les procédures d'entraînement sont publiés sont probablement ceux de Nvidia. Pas exactement un grand fan de l'open source.

Mais là encore, c'est une boîte privée qui a trouvé son intérêt dans l'open source. Eux, leur but, c'est de vendre du matériel. Et plus il y a de modèles ouverts, performants, plus il y a de gens qui ont envie d'entraîner, de fine-tuner des modèles. Plus ils vont vendre de matos. Et c'est d'autant plus facile à faire qu'on dispose de bons modèles ouverts. Donc eux publient des modèles ouverts avec les datasets, se sont pris dans la gueule tous les procès auxquels on pouvait s'attendre, mais eux ont des avocats pour se défendre.

Et en fait, on a quelque chose qui va probablement nous débloquer dans les prochaines années sur la question des datasets. C'est ce qu'on appelle les datasets synthétiques. Et c'est une décision un petit peu étrange également qui a été prise par une cour américaine de déclarer que les sorties d'un modèle génératif ne tombent pas sous le coup du copyright.

Les données synthétiques, c'est un concept très simple. c'est qu'au lieu d'entraîner un modèle sur un dataset de sources variées, on va l'entraîner principalement sur les sorties d'un autre LLM qu'on sait assez bon. Contrairement à une croyance populaire qui vient d'une publi qui est a été assez mal comprise par le grand public, ça ne rend pas les modèles moins bons de faire ça, en tout cas pas sur une génération.

Et là, bon courage pour m'attaquer si je dis que moi j'ai payé pour un service en ligne qui a priori est légal, n'a jamais été reconnu comme étant dans l'illégalité et pour lequel j'ai payé pour des tokens que la loi considère ne pas être sous copyright. Ça va être assez difficile de m'accuser d'avoir violé du copyright indirectement ou d'interdire mon modèle.

Donc personnellement, je ne considère pas qu'il y ait une énorme incertitude légale là, mais c'est pour dire qu'il ne faut pas forcément jeter la pierre aux groupes qui ne publient pas leur dataset. Il y a une inégalité de moyens qui est vraiment problématique pour les communautés libres.

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

Sur le capitalisme

Merci pour toutes les précisions !

Je tiens à préciser que le fait que la émcanique de compétition incite le capitalisme à s'auto-détruire dans une certaine mesure, pour moi c'est purement de facade, ou purement théorique. Mon analyse, c'est que le pouvoir économique est un pouvoir, et que comme les autres il pousse les gens qui en ont à en vouloir plus, et je pense que cette mécanique de fond compense, voire dépasse tous les effets positifs que la compétition pourrait avoir.

Mais sinon, tout à fait d'accord, surtout sur le fait que la compétition, c’est quelque chose qui vient tempérer le capitalisme plutôt que l’aggraver. D'accord aussi sur le fait que la fin du capitalisme n'arrivera pas par le biais d'un grand soir ou d'une révolution au sens classique, mais j'ai peur que les coopératives ne soient pas la clef non plus : dans mon expérience, il faut beaucoup de garde-fous pour ne pas recréer des dynamiques capitalistes au sein des SCOP et des coopératives en général. Alors, c'est vachement mieux que des grandes multinationales, mais je n'y vois pas une vraie rupture avec le capitalisme. Ceci étant dit, si tu entendais ça comme l'outil qui amènera la fin du capital, alors ce n'est pas impossible, et je souhaite que tu ais raison.

Sur les transitions open source vers closed source

Certes, le passage en fermé n'est pas très fréquent, et peut toujours être contourné, même si ça reste des bâtons dans les roues du logiciel libre dans ces cas-là. POint pour toi.

Merci pour les liens vers l'activation steering !

Jetez pas la pierre à ceux qui avouent qu’ils le font, parce qu’ils le font vraiment tous. Et ne jetez pas non plus la pierre à ceux qui ne font que du open weight, parce que souvent, légalement, ils n’ont pas la possibilité de faire vraiment du vrai open source.

Excellent résumé de ton travail de nuance, merci encore <3

Contrairement à une croyance populaire qui vient d’une publi qui est a été assez mal comprise par le grand public, ça ne rend pas les modèles moins bons de faire ça, en tout cas pas sur une génération.

Ok, je pensais que c'était le cas ! Alors après, même avant de lire ça, je me disais que si tu constitue ton dataset avec une IA vraiment poussée et dont on sélectionne un peu les résultats, ça avait des chances de marcher. J'ai toujours l'impression que si par contre tu fais ton dataset avec tout le slop pondu sur internet par une quantité de modèles et de prompts à la qualité beaucoup plus variable, forcément ça donnera des résultats mauvais. Mais c'est peut-être faux aussi du coup.

[–] keepthepace@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

Haha, alors note que par rapport à d'autres personnes dans l'extrême gauche, moi j'ai plutôt tendance à considérer que le capitalisme, c'est à la fois plus facile d'en sortir qu'on le pense, mais également moins fondamental:

C'est une étape importante et nécessaire, mais ça ne nous empêche pas de lutter contre plein d'autres mécanismes d'oppression qui existent et qui ne vont pas magiquement disparaître lorsque l'on va changer la structure de propriété des moyens de production. On aura encore à parler du post-colonialisme, du sexisme, de diverses dérives religieuses... Toutes ces choses-là ne vont pas disparaître par magie, et on peut même les combattre dès aujourd'hui.

Franchement, la publication originale, je ne sais même pas si elle vaut encore le coup d'être citée. Elle démontre un effet sur un dataset particulier (wikitext2) de qualité sur un modèle de 125 millions de paramètres. Ils ont démontré un fait assez évident qui est que lorsque tu as un modèle imparfait qui essaye de prédire un dataset, il fait plein d'erreurs. Et que si tu réinjectes ce dataset plein d'erreurs dans l'entraînement d'un nouveau modèle, il va en faire encore plus. Ce n'est absolument pas garanti que ça se généralise à des plus gros modèles ou à d'autres datasets plus gros qui généralement sont de moins bonne qualité.

Ce n'était pas un résultat particulièrement surprenant, et ce n'était pas un particulièrement bon argument pour dire que les données synthétiques ne fonctionnent pas. C'est un point dans le débat, mais la presse s'en est emparée en faisant croire que le débat était tranché, ce qui n'était absolument pas le cas. Les données synthétiques ont une importance de plus en plus grande et on les utilise tout le temps.

Je compare ça à la publication scientifique qui avait prouvé que la force musculaire d'un bras humain n'était pas suffisante à actionner des ailes (correct) et en a conclu que les humains ne pourraient jamais voler.

PS: wow, pas de balise spoiler! On arrive à la fin de la conversation?

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

C'est dingue à quel point on peut être d'accord et pas d'accord x)

Perso je pense que sortir du capitalisme, c'est fondamental (après fondamental par rapport à quoi, vaste débat, mais au moins par rapport aux gens qui y vivent), et que c'est particulièrement difficile (je tiens le capitalisme pour un truc rampant qui va s'accrocher à son caillou comme un crabe au fond de son trou).

Par contre, ton paragraphe sur les autres oppressions, 100% d'accord, pas une seule nuance à apporter. Comme quoi !

Ok, merci pour les explications ! Et oui, dinguerie que cela, la discussion semble trouver son terme 😱 (après je prépare ma réponse sur l'autre fil, j'ai pas trop le temps en ce moment, mais ça arrive promis !)

[–] keepthepace@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

Bon ok, c'est un peu de la provocation. Ça reste un gros morceau, mais c'est qu'un seul item sur la longue liste des choses à améliorer.

Et surtout, je ne pense pas qu'on va le supprimer d'un coup, je pense qu'on va l'user à la longue. Et que oui, comme tu dis, ça va s'accrocher à son caillou, mais ça va devenir de moins en moins important dans le fonctionnement de l'économie.

Ça paraît aussi inatteignable aujourd'hui que la reconnaissance du mariage homosexuel dans les années 80 mais personnellement, je vois les mentalités progresser et je ne vois pas grand-chose qui puisse endiguer les efforts. Je vois plein de trucs qui peuvent aider à aller plus vite. Mais au moins, je trouve que les choses vont dans le bon sens.

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

100% d'accord, sauf sur le "pas grand chose qui puisse endiguer les efforts". Je pense que le consumérisme et toute l'influence par le biais des médias et par la suite des réseaux sociaux sera l'obstacle majeur (et d'ailleurs je me sens conforté dans cette analyse par le fait que la possession des médias est une bataille ouverte). Je pense du coup qu'on a même reculé en terme de conscience des effets néfastes du capitalisme, par rapport au début du XXe siècle. Je me rends pas compte des chiffres, mais j'ai quand même l'impression que les masses travailleuses sont moins conscientes d'elles-mêmes et de leur rapport au capital qu'avant. Alors, je pense quand même qu'aujourd'hui on progresse vers autre chose, et qu'on a progressé avec des acquis sociaux tout au long du siècle (qui ont joué dans cette perte de conscience du prolétariat), mais je ne lis pas l'avenir proche (les prochains siècles) comme acquis à cette cause.

[–] keepthepace@tarte.nuage-libre.fr 0 points 2 weeks ago

Je reconnais que mon optimisme est totalement subjectif et probablement lié à ce que j'observe dans ma propre bulle.

Par contre, de voir quelque chose comme la majorité des jeunes américains qui considèrent que "capitalisme" est une valeur plus négative que "socialisme", ça me fait dire que la bataille culturelle, elle est plutôt bien engagée.

[–] keepthepace@tarte.nuage-libre.fr 0 points 3 weeks ago

Bon, déjà, merci pour une critique plus posée que ce que je reçois dans les autres commentaires.

Je dis justement que même en cas de rentabilité, l’effet de rebond peut empêcher ou retarder le progrès social.

Je ne vois pas trop la logique là. Si ça a un effet positif, le fait qu'il y ait un rebond devrait causer au contraire un changement plus rapide et un basculement au lieu d'une évolution (ce qui est une des thèse en la matière ceci dit).

Premier point (ouvert et accessible)

Sur le premier point, tu as complètement raison, ce n'est pas parce que c'est ouvert que c'est accessible. Les technologies, elles sont difficiles et ce n'est pas à cause de barrières artificielles, politiques ou capitalistes, c'est juste en effet difficile. Tout est disponible sur Internet, si tu veux t'y mettre, tu peux, mais ça prend des mois, voire des années de suffisamment se plonger dedans pour comprendre comment modifier les choses.

C'est pour ça qu'il y a un vrai enjeu à l'appropriation des technologies, à une vraie discussion à avoir sur comment pouvoir les utiliser, les réutiliser. J'ai l'impression que le rejet des technologies, c'est un rejet de cette complexité, un peu de la façon que plein de pseudomédecines ont pour moteur le refus de comprendre les modèles beaucoup plus complexes de la médecine moderne. Mais si on refuse de s'approprier ces technologies, on les laisse aux autres. Et ça, pour moi, ce n'est pas une option. C'est un acte de résistance fort, important et politique de garder le contrôle de ces technologies.

Mais qui fait ça ?

les Fab Labs, les Hackerspace, nous autres, les "tech-bros-solutionnistes". On se fait traiter de tous les noms parce qu'on explique que ces technologies, elles sont là à ramasser pour quiconque veut s'en emparer. Et qu'il y a différents niveaux de packaging qui s'adressent à différents niveaux d'implication. Alors, plus c'est facile à utiliser, plus c'est imparfait, plus ça va utiliser des briques propriétaires, plus ça va utiliser des parties problématiques. Mais tu as tout un spectre de possibilités qui sont là. Et quand tu te penches sur les détails, tu découvres à quel point les LLM démultiplient l'accessibilité de plein de technologies.

La semaine prochaine, d'ailleurs, le thème de notre réunion au Fab Lab, c'est que je vais donner les billes à un bricoleur qui est plutôt dans la fabrication numérique pour pouvoir se fabriquer l'engin mobile qu'il veut. Il appelle ça un cyberdeck. Ce sera un truc entre l'ultra portable et le téléphone. Et évidemment, on va faire ça avec des technos libres. Vous pouvez venir si vous voulez. C'est gratuit.

Ce qui nous prend de la place au milieu de l'atelier en ce moment, c'est un prototype de tricycle cargo à assistance électrique qu'un autre membre du Fab Lab modifie grâce au soudeur laser qu'il vient d'acheter, (qui au passage est une petite révolution dans les métiers du soudage et a plein d'implications pour quiconque aime bien le vélo) et il y a une conscience écologique forte au départ de son projet.

Avec lui, on discute souvent justement de la difficulté à créer de nouveaux véhicules. Ce sont des difficultés législatives et techniques. Mais si ça se fait. Et quand je te parle dans l'autre discussion du fait que je tombe souvent sur des gens qui ont une mentalité anarchiste mais qui font des choses tranquillement dans leur petite bulle, c'est entre autres à ce genre d'initiative que je pense.

Second point, le contrôle des modèles ouverts

Deuxième point : je trouve quand même carrément abusé de venir dire “nan mais les IA ne sont pas au mains des élites”, pour ensuite dire “j’aimerais bien une alternative à Meta et au PCC”,

Alors j'ai mal dû m'exprimer. Imagine une situation dans laquelle il y aurait une seule entreprise qui financerait le développement de Linux. IBM par exemple.Linux resterait un système libre, ouvert et une alternative crédible à Windows ou à OS X. Pourtant, cette source de financement constituerait à une vulnérabilité évidente et son arrêt serait un coup dur pour le projet.

C'est la situation qu'on a aujourd'hui dans le monde de l'IA open source: Tous les outils sont ouverts, les architectures sont connues et les gens publient. Ce que Meta a posé sur la table et ce que plusieurs entreprises chinoises ont posé sur la table, c'est des centaines de millions, voire des milliards de dollars en puissance de calcul pour entraîner ces modèles. Et le résultat, ils l'ont donné (discutable pour certaines licenses des modèles Meta). Ils ne peuvent pas tuer ce qu'ils ont créé. Par contre, ils peuvent décider d'en arrêter le développement, comme Meta l'a déjà fait. Et si ça, ça arrive, les modèles ouverts resteront pendant un peu trop longtemps au niveau de 2026, pendant que les modèles des boîtes privées continueront à s'améliorer.

C'est là-dessus que j'aimerais bien qu'on ait des meilleures alternatives. Et l'alternative, ce n'est pas forcément Mistral, (même si aujourd'hui Mistral est le meilleur LLM qui ne soit pas entraîné dans une dictature, ce qui est quand même quelque chose)

Dans mon idéal à moi, ce serait des financements publics, ce serait des campagnes de crowdfunding parce qu'il y aurait un plébiscite universel pour se rendre compte à quel point ces technos sont positives lorsqu'elles sont ouvertes. Et on financerait ça soit via des fonds publics comme l'a été le modèle Bloom, soit via des groupes comme EleutherAI qui a été un pionnier en matière d'alignement et qui a créé le premier dataset ouvert: The Pile que probablement toutes les boîtes privées ont repris dans leur dataset d'entraînement, sans jamais venir à la défense d'Eleuther quand ils ont commencé à avoir eu des problèmes légaux.

Sur l'hébergement local

C’est sûr qu’héberger des IA locales, c’est plus facile, mais tu l’as dit toi-même, les plus puissantes, càd précisément celles qui pourraient amener un changement social drastique, c’ est compliqué, pour être gentil.

Il y a plusieurs idées fausses là dedans.

Plus haut, je parlais de l'appropriation des technologies.

Dans mon projet actuel j'utilise une IA hébergée localement pour transformer du langage naturel en commande d'un système complexe qui intègre plusieurs modèles de vision et des contrôles d'outils robotiques et qui a des capacités de programmation limitées mais suffisantes.

Le but que j'ai avec ce projet, c'est de permettre à des gens qui n'ont pas d'entraînement en informatique, en robotique, qui ne sont pas très techniques, mais qui ont un savoir-faire spécialisé en production, de s'emparer des outils d'automatisation sans avoir à passer justement par une boîte, un ingé spécialisé, etc.

Et par idéologie, je veux cibler les petites structures où les gens qui sont les plus à même de s'emparer de ces technologies sont des gens qui ne vont pas être foutus au chômage par des robots.

Désolé d'y voir une tentative de changement social. 9B c'est un modèle qui tourne sur une carte graphique à 300 euros.

Ensuite, je viens d'aller voir sur le LLM Leaderboard, (qui vaut ce qu'il vaut), quel est le meilleur modèle ouvert du moment. Ça a l'air d'être Qwen 3.7 Max, qui tourne sur 4 cartes H200. C'est quelque chose qui à l'achat vaut à peu près 120 000 euros (le lot de 4), auxquels il faut que tu rajoutes probablement à peu près autant pour connecter l'ensemble.

C'est le prix d'un petit équipement industriel. C'est le prix d'un achat modeste pour une petite commune. C'est le prix d'un tracteur, d'un rond-point. Et pour ce prix-là, tu as un des meilleurs modèles du moment qui tourne chez toi.

Il y a peu de technos qui restent aussi accessibles que ça! Ça te coûtera plus cher d'équiper un atelier pour travailler de façon professionnelle du métal que pour faire tourner un modèle à la pointe de la recherche en IA.

Quelque chose peut être à la fois ouvert et aux mains des élites

Donc à mes yeux, quelque chose peut être à la fois ouvert et aux mains des élites, ce n’est pas mutuellement exclusif

C'est possible, mais pour que ce soit possible, il faut une reddition générale.

C'est possible de maintenir une oppression sans violence, mais ça demande une soumission totale des opprimés.

C'est pour ça que je réagis aussi fort aux arguments qui disent qu'il faut rejeter en bloc toutes ces technos au lieu de se les approprier. Y renoncer c'est une condition nécessaire au contrôle par les élites de ces technos qu'ils pourront alors nous imposer. C'est un but contre son camp total.

Imagine des révolutionnaires à qui on donne des armes et qui décident qu'en fait, comme les oppresseurs ont des armes, eux ne veulent pas les utiliser.

[–] leftascenter@jlai.lu 0 points 3 weeks ago

Les esclaves étaient certainement pas aux 35 heures, mais c'est pas garanti qu'iels bossaient plus que les ouvriers du XIXe. Ça dépend beaucoup des cas, mais dans l'idée, ton esclave, c'est ta propriété, s'iel crève, c'est ton patrimoine que tu perds, donc tu as intérêt à bien lea traiter et à pas trop lea fatiguer. Tes ouvriers et ouvrières, tu t'en fous, s'iels crèvent, d'autres viendront.

Y'a pas de règles, la vérité fait le grand écart entre les deux.

Un esclave grec mycénien était plutôt bien traité pas loin d'un homme libre a priori, selon les traces. En Grèce athénienne le statut était en gros citoyen ou esclave, avec des ratio atteignant 1:4 donc la encore ça devait pas être trop pourri en moyenne sinon la ville n'aurait pas été aussi reussie. Sauf bien sur dans les mines, a la rame... Les boulots atroces. Les esclaves athéniens avaient d'ailleurs le droit de propriété, et presque tous les droits sauf la politique.

Un travailleur African dans les champs de canne a sucre américains était tué a la tache (moyenne de vie 7 ans dans mes souvenirs) et c'était moins cher d'en racheter un neuf, jusqu'à la fin du commerce triangulaire, a partir de quand les esclaves féminins faisaient du coup parti de la logique de reproduction du "cheptel" et on a commence a les économiser.

Un serf européen du moyen âge bossait en moyenne une trentaine d'heures par semaines avec de fortes variations saisonnières, mais vivait dans la précarité.

Pour les esclaves ottomans c'était total variable en fonction du type d'esclave.

Un esclave viking ou chinois en chiait sa race.

Et la c'est uniquement centré sur l'esclave de travail (production, services a la domus) pas sur l'esclavage sexuel qui est une horreur différente.

[–] leftascenter@jlai.lu 0 points 3 weeks ago (2 children)

1-3% de l'électricité mondiale projetée en 2030. C'est énorme.

[–] keepthepace@tarte.nuage-libre.fr 0 points 3 weeks ago (2 children)

Consommer de l'électricité, ce n'est pas émettre du CO2.

L'électricité, c'est la façon la plus propre de consommer de l'énergie, au point que le GIEC recommande une électrification des process et une augmentation de la production d'électricité, évidemment de façon renouvelable et décarbonée.

C'est un réflexe purement américain d'essayer de faire une équivalence entre le kWh et le CO2 émis en faisant l'hypothèse qu'on va créer de l'électricité en brûlant du pétrole ou du charbon. On ne fait plus ça en France, et le monde en sort progressivement.

[–] leftascenter@jlai.lu 0 points 3 weeks ago

Consommer de l'énergie c'est augmenter l'empreinte humaine. Le réchauffement climatique n'est que le problème actuel. Avant c'était la destruction dew cours d'eau, encore avant la disparition des forets, ça commence a être aujourd'hui la gestion des déchets de fission...

[–] inlandempire@jlai.lu 0 points 3 weeks ago (1 children)

Attends tu peux pas séparer la consommation de la production nécessaire pour permettre cette consommation, même l'ademe et l'aee comparent les émisisons en conséquence de la consommation

[–] keepthepace@tarte.nuage-libre.fr 0 points 3 weeks ago

Ça dépend à quel niveau tu te places, en fait.

Si ta question c'est de savoir si une technologie a sa place dans une société renouvelable (c'est à dire qui ne consomme pas plus que ce que l'écosystème produit et qui ne détruit pas son environnement), alors c'est tout à fait légitime de dire que d'une part, une activité n'utilise que de l'électricité, et d'autre part qu'on sait produire de l'électricité de façon renouvelable et que donc cette techno a sa place dans une telle société.

Si ta question est de savoir si aujourd'hui il vaut mieux allumer ou non ta clim, le mix énergétique actuel sur lequel cette clim est branchée est en effet à considérer. C'est pour ça que, naturellement, Anakin, tout le monde est en faveur de la construction de data centers en France, où l'énergie est plus décarbonée, plutôt que d'utiliser des modèles américains et chinois, n'est-ce pas? /s

On doit arriver à un mix 100% décarboné d'électricité. C'est comme ça qu'on va sortir de la crise climatique. Ce sera plus facile si on consomme moins, c'est sûr, mais les consommations ne nous empêchent pas de faire cette transition.

[–] PatteBlanche@jlai.lu 0 points 3 weeks ago (1 children)

Ce genre de projection ne veut rien dire : on vient de vivre un boom de l'IA, évidement que l'empreinte du secteur a augmenté rapidement, on ne peut pas extrapoler ces dernières années aux années à venir.

[–] leftascenter@jlai.lu 0 points 3 weeks ago (1 children)

On est déjà entre 1&2% aujourd'hui.

[–] PatteBlanche@jlai.lu 0 points 3 weeks ago

Ah effectivement la différence n'est pas énorme, mais du coup pourquoi utiliser une projection dans ce cas là ?