this post was submitted on 07 Jun 2026

1 points (100.0% liked)

France

3637 readers

14 users here now

La France et les Français

Le pass BnF pour accéder à la presse : https://jlai.lu/post/4214444

Communautés principales

Nous rejoindre sur Zulip: https://jlailu.zulipchat.com/

Règles

Multi-lingual community: posts in other languages than French are allowed. 🚀
Tous les francophones sont bienvenus. 🐌
Remember the human : pas d’insultes, pas d’agressivité, pas de harcèlement entre utilisateurs. 🤖
Xénophobie, racisme et autre forme de discrimination sont interdits.🌈 Lien vers le code de conduite de l'instance: https://jlai.lu/post/5
Pas de doublon. Pas de spam. Évitez les paywalls autant que possible.☔
Utilisez la fonction "Report" pour signaler le contenu contrevenant aux règles.🏴
Le contenu doit être en rapport avec la France ou la population française.🇨🇵

FAQ, guides et ressources :

https://jlai.lu/post/541698

Actualité internationale

Loisirs:

Vie Pratique:

Société:

Villes/Régions

Pays:

Humour:

Fedivers:

!testfediverse@jlai.lu

Communauté de secours:

!jlailu_statut@sh.itjust.works

founded 3 years ago

MODERATORS

Professeur_Falken@jlai.lu

leftascenter@jlai.lu

Une IA vient de faire une découverte mathématique majeure (et personne n'en parle) (www.youtube.com)

submitted 3 weeks ago by keepthepace@tarte.nuage-libre.fr to c/france@jlai.lu

88 comments fedilink hide all child comments

Comme d'habitude, Mr Phi a bien fouillé les articles sur le sujet et donne un état de l'art sur les preuves mathématiques par des LLMs

you are viewing a single comment's thread
view the rest of the comments

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 2 weeks ago* (last edited 2 weeks ago) (1 children)

Message super intéressant, merci encore (je te réponds bientôt sur l'autre je prends juste mon temps ;) )

Sur la relation libre/propriétaire

On est globalement d'accord, c'est vrai que dire que le capital a "acculé dans un coin" l'open source, c'est sans doute dépeindre le monde avec trop de conflit.

Je pense par contre qu'il y a carrément des manœuvres du capital pour que tout ne soit pas open source, à commencer par leurs propres projets, mais aussi en rachetant des projets et en les faisant passer propriétaires. C'est plus un entre deux je pense, où l'open source est favorisé par le capital là où ça l'arrange, comme tu le décris, mais combattu ailleurs.

C'est marrant cette formulation du capitalisme qui vend la corde pour se faire pendre, parce qu'en fait je pense que c'est le cas de tout capitalisme. Hors de l'exemple du patron de l'usine de corde qui littéralement fabrique aussi la corde pour se faire pendre, il y a deux aspects du capitalisme qui auraient dû mener à sa perte : la compétition d'un côté, qui a tendance à donner des avantages "contre" les entreproses, et la constitution du prolétariat de l'autre côté, c'est-à-dire des gens nécessaires aux profits du capital et qui pourraient pourtant s'en émanciper. C'est simplement contré par un jeu du bâton et de la carotte, du monopole de la violence et de la manipulation des désirs, pour que tout tienne en place. Et l'efficacité de ces procédés me rend très sceptique quand à la possibilité de pendre effectivement les capitalistes avec les cordes qu'iels nous offrent dans leur guerre de compétition.

Sur le triptyque dataset/fine-tuning/infrastructures

Très intéressant ces manipulations de modèle par intervention chirurgicale plutôt que fine-tuning, tu as des liens vers ces gens là ?

Globalement merci encore, j'apprends un paquet de trucs. J'en tire les conclusions suivantes, hésite pas à me corriger :

les entreprises gardent l'avantage sur les dataset, pour des raisons légalistes et d'intérêts des détenteurs de droits, pas mal liées au système en place et à comment le capitalisme exploite les oeuvres culturelles
les entreprises gardent l'avantage sur les fine-tuning généralistes, mais c'est pas un gros avantage parce que 1) le fine-tuning est pas la partie la plus complexe et 2) on a de bons exemples de fine-tuning spécialisés et ouverts
les entreprises ne gardent qu'un très léger avantage sur les infrastructures, parce qu'en réalité il suffit de peu de moyens pour accéder à des infrastructures correctes. J'imagine qu'elles ont toujours un avantage pour les très gros modèles, mais des gens qui réunissent suffisamment de moyens pourraient avoir accès à un équivalent correct.

Sur la question des datasets, j'imagine qu'on sera toujours bloqué comme ça, au sens où certaines données un peu sensibles pour X ou Y raison seront toujours plus accessibles pour des enteprises qui promettront de garder les originaux secrets que pour des entités qui promettront de publier les originaux en open-source. Mais on pourrait sans doute réduire grandement ce désavantage si le lobby des ayant-droits ne défendait pas si farouchement ses intérêts.

[–] keepthepace@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

le capital et la compétition

Alors juste pour faire mon relou qui aime bien utiliser des termes précis, en fait le capitalisme et la compétition ça va pas nécessairement de pair. C'est le modèle libéral qui marie les deux. Une économie de marché liée à un capitalisme, c'est ce qu'on appelle le "modèle capitaliste" actuel, mais tu peux tout à fait avoir un capitalisme corporatiste qui assoit des monopoles avec éventuellement de la violence. Ce n'est pas le système libéral dont on a l'habitude, mais c'est quand même un système capitaliste qui permet une accumulation de capital et la création de rentes.

C'est une idée qui peut choquer un petit peu, mais la compétition et l'économie de marché, c'est plutôt quelque chose qui tempère le capitalisme et qui, comme tu fais remarquer, l'incite à s'autodétruire dans une certaine mesure.

Bon, alors, j'explique sans excuser. Je considère que l'expérience libérale qui imaginait que le capitalisme serve un modèle plus démocratique grâce à l'économie de marché a largement échoué. Mais je garde quand même personnellement en tête que la compétition, c'est quelque chose qui vient tempérer le capitalisme plutôt que l'aggraver.

Et l’efficacité de ces procédés me rend très sceptique quand à la possibilité de pendre effectivement les capitalistes avec les cordes qu’iels nous offrent dans leur guerre de compétition.

Alors personnellement, c'est juste un espoir et une vision que j'ai, mais je pense que si le gâteau diminue, les capitalistes vont passer plus de temps à se disputer les parts qui restent qu'à essayer de l'agrandir. Je ne pense pas qu'il y ait besoin de pendre ou de détruire les entreprises capitalistes, juste de démontrer leur inefficacité exemple après exemple.

Si tu compares une entreprise qui a des actionnaires et doit avoir une marge suffisante pour leur fournir des dividendes, et que tu compares ça à une coopérative qui, elle, n'a pas cette nécessité, elle peut être beaucoup plus efficace comme ça. Je pense beaucoup plus que la fin du capitalisme arrivera par des coopératives qui sont plus efficaces que les entreprises à leur propre jeu économique que d'un grand soir ou d'une révolution.

Rappelons d'ailleurs qu'à une époque, on considérait que c'était logique pour un gouvernement de gauche de forcer une certaine quantité de la commande publique de passer par des SCOP, les coopératives ouvrières.

acheter un projet open source

mais aussi en rachetant des projets et en les faisant passer propriétaires.

C'est souvent très difficile au point d'être en pratique impossible dans la plupart des cas d'acheter un projet open source avec beaucoup de contributeurs. Ça arrive qu'un projet open source se ferme, mais ça nécessite d'y avoir réfléchi dès le début et d'avoir pris des précautions pour faire du dual licensing et vraiment s'assurer que toutes les contributions ajoutées soient d'accord avec ce pivot potentiel.

Il y a certaines licences que personnellement je trouve trop dangereuses à considérer ouvertes, comme la BSD ou la MIT, qui autorisent assez explicitement les entreprises à les prendre et à les intégrer à un projet fermé, voire à le revendre sous un autre nom. Mais des licences comme la GPL ou l'AGPL évitent ces écueils.

Mais même avec ces licences plus permissives, le public garde le droit de continuer à créer des forks, en général ce qu'ils appellent une version communautaire, et gardent le droit de continuer le développement du projet de leur côté. Le monde du libre et ses licences sont mieux ficelées qu'on ne l'imagine souvent.

Sur le reste, oui, c'est clair qu'il y a une opposition. Je ne veux pas donner l'impression que je pense que les boîtes privées et le monde du libre sont de grands amis. Mais on a deux avantages principaux. Le premier, c'est qu'il n'y a pas une seule force du capital. Il y a plein d'entreprises en compétition et parfois, la victoire de l'une fait avancer l'open source.

La deuxième, c'est que les licences agissent un peu comme un cliquet anti-retour. Les victoires du libre sont assez difficiles à contester plus tard. C'est toute la subtilité d'avoir adossé les licences publiques aux lois qui entourent le copyright.

On utilise les mêmes outils juridiques pour faire défendre les obligations liées aux licences du libre que les capitalistes n'utilisent pour lutter contre le piratage. Ce n'est pas par adhésion idéologique à ces outils, cc'est au contraire, une forme de subversion que je trouve particulièrement délicieuse.

Chirurgie sur modèles: activation steering

Mes sources sur ces manipulations de modèles ne sont pas très récentes, elles datent de l'époque de Llama 2.

Une recherche rapide me montre ce site qui peut t'amuser, je n'ai pas regardé en détail encore.

Mais là, tu vas voir l'exemple d'une petite modification qui montre qu'un modèle peut, sans entraînement supplémentaire, être amené à, dans cet exemple, donner des conseils pour de la fraude fiscale.

Tu peux cliquer sur leur icône Paper pour avoir la publie scientifique qui explique comment ils ont fait.

Ça ne marche que sur les modèles ouverts dont on peut voir les activations intermédiaires et que l'on peut triturer directement. Le but du jeu est de trouver quels vecteurs ajouter dans leurs "processus de réflexion" internes pour les pousser vers plus ou moins d'obséquiosité dans les expériences classiques. Mais également dans ce que j'ai pu voir sur les expériences sur les modèles chinois, vers moins de censure gouvernementale.

Sur le triptyque dataset/fine-tuning/infrastructures

Je suis d'accord avec tes conclusions :-)

Même pour les très gros modèles, je pense que les grosses boîtes n'ont pas davantage d'infrastructures. Avec juste une exception pour l'entraînement de ces gros modèles, où là c'est un savoir-faire encore un petit peu spécialisé j'ai l'impression, et où là aussi il y a l'air d'y avoir des sauces secrètes.

Il y a quand même un enjeu de souveraineté à avoir les infrastructures nécessaires pour entraîner les très gros modèles, les "modèles frontières".

Alors personnellement, je suis de l'opinion qu'ils arrêteront de grossir et que GPT-4 était vraisemblablement le plus gros modèle qu'on n'entraînera jamais. Mais c'est une opinion personnelle, ce n'est pas une certitude à 100%. Du coup, ce n'est pas idiot non plus de stratégiquement garder un savoir-faire de dataset en entraînement pour le cas où, dans deux ou trois ans, on se rende compte que des modèles dix fois plus gros sont nécessaires pour certaines tâches.

Sur les datasets, oui, je pense qu'à moins d'une réforme du copyright, on reste toujours bloqué comme ça.

J'essaie juste de donner un petit peu de perspective sur les accusations de pillage de droits d'auteur auxquels on a le droit dès que les gens commencent à comprendre comment sont assemblés ces datasets. Jetez pas la pierre à ceux qui avouent qu'ils le font, parce qu'ils le font vraiment tous. Et ne jetez pas non plus la pierre à ceux qui ne font que du open weight, parce que souvent, légalement, ils n'ont pas la possibilité de faire vraiment du vrai open source.

Assez curieusement, les meilleurs modèles complètement open source dont les datasets et les procédures d'entraînement sont publiés sont probablement ceux de Nvidia. Pas exactement un grand fan de l'open source.

Mais là encore, c'est une boîte privée qui a trouvé son intérêt dans l'open source. Eux, leur but, c'est de vendre du matériel. Et plus il y a de modèles ouverts, performants, plus il y a de gens qui ont envie d'entraîner, de fine-tuner des modèles. Plus ils vont vendre de matos. Et c'est d'autant plus facile à faire qu'on dispose de bons modèles ouverts. Donc eux publient des modèles ouverts avec les datasets, se sont pris dans la gueule tous les procès auxquels on pouvait s'attendre, mais eux ont des avocats pour se défendre.

Et en fait, on a quelque chose qui va probablement nous débloquer dans les prochaines années sur la question des datasets. C'est ce qu'on appelle les datasets synthétiques. Et c'est une décision un petit peu étrange également qui a été prise par une cour américaine de déclarer que les sorties d'un modèle génératif ne tombent pas sous le coup du copyright.

Les données synthétiques, c'est un concept très simple. c'est qu'au lieu d'entraîner un modèle sur un dataset de sources variées, on va l'entraîner principalement sur les sorties d'un autre LLM qu'on sait assez bon. Contrairement à une croyance populaire qui vient d'une publi qui est a été assez mal comprise par le grand public, ça ne rend pas les modèles moins bons de faire ça, en tout cas pas sur une génération.

Et là, bon courage pour m'attaquer si je dis que moi j'ai payé pour un service en ligne qui a priori est légal, n'a jamais été reconnu comme étant dans l'illégalité et pour lequel j'ai payé pour des tokens que la loi considère ne pas être sous copyright. Ça va être assez difficile de m'accuser d'avoir violé du copyright indirectement ou d'interdire mon modèle.

Donc personnellement, je ne considère pas qu'il y ait une énorme incertitude légale là, mais c'est pour dire qu'il ne faut pas forcément jeter la pierre aux groupes qui ne publient pas leur dataset. Il y a une inégalité de moyens qui est vraiment problématique pour les communautés libres.

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

Sur le capitalisme

Merci pour toutes les précisions !

Je tiens à préciser que le fait que la émcanique de compétition incite le capitalisme à s'auto-détruire dans une certaine mesure, pour moi c'est purement de facade, ou purement théorique. Mon analyse, c'est que le pouvoir économique est un pouvoir, et que comme les autres il pousse les gens qui en ont à en vouloir plus, et je pense que cette mécanique de fond compense, voire dépasse tous les effets positifs que la compétition pourrait avoir.

Mais sinon, tout à fait d'accord, surtout sur le fait que la compétition, c’est quelque chose qui vient tempérer le capitalisme plutôt que l’aggraver. D'accord aussi sur le fait que la fin du capitalisme n'arrivera pas par le biais d'un grand soir ou d'une révolution au sens classique, mais j'ai peur que les coopératives ne soient pas la clef non plus : dans mon expérience, il faut beaucoup de garde-fous pour ne pas recréer des dynamiques capitalistes au sein des SCOP et des coopératives en général. Alors, c'est vachement mieux que des grandes multinationales, mais je n'y vois pas une vraie rupture avec le capitalisme. Ceci étant dit, si tu entendais ça comme l'outil qui amènera la fin du capital, alors ce n'est pas impossible, et je souhaite que tu ais raison.

Sur les transitions open source vers closed source

Certes, le passage en fermé n'est pas très fréquent, et peut toujours être contourné, même si ça reste des bâtons dans les roues du logiciel libre dans ces cas-là. POint pour toi.

Merci pour les liens vers l'activation steering !

Jetez pas la pierre à ceux qui avouent qu’ils le font, parce qu’ils le font vraiment tous. Et ne jetez pas non plus la pierre à ceux qui ne font que du open weight, parce que souvent, légalement, ils n’ont pas la possibilité de faire vraiment du vrai open source.

Excellent résumé de ton travail de nuance, merci encore <3

Contrairement à une croyance populaire qui vient d’une publi qui est a été assez mal comprise par le grand public, ça ne rend pas les modèles moins bons de faire ça, en tout cas pas sur une génération.

Ok, je pensais que c'était le cas ! Alors après, même avant de lire ça, je me disais que si tu constitue ton dataset avec une IA vraiment poussée et dont on sélectionne un peu les résultats, ça avait des chances de marcher. J'ai toujours l'impression que si par contre tu fais ton dataset avec tout le slop pondu sur internet par une quantité de modèles et de prompts à la qualité beaucoup plus variable, forcément ça donnera des résultats mauvais. Mais c'est peut-être faux aussi du coup.

[–] keepthepace@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

Haha, alors note que par rapport à d'autres personnes dans l'extrême gauche, moi j'ai plutôt tendance à considérer que le capitalisme, c'est à la fois plus facile d'en sortir qu'on le pense, mais également moins fondamental:

C'est une étape importante et nécessaire, mais ça ne nous empêche pas de lutter contre plein d'autres mécanismes d'oppression qui existent et qui ne vont pas magiquement disparaître lorsque l'on va changer la structure de propriété des moyens de production. On aura encore à parler du post-colonialisme, du sexisme, de diverses dérives religieuses... Toutes ces choses-là ne vont pas disparaître par magie, et on peut même les combattre dès aujourd'hui.

Franchement, la publication originale, je ne sais même pas si elle vaut encore le coup d'être citée. Elle démontre un effet sur un dataset particulier (wikitext2) de qualité sur un modèle de 125 millions de paramètres. Ils ont démontré un fait assez évident qui est que lorsque tu as un modèle imparfait qui essaye de prédire un dataset, il fait plein d'erreurs. Et que si tu réinjectes ce dataset plein d'erreurs dans l'entraînement d'un nouveau modèle, il va en faire encore plus. Ce n'est absolument pas garanti que ça se généralise à des plus gros modèles ou à d'autres datasets plus gros qui généralement sont de moins bonne qualité.

Ce n'était pas un résultat particulièrement surprenant, et ce n'était pas un particulièrement bon argument pour dire que les données synthétiques ne fonctionnent pas. C'est un point dans le débat, mais la presse s'en est emparée en faisant croire que le débat était tranché, ce qui n'était absolument pas le cas. Les données synthétiques ont une importance de plus en plus grande et on les utilise tout le temps.

Je compare ça à la publication scientifique qui avait prouvé que la force musculaire d'un bras humain n'était pas suffisante à actionner des ailes (correct) et en a conclu que les humains ne pourraient jamais voler.

PS: wow, pas de balise spoiler! On arrive à la fin de la conversation?

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

C'est dingue à quel point on peut être d'accord et pas d'accord x)

Perso je pense que sortir du capitalisme, c'est fondamental (après fondamental par rapport à quoi, vaste débat, mais au moins par rapport aux gens qui y vivent), et que c'est particulièrement difficile (je tiens le capitalisme pour un truc rampant qui va s'accrocher à son caillou comme un crabe au fond de son trou).

Par contre, ton paragraphe sur les autres oppressions, 100% d'accord, pas une seule nuance à apporter. Comme quoi !

Ok, merci pour les explications ! Et oui, dinguerie que cela, la discussion semble trouver son terme 😱 (après je prépare ma réponse sur l'autre fil, j'ai pas trop le temps en ce moment, mais ça arrive promis !)

[–] keepthepace@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

Bon ok, c'est un peu de la provocation. Ça reste un gros morceau, mais c'est qu'un seul item sur la longue liste des choses à améliorer.

Et surtout, je ne pense pas qu'on va le supprimer d'un coup, je pense qu'on va l'user à la longue. Et que oui, comme tu dis, ça va s'accrocher à son caillou, mais ça va devenir de moins en moins important dans le fonctionnement de l'économie.

Ça paraît aussi inatteignable aujourd'hui que la reconnaissance du mariage homosexuel dans les années 80 mais personnellement, je vois les mentalités progresser et je ne vois pas grand-chose qui puisse endiguer les efforts. Je vois plein de trucs qui peuvent aider à aller plus vite. Mais au moins, je trouve que les choses vont dans le bon sens.

[–] Takapapatapaka@tarte.nuage-libre.fr 0 points 2 weeks ago (1 children)

100% d'accord, sauf sur le "pas grand chose qui puisse endiguer les efforts". Je pense que le consumérisme et toute l'influence par le biais des médias et par la suite des réseaux sociaux sera l'obstacle majeur (et d'ailleurs je me sens conforté dans cette analyse par le fait que la possession des médias est une bataille ouverte). Je pense du coup qu'on a même reculé en terme de conscience des effets néfastes du capitalisme, par rapport au début du XXe siècle. Je me rends pas compte des chiffres, mais j'ai quand même l'impression que les masses travailleuses sont moins conscientes d'elles-mêmes et de leur rapport au capital qu'avant. Alors, je pense quand même qu'aujourd'hui on progresse vers autre chose, et qu'on a progressé avec des acquis sociaux tout au long du siècle (qui ont joué dans cette perte de conscience du prolétariat), mais je ne lis pas l'avenir proche (les prochains siècles) comme acquis à cette cause.

[–] keepthepace@tarte.nuage-libre.fr 0 points 2 weeks ago

Je reconnais que mon optimisme est totalement subjectif et probablement lié à ce que j'observe dans ma propre bulle.

Par contre, de voir quelque chose comme la majorité des jeunes américains qui considèrent que "capitalisme" est une valeur plus négative que "socialisme", ça me fait dire que la bataille culturelle, elle est plutôt bien engagée.