mat

joined 1 year ago
[–] [email protected] 2 points 1 month ago

J'ai la tête un peu trop dans le cirage aujouord'hui pour répondre mais

En fait je crois qu'en ce moment je cherche un moyen de contrer ce discours dominant dans la sphère francophone. Y a vraiment très très peu de contenu positif sur ces technos et la plupart des critiques, je les trouve mal informées. Mais je sais pas comment tordre le cou à tant d'idées reçues et je suis pas sur qu'une vidéo de 3 heures sur le sujet est la bonne voie (n'est pas Franck Lepage qui veut). Du coup je vais essayer de faire un peu de contenu sur les choses que je connais bien (le dev) mais j'aimerais bien parler un peu d'économie, de théorie politique et de philo si ça prend.

En vrai la partie économie, théorie politique et philo ça me tente pas mal aussi

[–] [email protected] 2 points 1 month ago (1 children)

Ça me parait pas mal, très belle fusion opérée ici

[–] [email protected] 2 points 1 month ago (2 children)

En toute franchise, je pense que j'ai pas mal de réactance vis-à-vis des LLMs pour plusieurs raison:

  • peur de pas pouvoir faire carrière (pour l'instant je suis coincé sur du support n2 qui m'a foutu un bore out)
  • problématique de liberté et respect du droit d'auteur, ce qui s'étend à tout l'ensemble des modèles génératifs (on se souvient du directeur IA qui dit que tout ce qui est sur internet n'attend que d'être exploité alors qu'askip, il y a eu des fuites de différents codes de leurs produits lol)

Après pour la question de l'inférence de type, si on regarde l'écosystème actuel on a :

  • java/C/C++ qui sont typés explicitement (comme beaucoup d'autres)
  • python qui dispose d'annotation et de mypy pour la vérifier (même compiler le code)
  • rust dont les outils de dev permettent d'ajouter l'inférence de type dans l'ide De plus, sans données d'entraînement, le LLM va pas pouvoir te générer de code donc il faudra quand même du monde pour faire le premier jeu et derrière, il y a des grosses problématiques à utiliser des données générées par un modèle pour en entraîner un autre, il faut toujours de la donnée fraiche.

Quoi qu'il en soit, c'est mon côté anticapitaliste me dit que tant qu'on reste dans le modèle capitaliste, aucune avancé technologique ne sera clean et les LLMs bah c'est au niveau de l'entrainement : si tu entraîne un modèle uniquement sur du code GPL, on pourrait imaginer que ce qu'il produit et sous GPL, mais est-ce qu'entrainer from scratch sur du code gpl rend le modèle utilisable ? Sinon, il faut donc étendre avec du texte humain potentiellemet, et du coup, comment ça se passe au niveau licence ?

Pour avoir du bon code, on fait comme on fait quand on emploie des stagiaires ou des mauvais programmeurs: on relit, on écrit des tests. Ça reste de l'ingénierie.

Ça c'est un peu abandonner un idéal de qualité et se résigner à la médiocrité. Il n'y a pas besoin d'être mauvais ou stagiaire pour faire des erreurs à plusieurs centaines de milliers d'€, juste une chaine d'outils pourris en amont ou de mauvaises conceptions (je l'ai vu il y a peu) et même quand des vies sont en jeu on a pu voir des problèmes graves (coucou le régulateur toyota ou les avions boeing). D'ailleurs, je pense que le secteur informatique souffre de la hiérarchisation issue de l'industrie (ouvrier, technicien, ingénieur je suis pas sûr que ce soit pertinent pour l'informatique)....

Technologiquement, j'aime vraiment le deep learning, mais il y a tellement de trucs problématiques associés que son industrialisation m'en dégoute un peu

[–] [email protected] 3 points 1 month ago (3 children)

J'hésite entre "la justice est trop laxiste" et "il pensait pas à mal" pour l'ironie de la chose

[–] [email protected] 2 points 1 month ago (4 children)

Mon point de vue c'est que si on commence à inventer des langages dans lesquels on ne peut développer qu'avec des LLMs, c'est qu'on empire la pile de technologies douteuses qu'est l'informatique (cf un processeur moderne qui se fait passer via C et l'OS pour un processeur de pdp 11 ça donne des failles comme Spectre et Meltdown)... et que même pour générer le C, ça veut pas dire que le code généré n'a pas de fuite mémoire par exemple, ce qu'on cherche à éviter avec Rust et du coup, tu peux générer du code foireux plus vite. Je vois l'intérêt pour les ESN qui doivent vendre des bugs mais derrière si tu veux un paysage plus fiable c'est pas forcément si intéressant, d'autant que ça soulève énormément de questions non techniques et là-dessus, je pense que les ingénieurs et les développeurs devraient arrêter de se palucher sur le progrès technique peu importe le reste (comme a fait le créateur de Yolo qui a fini par arrêter la vision par ordinateur parce que l'usage qui s'est le plus démocratisé c'est la surveillance de masse)

[–] [email protected] 1 points 1 month ago (6 children)

Dans ce que j'entends sur l'aspect énergétique (et je me suis pas forcément bien exprimé dessus) c'est plus tout l'aspect autour des ressources matérielles et énergétiques de a à z : production du matériel, entrainement (en vrai comme beaucoup en informatique c'est pas l'exploitation qui consomme le plus mais bien le développement (dans un sens très large) (et encore, la boite d'evernote se vante de faire tourner 20k GPU pour un modèle d'amélioration des photos alors qu'en vrai, c'est pas essentiel). Et dans le cas que j'évoquais c'était surtout le fait de faire générer du python... quitte à avoir des IA pour faire le gros du travail, autant générer dans des langages plus efficients à l'exécution. In fine, je me suis lancé dans un tunnel mais ça dérivait un max sur du sociétal XD

[–] [email protected] 2 points 1 month ago (8 children)

Dans notre contexte c'était effrayant parce que le code généré était bon alors qu'on a fait quelques boulettes XD Après pour modérer un peu la chose, c'est comme le mec qui a fait générer un pacman à chatgpt en python. Bourriner des LLMs pour générer du python en le guidant fortement on est au niveau -1 de l'efficience énergétique et quand on regarde la conso des datacenters je sais pas si c'est vraiment pertinent comme utilusation.

[–] [email protected] 3 points 1 month ago (10 children)

Pour avoir particuper à un atelir il n'y a pas longtemps, c'est terriblement bluffant. Juste à partir d'un nom de module en elixir, ça générait le code approprié pour débuter un interpréteur de lambda expression

[–] [email protected] 2 points 1 month ago

Pour placer une adresse sympa (si vous ne buvez pas d'alcool, leur jus est excellent) c'est la cidrerie Daufresnes à Ouilly-le-vicomte juste à côté de Lisieux, capitale du Pays d'Auge en Normandie (pour situer, il y a un calva AOC). Et en vrai, le cidre, c'est meilleur que le pinard et ça enivre moins (pour mon mariage c'était nickel, personne n'a fini sous la table)

[–] [email protected] 0 points 1 month ago (1 children)

For now my NAS it not really running anything (I want to have proper DNS/IDM before starting any other service and for storage I think I may go with owncloud ocis or nextcloud)

[–] [email protected] 1 points 1 month ago

I am still using my ISP's router, so the firewall rule is on the NAS (for now it is almost a do it all server), otherwise I would run the pihole on the router I think

[–] [email protected] 1 points 1 month ago (1 children)

Do you have any idea on how to do it ? Knowing that I am on opensuse

view more: ‹ prev next ›