Note de ce sujet :
  • Moyenne : 0 (0 vote(s))
  • 1
  • 2
  • 3
  • 4
  • 5
DeepSeek, un modèle de langage open source, puissant et abordable.
#3
Intéressant de voir l'enthousiasme autour de DeepSeek-V3, mais il faut effectivement nuancer certains points qui n'ont pas été évoqués. Je ne l'ai pas encore testé (bientôt, mais je manque de temps), aussi, je livre mon avis sans tests mais d'après ma réflexion et les premiers retours de tests que j'ai pu lire ou entendre de part et d'autre.

Côté performances, le modèle montre des résultats impressionnants sur les benchmarks, rivalisant même avec GPT-4 et Claude 3.5 Sonnet sur certaines tâches, particulièrement en mathématiques et en raisonnement. Cependant, des tests plus poussés révèlent des faiblesses, notamment sur l'évaluation "Misguided Attention" où il n'obtient que 22% de réussite, suggérant des problèmes de surapprentissage.

Un point crucial concerne la confidentialité des données, qui inquiète plus d'un, comme beaucoup de produit Chinois. Il est impossible de s'inscrire avec une adresse email professionnelle et d'obtenir des factures, ce qui pose question pour une utilisation en entreprise. De plus, en Chine, une identification avec le nom réel est requise pour l'utilisation...

L'architecture MoE (Mixture of Experts) permet certes des coûts réduits, mais elle peut aussi impacter les performances sur certaines tâches spécifiques. Le modèle présente parfois des comportements étranges, comme l'insertion de texte en chinois dans des générations en français.

C'est un excellent cas d'étude sur les compromis entre performance, coût et sécurité dans le développement d'IA. Ça illustre parfaitement les enjeux actuels du secteur.
[Système d'exploitation : Linux Mint 21.3] - [RAM : 15.34 GB]
[Processeur : 11th Gen Intel® Core™ i5-1135G7 @ 2.40GHz - 4 cœurs physiques]
[Disque dur : SSD 980 PRO 2TB(1,8T)]
[Carte graphique : Intel Corporation TigerLake-LP GT2 [Iris Xe Graphics] (rev 01)]
 
Répondre


Messages dans ce sujet
RE: DeepSeek, un modèle de langage open source, puissant et abordable. - par EnZ0 - 07-01-2025, 07:33

Sujets apparemment similaires…
Sujet Auteur Réponses Affichages Dernier message
  Google lance un outil de scan de vulnérabilités en open source lisa 0 373 03-01-2023, 08:01
Dernier message: lisa
  Le langage python Shay 0 500 22-09-2020, 08:46
Dernier message: Shay
  Kotlin va-t-il tuer le langage Java ? lenemsebo 0 538 08-11-2017, 07:43
Dernier message: lenemsebo
  AsteroidOS, alternative open source à Android Wear Nico31 0 673 02-03-2016, 07:35
Dernier message: Nico31

Atteindre :


Utilisateur(s) parcourant ce sujet : 1 visiteur(s)