DeepSeek R1 0528 en 6 Minutes
YouTube transcript, YouTube translate
A quick preview of the first subtitles so you know what the video covers.
Dans cette vidéo, je vais examiner Deepseek R10528, qui vient de sortir il y a quelques heures. Ce qui est intéressant avec cette version, c'est qu'ils n'ont publié aucune fiche modèle. Il n'y a eu aucune annonce officielle sur X ou toute autre plateforme, mais il y a un certain nombre de choses vraiment intéressantes qui émergent à propos du modèle. Dans cette vidéo, je vais passer en revue ce que nous savons sur le modèle, ainsi que vous indiquer comment vous pouvez commencer à l'utiliser. Et puis, bien sûr, je passerai également en revue quelques démonstrations, que vous souhaitiez utiliser l'API ou que vous souhaitiez une interface de chat. Premièrement, le modèle a une licence MIT. Vous êtes donc libre de l'utiliser pour construire dessus. Si vous souhaitez le post-entraîner davantage et l'utiliser d'autres manières que vous souhaitez exploiter, vous pouvez le faire. Premièrement, en ce qui concerne certains des benchmarks que nous connaissons sur live codebench, celui-ci se situe juste entre 03 mini en mode élevé et juste en dessous de 04 mini en mode moyen. Maintenant, si nous regardons le graphique ici, la grande différence avec ces benchmarks, bien qu'il occupe la quatrième place, si nous regardons tous les autres modèles, à l'exception de Quen, ce sont tous des modèles propriétaires. Quen et Deepseek sont les seules options en termes de performance parmi les options open source disponibles actuellement. Ensuite, il y a quelques minutes, sur le subreddit local llama, quelqu'un a posté que ce modèle obtient le même score que Claude Opus sur le benchmark Adar Polyglot à 70,7. L'ancien R1 était à 56,9. Donc, si je regarde le benchmark Adar Polyglot, nous pouvons voir tous les derniers modèles de pointe ici. En termes de résultats rapportés, nous avons Claude Opus avec No Think à 70,7. Mais le coût sera également la grande différence avec ce modèle car la chose avec les modèles open source est qu'il y aura beaucoup de concurrence en termes d'endroit où héberger ce modèle. Et il existe même des options gratuites que je vous montrerai un peu plus tard.