DeepSeekはProver-V2モデルを発表し、パラメータ数は6710億に達しました。

2025-04-30 12:36:26

概要作成中

[DeepSeek、6,710億パラメータのProver-V2モデルをリリース] DeepSeekは本日、オープンソースのAIコミュニティであるHugging Faceで、新モデル「DeepSeek-Prover-V2-671B」をリリースしました。 DeepSeek-Prover-V2-671Bは、より効率的なsafetensorsファイル形式を使用し、さまざまな計算精度をサポートしていると報告されており、6710億のパラメータ、または昨年リリースされたProver-V1.5数学モデルのアップグレードバージョンを使用して、より高速でリソースを節約するモデルのトレーニングと展開に便利です。モデルアーキテクチャに関しては、モデルはDeepSeek-V3アーキテクチャを使用し、MoE(Hybrid Expert)モードを採用し、61のTransformer層と7168の次元隠れ層を備えています。同時に、最大位置埋め込みが最大163,800で複雑な数学的証明を処理できる超ロングコンテキストをサポートし、FP8量子化が採用されているため、量子化技術によりモデルサイズを縮小し、推論効率を向上させることができます。 (ゴールドテン)

DEEPSEEK2.87%

原文表示

内容は参考用であり、勧誘やオファーではありません。投資、税務、または法律に関するアドバイスは提供されません。リスク開示の詳細については、免責事項を参照してください。

報酬
いいね
コメント
共有

0/400

コメントなし

トピック
#BTC#
228k 投稿
#PI#
194k 投稿
#ETH#
145k 投稿
4#GateioInto11#
79k 投稿
5#ContentStar#
66k 投稿
6#GT#
63k 投稿
7#BOME#
61k 投稿
8#DOGE#
57k 投稿
9#MAGA#
52k 投稿
10#SLERF#
51k 投稿

ピン

サイトマップ