モデル

DeepSeek R1

ディープシークアールワン

強化学習（RL）で推論能力を獲得した、オープンウェイトの Reasoning モデルです。

体験区分：調査ベース推奨読者レベル：Level 3-4

強化学習を重ねることで、数学・コーディング・論理問題での推論能力を高めたモデルです。重みはオープンウェイトで公開されており、研究者や企業が手元の環境で動かせます。

2025 年 1 月、o1 系と同等の推論性能をオープンウェイトで達成し「DeepSeek ショック」と呼ばれました。deepseek.com の API や Hugging Face で利用できます。

イメージ

開発フローでの位置

タスク難易度を見る

→

モデルを選ぶ

→

アクセス方法を決める

→

推論結果を評価する

2026.04·ready

「R1 はオープンウェイトで o1 系と近い推論ができるので、コスト比較に使えますよ。」

DeepSeek R1の見方

205

この用語の見どころ

役割

強化学習で推論能力を伸ばした DeepSeek のオープンウェイト推論モデルです。

うれしさ

o1 系に近い推論精度を、オープンな重みで利用できます。

注意点

重みの運用にはサーバー環境が要り、個人利用の敷居は高めです。

どこで役立つか

数学・論理・コード検証など、段階的思考が必要なタスク。

はじめに

API で試せる点とオープンウェイトで入手できる点の二面性を把握します。

深掘り先

DeepSeek V3、o1 系、強化学習

非エンジニアのつまずき

私のコメント