メインコンテンツまでスキップ

モデル

概要

OpenAI API は、機能と価格が異なるさまざまなモデルによって強化されています。また、微調整を通じて、特定のユース ケースに合わせてオリジナルのベース モデルを限定的にカスタマイズすることもできます。

模型説明
GPT-4 Limited Beta自然言語またはコードを理解して生成できる、改良された GPT-3.5 モデルのセット
GPT-3.5自然言語またはコードを理解して生成するために GPT-3 を改善する一連のモデル
DALL·E Beta自然言語の手がかりを与えられた画像を生成および編集できるモデル
Whisper Beta音声をテキストに変換できるモデル
埋め込みテキストをデジタル形式に変換できるモデルのセット
Codex Deprecated自然言語をコードに変換するなど、コードを理解して生成できる一連のモデル
Moderationテキストが機密か安全でないかを検出できる微調整されたモデル
GPT-3自然言語を理解して生成できるモデルのセット

また、 Point-EWhisperJukebox、 CLIP などのオープン ソース モデルもリリースしました

研究者向けのモデル インデックスにアクセスして、研究論文で取り上げられているモデルや、InstructGPT と GPT-3.5 などのモデル ファミリーの違いについて詳しく学んでください。

GPT-4Limited Beta

GPT-4 は、大規模なマルチモーダル モデル (現在はテキスト入力を受け入れ、テキスト出力を発行し、将来的には画像入力) であり、より広範な一般知識と高度な推論機能により、以前のどのモデルよりも正確になる可能性があります。gpt-3.5-turboと同様に、GPT-4は、チャットに最適化されていますが、従来の完了 (Completion) タスクにも適しています。セッション完了ガイドでGPT-4の使用方法を学びましょう。

::: ヒント GPT-4 は現在Limited betaステージで、アクセス権を付与された人だけがアクセスできることに注意してください。定員になり次第、順番待ちリストにご登録ください。:::

モデル説明最大 Token 数訓練データ
gpt-4どの GPT-3.5 モデルよりも強力で、より複雑なタスクに対応でき、チャット用に最適化されています。モデルの最新の反復で更新されます。8,192トークン2021年9月現在
gpt-4-03142023 年 3 月 14 日のスナップショットgpt-4。とは異なりgpt-4、このモデルは更新を受け取らず、2023 年 6 月 14 日までの 3 か月間のみサポートされます。8,192トークン2021年9月現在
gpt-4-32k基本モードとgpt-4同じ機能ですが、コンテキストの長さが 4 倍になります。モデルの最新の反復で更新されます。32,768トークン2021年9月現在
gpt-4-32k-03142023 年 3 月 14 日のスナップショットgpt-4-32。とは異なりgpt-4-32k、このモデルは更新を受け取らず、2023 年 6 月 14 日までの 3 か月間のみサポートされます。32,768トークン2021年9月現在

多くの基本的なタスクでは、GPT-4 モデルと GPT-3.5 モデルの違いは重要ではありません。ただし、より複雑な推論状況では、GPT-4 は以前のどのモデルよりも強力です。

GPT- 3.5

GPT-3.5 モデルは、自然言語またはコードを理解して生成できます。GPT-3.5 シリーズで最も強力で費用対効果の高いモデルはgpt-3.5-turboで、チャットに最適化されていますが、従来の完了 (完了) タスクにも適しています。

モデル説明最大 Token 数訓練データ
gpt-3.5-turboチャット向けに最適化された最も強力な GPT-3.5 モデルを 1/10 のコストtext-davinci-003で。モデルの最新の反復で更新されます。4096トークン2021年9月現在
gpt-3.5-turbo-0301gpt-3.5-turbo2023 年 3 月 1 日のスナップショット。gpt-3.5-turboとは異なり、このモデルは更新されず、2023 年 6 月 1 日までの 3 か月間のみサポートされます。4096トークン2021年9月現在
text-davinci-003キュリー、バベッジ、ADA モデルよりも優れた品質、より長いアウトプット、一貫した指示に従うことで、あらゆる言語タスクを完了することができます。テキストへの補完の挿入サポートされています。4097トークン2021年6月現在
text-davinci-002text-davinci-003同様のが、強化学習の代わりに教師付き微調整を使用してトレーニングされています4097トークン2021年6月現在
code-davinci-002コード補完タスク用に最適化8001トークン2021年6月現在

gpt-3.5-turboのコストが低いため、他の GPT-3.5 モデルよりも優先に使用することがおすすめです。

::: ヒント OpenAI モデルは非決定論的であることに注意してください。つまり、同じ入力が異なる出力を生成する可能性があります。温度を 0 に設定すると、出力はほぼ確定的になりますが、わずかな変動性が保持される場合があります。:::

OpenAIモデルは非確実性であり、これは同じ入力が異なる出力を生み出すことを意味する。温度を0に設定すると、出力の大部分が確実性を持つが、少量の可変性が残る可能性がある。

特定機能モデル

新しいgpt-3.5-turboモデルはセッションに最適化されていますが、伝統的な任務遂行にも非常に効果的です。オリジナルのGPT-3.5モデルはテキスト補完に最適化されました。

私たちは埋め込み作成(Embedding)テキスト編集のエンドポイントは独自の専用モデルです。

## 適切なモデルを見つける

gpt-3.5-turboを使って実験することはAPI機能を理解する良い方法です。達成すべき目標を理解した後、引き続き「gpt-3.5-turbo」や他のモデルを使って、その機能をめぐって最適化してみてください。

GPT比較ツールを使って、異なるモデルを並んで実行して出力、設定、応答時間を比較し、データをExcelスプレッドシートにダウンロードすることができます。

DALL・E

DALL・Eは人工知能システムで、自然言語の描写によってリアルな画像と芸術作品を作ることができます。私たちは現在、提示された状態で特定のサイズを持つ新しい画像を作成したり、既存の画像を編集したり、ユーザーが提供した画像の変種を作成する能力をサポートしています。

私たちのAPIを通じて提供された現在のDALL・EモデルはDALL・Eの第2世代で、オリジナルモデルよりリアルで正確で解像度が4倍高い画像を持っています。私たちの実験室インターフェースまたはAPI試用を行う。

Whisper

Whisperは一般的な音声認識モデルである。異なるオーディオの大型データセットで訓練され、マルチタスクモデルでもあり、多言語音声認識と音声翻訳と言語認識を実行することができます。現在、私たちのAPI(モデル名whisper-1)を通じてWhisper v2-largeモデルを使用できます。

現在、Whisperのオープンソースバージョンと私たちのAPIを通じて提供されたバージョンの間には違いはありません。しかし、私たちのAPIを通じて、私たちは最適化された推論過程を提供し、これは私たちのAPIを通じてWhisperを実行するのが他の方法で実行するよりはるかに速いです。Whisperに関するより多くの技術的詳細は、論文を読むすることができます。

埋め込み(Embedding)

埋め込み(Embedding)はテキストの数字表現で、2つのテキストの間の関連性を測定するのに使われます。私たちの第2世代埋め込みモデルtext-embedding-ada-002は、以前の16種類の第1世代埋め込み(Embedding)モデルを小さなコストで置き換えることを目指しています。埋め込み(Embedding)は検索、クラスタリング、推薦、異常検知、分類任務に使えます。公告ブログ記事で私たちの最新の埋め込みモデルについてより多くの情報を読むことができます。

Codex

Codexモデルは私たちのGPT-3モデルの子孫であり、コードを理解して生成することができます。彼らの訓練データには自然言語とGitHubからの数十億行の公共コードが含まれています。もっと詳しく知る](https://help.openai.com/en/articles/5480054)。

JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL、さらにShellなど十数種類の言語に精通しています。

私たちは現在2つのCodexモデルを提供しています。

モデル説明最大 Token 数訓練データ
code-davinci-002最も強力なCodexモデルです。特に自然言語をコードに翻訳するのが得意です。コードを補完するだけでなく、コードに挿入を挿入して補完することをサポートします。8001 Token截至2021年6月
code-cushman-001Davinci Codexとほぼ同じくらい強力だが、少し速い。この速度の利点は、リアルタイムアプリケーションの第一選択になるかもしれない。最多 2048 个Token

詳細については、私たちのCodex使用ガイドをご覧ください。

Codexモデルは限定テスト期間に無料で使用でき、低下した速度制限の制約。私たちが使用状況を知る時、私たちは幅広いアプリケーションを支援するための価格を求めるだろう。

この期間中、私たちの使用政策に合致すれば、あなたのアプリをご利用ください。私たちはこれらのモデルを早期に使用した時、どんなフィードバックも歓迎し、コミュニティとの相互作用を期待します。

特定機能モデル

主なCodexモデルはテキスト補完(Completion)エンドポイントと一緒に使うことを目指しています。私たちはまた、私たちのエンドポイント専用の埋め込み作成(Embedding)編集コードを提供します。


審査(Moderation)

審査モデルは内容がOpenAIの使用戦略に合致しているかどうかを確認することを目的としています。これらのモデルは、憎しみ、憎しみ/脅威、自傷、性、性/未成年者、暴力、暴力/写真などの分類機能を提供します。私たちの審査ガイドでより多くの情報を見つけることができます。

審査モデルは任意のサイズの入力を採用し、その入力は自動的に分解してモデル特定のコンテキストウィンドウを修復します。

モデル説明
text-moderation-latest最も有能な審査モデルは、精度が安定モデルより少し高いです。
text-moderation-stableほぼ最新モデルと同じくらい強力ですが、少し古いです。

GPT- 3

GPT-3 モデルは、自然言語を理解して生成できます。これらのモデルは、より強力な GPT-3.5 世代モデルに置き換えられました。ただし、元の GPT-3 ベース モデル ( davincicurieadaおよびbabbage) は、現在、微調整に使用できるモデルのみです。

モデル説明最大Token数訓練データ
text-curie-001davinci よりも非常に有能で、高速で低コストです。2,049トークン2019年10月現在
text-babbage-001単純なタスクを非常に迅速かつ低コストで完了する能力。2,049トークン2019年10月現在
text-ada-001非常に単純なタスクを実行でき、通常は GPT-3 ファミリで最速のモデルであり、コストが最も低い。2,049トークン2019年10月現在
davinci最も強力な GPT-3 モデル。通常はより高い品質で、他のモデルができることは何でもできます。2,049トークン2019年10月現在
curie非常に有能ですが、davinci よりも高速で低コストです。2,049トークン2019年10月現在
babbage単純なタスクを非常に迅速かつ低コストで完了する能力。2,049トークン2019年10月現在
ada非常に単純なタスクを実行でき、通常は GPT-3 ファミリで最速のモデルであり、コストが最も低い。2,049トークン2019年10月現在

モデル エンドポイント (特定の API を参照)の互換性

エンドポイント (特定の API を参照)モデル名
/v1/chat/completionsgpt-4、gpt-4-0314、gpt-4-32k、gpt-4-32k-0314、gpt-3.5-turbo、gpt-3.5-turbo-0301
/v1/completionstext-davinci-003、text-davinci-002、text-curie-001、text-babbage-001、text-ada-001、davinci、curie、babbage、ada
/v1/edits text-davinci-edit-001text-davinci-edit-001, code-davinci-edit-001
/v1/audio/transcriptionswhisper-1
/v1/audio/translationswhisper-1
/v1/fine-tunesdavinci, curie, babbage, ada
/v1/embeddingstext-embedding-ada-002, text-search-ada-doc-001
/v1/moderationsテキストレビューは安定しており、テキストレビューは最新です

このリストには、当社の第 1 世代の埋め込みモデルDALL·E モデルも含まれていません。

継続的なモデルのアップグレード

gpt-3.5-turboのリリースに伴い、一部のモデルは継続的に更新されています。モデルの変更がユーザーに予期しない影響を与える可能性を減らすために、3 か月間静的なモデル バージョンも提供しています。モデルの更新の新しいリズムにより、さまざまなユースケースのモデルを改善するために、人々が評価に貢献できるようにもなっています。興味がある場合は、OpenAI Evalsリポジトリをチェックしてください。

次のモデルは、指定された日付で廃止される一時的なスナップショットです。最新のモデルバージョンを使用する場合は、gpt-4または などgpt-3.5-turbo

モデル廃止日
gpt-3.5-turbo-03012023年6月1日
gpt-4-03142023年6月14日
gpt-4-32k-03142023年6月14日