モデル構成の概要
このチュートリアルでは、** でさまざまな大規模な言語モデルを構成する方法を説明します。SelectTranslate** 拡張子を含む API keys、エンドポイント URL、モデルの選択、パフォーマンス パラメーター、およびプロンプト設定。モデルを適切に構成すると、サービスの安定性が向上し、さまざまな翻訳シナリオにわたって翻訳の精度、応答速度、全体的なユーザー エクスペリエンスが向上します。
1. 設定する API Key
アン API key モデル サービス プロバイダーによって提供される公式のアクセス資格情報であり、モデル サービス プロバイダーを安全に呼び出すために使用されます。 AI モデルと関連サービス。
共通 API Key 構成の問題
- 不正確 API Key 形式: API key 文字が欠けていたり、余分なスペースがあったり、誤って切り捨てられたりする可能性があります。サービスによって提供される完全なキーを必ずコピーし、スペース、改行、その他の無効な文字を含めないようにしてください。
- API Key サービスプロバイダーとの不一致: API keys 異なるモデルプロバイダーの製品は互換性がありません。たとえば、 OpenAI API key と一緒に使用することはできません DeepSeek モデル。
- API Key 期限切れまたは無効: API key 有効期限、手動による非アクティブ化、アカウントの問題、使用制限、またはセキュリティ上の理由により取り消された可能性があります。プロバイダーのコンソールにアクセスして、現在のステータスを確認してください。 API key.
- エンドポイント URL エラー: 有効な API Key、エンドポイント URL が間違っている場合、バージョン パスが欠落している場合、またはプロバイダーの特定の要件と一致しない場合、接続テストは失敗する可能性があります。
- モデル名の不一致: モデル名のスペルが正しく、プロバイダーによって正式にサポートされていることを確認してください。ここでのタイプミスは、次のように誤認されることがよくあります。 API Key 問題。
- ネットワークまたはプロキシの問題: ローカル ネットワークの安定性、プロキシ構成、またはファイアウォールの制限によってリクエストがブロックされ、認証の失敗やリクエストのタイムアウトが発生する可能性があります。
2. 翻訳モデルの選択
拡張機能を構成する場合、モデル名は、拡張機能に関連付けられたサービス プロバイダーと一致する必要があります。 API key;そうしないと、モデルを正常に呼び出すことができません。
サポートされているプロバイダーとモデル マッピング
| プロバイダー | モデル名 |
|---|---|
| OpenAI | gpt-5、gpt-5-mini、gpt-5-nano |
| Gemini | gemini-2.5-flash、gemini-2.0-flash-lite |
3.カスタム API URL
拡張子は公式のものを使用します API デフォルトでは URL なので、通常は調整する必要はありません。 URL の手動入力は、次の場合にのみ必要です。
- リバース プロキシまたはリレー サービスを介してモデルを呼び出す、
- プライベートにデプロイされた大規模モデル サービスを使用して、
- サードパーティへの接続 API 公式のデフォルト URL を完全には使用していないサービス。
入力ガイドライン:
- URL は完全な HTTPS エンドポイントである必要があります。例:
https://api.your-company.com/v1/chat/completions - エンドポイント パスはサービス プロバイダーの技術ドキュメントと一致する必要があります。 API 指定された形式に従うリクエストを正しく受信して処理する必要があります。
4. モデルパラメータの調整
次のパラメータは、翻訳品質、モデルの安定性、応答速度を調整するために使用されます。デフォルト設定は、ほとんどのユースケースをカバーします。特定の要件に合わせて必要に応じて調整します。
| パラメータ | 説明 | 推奨設定 |
|---|---|---|
| リクエストごとの最大テキスト長 | 1 回の翻訳リクエストで送信できる最大文字数を制限するために使用されます。この値を高く設定しすぎると速度が低下する可能性があります API 応答;妥当な範囲内に保つと、安定性と応答速度が向上します。 | - 推奨 1000–1500 キャラクター- 超過を避ける 2000 応答の遅延やコンテンツの損失を防ぐための文字。 |
| リクエストごとの最大段落数 | 1 回の翻訳リクエストで一度に送信できる段落の数。一度に送信する段落が多すぎると、処理負荷が増加し、応答が遅くなったり、安定性が低下したりする可能性があります。この値を適切に設定すると、全体的な翻訳の効率と信頼性が向上します。 | - 技術文書または法律文書:1(用語の正確性を確保するために段落ごとに処理します)- 小説、対話、ブログ: 3–5(流暢さが向上します) |
| 1 秒あたりの最大リクエスト | 1 秒あたりに送信される翻訳リクエストの数。リクエストレートが高すぎる場合、ヒットを避けるために追加のリクエストがキューに入れられます。 API レート制限を行い、システム全体の安定性を維持します。 | - 一般的な用途:25- 厳格な料金制限サービス (例: Gemini): 8–10 |
| 温度 | モデルの出力のランダム性と変動性を制御します。温度の値が高いほど、より多様で創造的な応答が生成され、値が低いほど、より安定した出力が得られ、一貫性のある正確な翻訳に適しています。 | - 翻訳タスクの推奨事項: 公式推奨温度はモデルによって異なります。提供されているデフォルトを使用し、必要に応じて調整することをお勧めします。 |
5. カスタムプロンプト(システムプロンプト/ユーザープロンプト)
この拡張機能には、最も一般的な翻訳シナリオをカバーする、最適化された組み込みの一般的な翻訳プロンプトが含まれています。 翻訳スタイル、用語の一貫性、ドメインの専門知識、トーンの好みなど、特定の要件が存在する場合は、カスタム プロンプトを使用してモデルの出力を微調整できます。
カスタム翻訳プロンプトを作成する場合は、次のガイドラインに従うことをお勧めします。
- 明確で具体的な指示: ターゲット言語、翻訳スタイル、ドメイン、避けるべき表現や単語の選択を明確に指定します。
- 実行可能な指示: モデルが指示を正確に理解して従うことができるように、曖昧または抽象的な記述を避け、具体的かつ正確な説明を使用します。
- プロンプトは簡潔にしてください: プロンプトが簡潔なままで十分な情報を提供するようにし、モデルの理解を妨げる可能性のある冗長な詳細を避けます。
6. 免責事項
🔔 予期せぬ費用が発生しないように、無料枠とサービスプロバイダーによって請求される料金にご注意ください。

