YomiToku-Proのデプロイ¶
前提
このページは YomiToku-ClientのAWS認証設定ガイド のIAM設定を前提にしています。 まだ前の手順が未完了の場合は、まずそちらをご覧ください。
YomiToku-Clientをご利用いただくには、AWS Marketplaceを通じてYomiToku-Proのサブスクリプションに加入し、YomiToku-ProのSageMakerエンドポイントをデプロイする必要があります。
YomiToku-ProをAWS Marketplaceを通してデプロイするには、次の二つの方法があります。 各デプロイ方法の特徴を特徴を踏まえて、どちらかの方法を選びましょう。
| デプロイ方法 | リソースの管理方法 | 特徴 |
|---|---|---|
| AWS SageMaker単体によるデプロイ | 個別に管理 | 詳細に設定・管理可能 |
| AWS CloudFormationによるデプロイ | スタックでまとめて管理 | お手軽に設定・管理 |
AWS SageMakerでデプロイをする場合¶
AWS SageMakerでデプロイ¶
AWS Marketplaceを用いてAWS SageMakerでデプロイします。 次の流れでデプロイをします。
- モデルの作成
- エンドポイントの設定の作成
- エンドポイントの作成
ここではプロビジョン済みタイプのエンドポイントを使うため、エンドポイントの作成が完了した時点から、エンドポイントを削除するまで料金が発生します。モデルの作成やエンドポイントの設定を作成しても料金は発生しません。
- AWS マネジメントコンソールにサインインします。
- 左上の検索ウィンドウからYomiToku-Proを検索し、選択します。

- 右上のContinue to Subscribeを選択し、次のページでも右上のContinue to configurationを選択します。

- launch methodでSageMaker Consoleを選択します。

- Software Versionは、特別な理由がない限り、最新版を選択します。Regionは、使用するものを選択します。Amazon SageMaker optionsでCreate a real-time inference endpointを選択します。Create a batch transform jobの方のモードは現時点ではYomiToku-Clientでサポートされていません。

- モデルの設定をします。モデル名を設定し、ロールを設定します。「新しいロールの作成」を選択した際に自動作成されるロールを利用することを推奨します。「ロール作成ウィザードを使用してロールを作成」を選択するとロール名やロールに与える権限をより詳細に設定してロールを作成できます。エンドポイントの作成の2回目以降など、既にロールが存在している場合は新しくロールを作成する必要はありません。ロールの削除がしたいなどの理由でロールの設定画面を開きたい場合は本ドキュメントの「付録:各種設定画面の開き方」をご確認ください。

- コンテナの定義1のコンテナ入力オプションで「AWS Marketplaceからのモデルパッケージサブスクリプションを使用する」を選択します。(デフォルト設定)

- VPCはAWS上に構築する仮想的なプライベートネットワークです。AWS上の他のサービスから接続する際にVPCを用いることでセキュアな通信経路を構築できます。VPCの設定は必要に応じて設定します。(VPCの設定は必須ではありません。)詳しくはこちらの公式ドキュメントをご確認ください。タグは、AWSリソースに設定するキーと値のペアです。リソースの識別、分類、管理を目的として、必要に応じて設定します。詳しくはこちらの公式ドキュメントをご確認ください。

- 右下の「次へ」をクリックしてモデルの作成を完了します。
- エンドポイント名を設定し、エンドポイント設定のアタッチの項目の選択をします。既存のエンドポイント設定を使用する場合は「既存のエンドポイント設定の使用」を、新しくエンドポイント設定を作成する場合は「新しいエンドポイント設定の作成」を選択します。「既存のエンドポイント設定の使用」を選択した場合は使用するエンドポイント設定を選択して、バリアントの設定まで移ってください。「新しいエンドポイントの作成」を選択した場合について説明します。

- エンドポイント設定名を設定します。エンドポイントのタイプはプロビジョン済みを選択します。暗号化キーを設定することでSageMakerがS3にデータを保存する際に用いられるAWS KMSキーを、お客様が管理・指定できます。暗号化キーは適宜設定します。(暗号化キーの設定は必須ではありません。)暗号化キーについては詳しくはこちらの公式ドキュメントをご確認ください。プロビジョン済みのタイプではエンドポイントを作成してから削除するまでモデルをホストするコンテナが起動し続けます。サーバーレス推論はGPUをサポートしていないのでYomiToku-Proではご利用いただけません。

- 非同期呼び出し設定のトグルとデータキャプチャのトグルはオフに設定します。非同期呼び出し設定は現時点ではYomiToku-Proでサポートされていません。データキャプチャはここでは利用しません。

- インスタンスタイプやインスタンス数などを変更する際はバリアントの設定をします。インスタンスタイプによってインスタンスの性能とコストが変わります。本番稼働の下にあるスクロールバーを右にスクロールします。
アクションの欄にある「編集」をクリックします。
インスタンスタイプを選択します。検証の場合はml.g4dn.xlargeで十分ですが、性能を求める場合はml.g5.xlargeを選択します。ml.c5.2xlargeではGPUを使うことができないのでYomiToku-Proでサポートされていません。初期インスタンス数を設定します。インスタンス数に応じて同時に処理できるリクエストの数が増えますが、コストもインスタンス数に比例して増加します。その他の設定はここでは利用しません。

- 右下の「保存」をクリックしてバリアントの設定を保存します。
- シャドウバリアントの設定はここでは利用しません。
- 「エンドポイント設定の作成」をクリックしてエンドポイント設定の作成を完了します。
- タグの設定は必要な場合は設定します。
- 右下の「送信」をクリックしてエンドポイントの作成を完了します。
- エンドポイントの作成には時間がかかります。
ステータスCreatingがステータスInServiceになるのを待ちます。

Warning
サービスはエンドポイントをデプロイしてから、エンドポイントを削除するまで、従量課金で料金が発生します。サービスの利用を終了する場合は、必ずエンドポイントを削除してください。
AWS SageMakerでアンデプロイ¶
次の順番でアンデプロイをします。
- エンドポイントの削除
- エンドポイント設定の削除
-
モデルの削除
-
AWS マネジメントコンソールにサインインします。
- 左上の検索ウィンドウからAmazon SageMaker AIを検索します。

- 左側のメニューをスクロールし、左側のトグルで推論の項目を開きます。

- 左側のメニューから推論>エンドポイントを開きます。作成したエンドポイント名をクリックします。作成したエンドポイントの設定画面の右上の削除ボタンをクリックします。
- 左側のメニューから推論>エンドポイント設定を開きます。作成したエンドポイント設定名をクリックします。作成したエンドポイント設定の設定画面の右上の削除ボタンをクリックします。
- 左側のメニューから推論>モデルを開きます。作成したモデル名をクリックします。作成したモデルの設定画面の右上のアクションボタンをクリックし、削除をクリックします。
既存のモデルやエンドポイント設定からエンドポイントを作成する際は、それぞれの設定画面(モデル設定画面、エンドポイント設定画面など)を開いて操作します。
AWS CloudFormationでデプロイする場合¶
CloudFormationでは、AWSリソースのセット全体をスタックという単位で一元管理します。 スタックには、AWS SageMakerのモデル・エンドポイント設定・エンドポイントのリソースなどが含まれています。 デプロイの際はスタックを作成し、アンデプロイの際はスタックを削除します。 スタックが作成されてからスタックが削除されるまで料金が発生し続けます。
AWS CloudFormationでデプロイ¶
- AWS マネジメントコンソールにサインインします。
- 左上の検索ウィンドウからYomiToku-Proを検索し、選択します。

- 右上のContinue to Subscribeを選択し、次のページでも右上のContinue to configurationを選択します。

- launch methodでAWS CloudFormationを選択します。

- Software Versionは、特別な理由がない限り、最新版を選択します。Regionは、使用するものを選択します。

- YomiToku-Proの2回目以降のデプロイの場合など、既にロールが存在している場合は「Use an existing service role」を選択し、そのロールを選択します。初めての場合は「Create and use a new service role」を選択します。AmazonSagemaker-ExecutionRoleから始まる名前のロールが作成されます。CloudFormationのスタック内で既存のS3バケットを利用(参照)したい場合や、その設定をスタックで管理したい場合には、バケット名を指定します。

- スタック名を設定します。

- エンドポイント名、インスタンス数、インスタンスタイプを設定します。インスタンス数に応じて同時に処理できるリクエストの数が増えますが、コストもインスタンス数に比例して増加します。インスタンスタイプは検証の場合はml.g4dn.xlargeで十分ですが、性能を求める場合はml.g5.xlargeを入力します。その他の項目については変更しません。

- タグは、AWSリソースに設定するキーと値のペアです。リソースの識別、分類、管理を目的として、必要に応じて設定します。詳しくはこちらの公式ドキュメントをご確認ください。

- アクセス許可を必要に応じて設定します。デフォルトではユーザーの権限で実行されますが、IAMロールを指定してCloudFormationを実行したい場合は設定します。

- 「その他の設定」については特に理由が無ければデフォルト設定で構いません。詳細についてはこちらのドキュメントをご確認ください。
- 右下の「スタックの作成」を選択します。
- スタックの作成には時間がかかります。作成したスタックのステータスがCREATE_IN_PROGRESSからCREATE_COMPLETEになるまで待ちます。論理IDがスタック名、ステータスがCREATE_COMPLETEのイベントが発生したかどうかなどでスタックの作成が完了したかどうかを確認することができます。

Warning
サービスはスタックをデプロイしてから、スタックを削除するまで、従量課金で料金が発生します。サービスの利用を終了する場合は、必ずスタックを削除してください。
AWS CloudFormationでアンデプロイ¶
- AWS マネジメントコンソールにサインインします。
- 左上の検索ウィンドウからCloudFormationを検索します。

- デプロイしたスタック名の左側の円形のチェックボックスを選択します。

- 上部にある「削除」を選択します。
付録:各種設定画面の開き方¶
ロール¶
ロールの設定画面はIAMから開くことができます。ロールの削除をしたい場合などはそちらをご利用ください。
次の手順でIAMの設定画面を開くことができます。
- AWS マネジメントコンソールにサインインします。
- 左上の検索ウィンドウからIAMを検索します。
- IAMを選択します。

- 左側のメニューでロールを選択します。
AWS SageMakerのモデル・エンドポイント設定・エンドポイント¶
AWS SageMakerのモデル・エンドポイント設定・エンドポイントの設定画面はAmazon SageMaker AIの推論の項目から開くことができます。一度作成したモデルやエンドポイント設定からエンドポイントを作成することや、モデル・エンドポイント設定・エンドポイントの削除などができます。
次の手順でモデル・エンドポイント設定・エンドポイントの設定画面を開くことができます。
- AWS マネジメントコンソールにサインインします。
- 左上の検索ウィンドウからAmazon SageMaker AIを検索します。

- 左側のメニューをスクロールし、左側のトグルで推論の項目を開きます。

- 設定したい項目に応じて左側のメニューで推論>モデル、推論>エンドポイント設定、推論>エンドポイントを選択します。
AWS CloudFormationのスタック¶
AWS CloudFormationのスタックの設定画面はCloudFormationを検索すると開くことができます。
- AWS マネジメントコンソールにサインインします。
- 左上の検索ウィンドウからCloudFormationを検索します。

- CloudFormationを選択すると、スタックの設定画面が開くことができます。