YomiToku-Proのデプロイ¶

前提

このページは YomiToku-ClientのAWS認証設定ガイドの「SageMakerエンドポイントを作成・更新・削除する権限」が付与されたIAMを利用していることを前提にしています。まだ前の手順が未完了の場合は、まずそちらをご覧ください。

YomiToku-Clientをご利用いただくには、AWS Marketplaceを通じてYomiToku-Proのサブスクリプションに加入し、YomiToku-ProのSageMakerエンドポイントをデプロイする必要があります。

YomiToku-ProをAWS Marketplaceを通してデプロイするには、次の３つの方法があります。各デプロイ方法の特徴を特徴を踏まえて、どちらかの方法を選びましょう。

デプロイ方法	リソースの管理方法	特徴
yomitoku-clientによるデプロイ	スタックでまとめて管理	お手軽に設定・管理。CLIで操作
AWS SageMaker単体によるデプロイ	個別に管理	詳細に設定・管理可能。ブラウザで操作
AWS CloudFormationによるデプロイ	スタックでまとめて管理	お手軽に設定・管理。ブラウザで操作

yomitoku-clientでデプロイする場合¶

yomitoku-clientによるデプロイと管理¶

yomitoku-client のCLIツールを使用すると、コマンドラインから簡単にSageMakerエンドポイントの作成、状態確認、削除を行うことができます。内部的にはAWS CloudFormationを利用しているため、関連するリソース（モデル、エンドポイント設定、エンドポイント）を「スタック」として一括管理できます。

デプロイの流れ¶

初期設定（ARNの取得と登録）
エンドポイントのデプロイ
ステータスの確認
エンドポイントの削除（アンデプロイ）

コマンドリファレンスまとめ¶

コマンド	用途
`configure`	モデルパッケージARNの設定
`deploy`	CloudFormationによるエンドポイント作成・更新
`list`	管理している全スタックの状態一覧
`describe`	特定スタックのステータス詳細
`delete`	スタックの削除（リソースの全削除）

Step 1: 初期設定（ARNの取得と登録）¶

最初に、AWS Marketplaceで購読しているYomiToku-Proの「モデルパッケージARN」を取得してクライアントに設定する必要があります。

ターミナルで以下のコマンドを実行します。

yomitoku-client sagemaker configure

実行すると、ブラウザで開くべきURLが表示されます。

Please sign-in to AWS Console and open the following URL in your browser to find the Model Package ARN.
--------------------------------------------------------------------------------
https://ap-northeast-1.console.aws.amazon.com/sagemaker/home?region=ap-northeast-1#/model-packages/my-subscriptions/prod-o37wuz7bn7kvc
--------------------------------------------------------------------------------

AWSコンソールにログインした状態で表示されたURLにアクセスし、使用するバージョンの Model Package ARN（arn:aws:sagemaker:... で始まる文字列）をコピーします。

ターミナルのプロンプトにコピーしたARNを貼り付けてエンターキーを押します。

Please enter the Model Package ARN: arn:aws:sagemaker:ap-northeast-1:123456789012:model-package/yomitoku-pro-xxx
Successfully configured Model Package ARN!

Note

「モデルパッケージARN」はバージョン毎に変わります。最新のYomitoku-Proを利用する際は改めて上記を実行して更新してください。

Step 2: エンドポイントのデプロイ¶

設定したARNを用いて、SageMakerエンドポイントを作成します。

以下のコマンドを実行してデプロイを開始します。

yomitoku-client sagemaker deploy --endpoint-name yomitoku-sagemaker --instance-type ml.g4dn.xlarge

主要なオプション

オプション	デフォルト値	説明
`--endpoint-name`	`yomitoku-sagemaker`	作成するエンドポイントの名前。CloudFormationのスタック名にも利用されます。
`--instance-type`	`ml.g4dn.xlarge`	使用するインスタンスタイプ。`ml.g4dn.xlarge`, `ml.g5.xlarge`, `ml.g6.xlarge`, `ml.c7i.xlarge`, `ml.c7i.2xlarge` が選択可能。検証用途ならデフォルトの`ml.g4dn.xlarge`で十分。性能を求める場合はg5やg6系, インフラコストの安いCPUインスタンス利用の場合はc7i系を推奨。
`--instance-count`	`1`	デプロイするインスタンス数。

Warning

サービスはスタックをデプロイしてから、スタックを削除するまで、従量課金で料金が発生します。サービスの利用を終了する場合は、必ず削除コマンドyomitoku-client sagemaker deleteを実行してください。

Step 3: ステータスの確認¶

デプロイには通常数分〜10分程度の時間がかかります。現在の状態を確認するには以下のコマンドを使用します。

スタック一覧の表示

作成済みの管理スタックとその状態を一覧表示します。
```
yomitoku-client sagemaker list
```
詳細情報の表示

特定のエンドポイント（スタック）の詳細な情報を取得します。
```
yomitoku-client sagemaker describe --endpoint-name yomitoku-sagemaker
```
ステータスが CREATE_COMPLETE になっていれば、エンドポイントは正常に起動し、推論が可能な状態です。

Step 4: エンドポイントの削除（アンデプロイ）¶

利用を終了する場合は、課金を止めるためにスタックを削除します。この操作により、エンドポイント、エンドポイント設定、モデルのすべてが自動的に削除されます。

以下のコマンドを実行します。

yomitoku-client sagemaker delete --endpoint-name yomitoku-sagemaker

削除が開始されます。完全に削除されたかどうかは yomitoku-client sagemaker list コマンドで確認してください。

AWS SageMakerでデプロイをする場合¶

AWS SageMakerでデプロイ¶

AWS Marketplaceを用いてAWS SageMakerでデプロイします。次の流れでデプロイをします。

モデルの作成
エンドポイントの設定の作成
エンドポイントの作成

ここではプロビジョン済みタイプのエンドポイントを使うため、エンドポイントの作成が完了した時点から、エンドポイントを削除するまで料金が発生します。モデルの作成やエンドポイントの設定を作成しても料金は発生しません。

AWS マネジメントコンソールにサインインします。
左上の検索ウィンドウからYomiToku-Proを検索し、選択します。
右上のContinue to Subscribeを選択し、次のページでも右上のContinue to configurationを選択します。
launch methodでSageMaker Consoleを選択します。
Software Versionは、特別な理由がない限り、最新版を選択します。Regionは、使用するものを選択します。Amazon SageMaker optionsでCreate a real-time inference endpointを選択します。Create a batch transform jobの方のモードは現時点ではYomiToku-Clientでサポートされていません。
モデルの設定をします。モデル名を設定し、ロールを設定します。「新しいロールの作成」を選択した際に自動作成されるロールを利用することを推奨します。「ロール作成ウィザードを使用してロールを作成」を選択するとロール名やロールに与える権限をより詳細に設定してロールを作成できます。エンドポイントの作成の2回目以降など、既にロールが存在している場合は新しくロールを作成する必要はありません。ロールの削除がしたいなどの理由でロールの設定画面を開きたい場合は本ドキュメントの「付録:各種設定画面の開き方」をご確認ください。
コンテナの定義1のコンテナ入力オプションで「AWS Marketplaceからのモデルパッケージサブスクリプションを使用する」を選択します。（デフォルト設定）
VPCはAWS上に構築する仮想的なプライベートネットワークです。AWS上の他のサービスから接続する際にVPCを用いることでセキュアな通信経路を構築できます。VPCの設定は必要に応じて設定します。（VPCの設定は必須ではありません。）詳しくはこちらの公式ドキュメントをご確認ください。タグは、AWSリソースに設定するキーと値のペアです。リソースの識別、分類、管理を目的として、必要に応じて設定します。詳しくはこちらの公式ドキュメントをご確認ください。
右下の「次へ」をクリックしてモデルの作成を完了します。
エンドポイント名を設定し、エンドポイント設定のアタッチの項目の選択をします。既存のエンドポイント設定を使用する場合は「既存のエンドポイント設定の使用」を、新しくエンドポイント設定を作成する場合は「新しいエンドポイント設定の作成」を選択します。「既存のエンドポイント設定の使用」を選択した場合は使用するエンドポイント設定を選択して、バリアントの設定まで移ってください。「新しいエンドポイントの作成」を選択した場合について説明します。
エンドポイント設定名を設定します。エンドポイントのタイプはプロビジョン済みを選択します。暗号化キーを設定することでSageMakerがS3にデータを保存する際に用いられるAWS KMSキーを、お客様が管理・指定できます。暗号化キーは適宜設定します。（暗号化キーの設定は必須ではありません。）暗号化キーについては詳しくはこちらの公式ドキュメントをご確認ください。プロビジョン済みのタイプではエンドポイントを作成してから削除するまでモデルをホストするコンテナが起動し続けます。サーバーレス推論はGPUをサポートしていないのでYomiToku-Proではご利用いただけません。
非同期呼び出し設定のトグルとデータキャプチャのトグルはオフに設定します。非同期呼び出し設定は現時点ではYomiToku-Proでサポートされていません。データキャプチャはここでは利用しません。
インスタンスタイプやインスタンス数などを変更する際はバリアントの設定をします。インスタンスタイプによってインスタンスの性能とコストが変わります。本番稼働の下にあるスクロールバーを右にスクロールします。アクションの欄にある「編集」をクリックします。インスタンスタイプを選択します。検証の場合はml.g4dn.xlargeで十分ですが、性能を求める場合はml.g5.xlargeを選択します。v1.1.0よりCPUインスタンスによる推論もサポートされており、ml.c7i.xlarge, ml.c7i.2xlargeを利用することでインスタンス利用量をさらに抑えることができます。初期インスタンス数を設定します。インスタンス数に応じて同時に処理できるリクエストの数が増えますが、コストもインスタンス数に比例して増加します。その他の設定はここでは利用しません。
右下の「保存」をクリックしてバリアントの設定を保存します。
シャドウバリアントの設定はここでは利用しません。
「エンドポイント設定の作成」をクリックしてエンドポイント設定の作成を完了します。
タグの設定は必要な場合は設定します。
右下の「送信」をクリックしてエンドポイントの作成を完了します。
エンドポイントの作成には時間がかかります。ステータスCreatingがステータスInServiceになるのを待ちます。

Warning

サービスはエンドポイントをデプロイしてから、エンドポイントを削除するまで、従量課金で料金が発生します。サービスの利用を終了する場合は、必ずエンドポイントを削除してください。

AWS SageMakerでアンデプロイ¶

次の順番でアンデプロイをします。

エンドポイントの削除
エンドポイント設定の削除
モデルの削除
AWS マネジメントコンソールにサインインします。
左上の検索ウィンドウからAmazon SageMaker AIを検索します。
左側のメニューをスクロールし、左側のトグルで推論の項目を開きます。
左側のメニューから推論>エンドポイントを開きます。作成したエンドポイント名をクリックします。作成したエンドポイントの設定画面の右上の削除ボタンをクリックします。
左側のメニューから推論>エンドポイント設定を開きます。作成したエンドポイント設定名をクリックします。作成したエンドポイント設定の設定画面の右上の削除ボタンをクリックします。
左側のメニューから推論>モデルを開きます。作成したモデル名をクリックします。作成したモデルの設定画面の右上のアクションボタンをクリックし、削除をクリックします。

既存のモデルやエンドポイント設定からエンドポイントを作成する際は、それぞれの設定画面（モデル設定画面、エンドポイント設定画面など）を開いて操作します。

AWS CloudFormationでデプロイする場合¶

CloudFormationでは、AWSリソースのセット全体をスタックという単位で一元管理します。スタックには、AWS SageMakerのモデル・エンドポイント設定・エンドポイントのリソースなどが含まれています。デプロイの際はスタックを作成し、アンデプロイの際はスタックを削除します。スタックが作成されてからスタックが削除されるまで料金が発生し続けます。

AWS CloudFormationでデプロイ¶

AWS マネジメントコンソールにサインインします。
左上の検索ウィンドウからYomiToku-Proを検索し、選択します。
右上のContinue to Subscribeを選択し、次のページでも右上のContinue to configurationを選択します。
launch methodでAWS CloudFormationを選択します。
Software Versionは、特別な理由がない限り、最新版を選択します。Regionは、使用するものを選択します。
YomiToku-Proの2回目以降のデプロイの場合など、既にロールが存在している場合は「Use an existing service role」を選択し、そのロールを選択します。初めての場合は「Create and use a new service role」を選択します。AmazonSagemaker-ExecutionRoleから始まる名前のロールが作成されます。CloudFormationのスタック内で既存のS3バケットを利用（参照）したい場合や、その設定をスタックで管理したい場合には、バケット名を指定します。
スタック名を設定します。
エンドポイント名、インスタンス数、インスタンスタイプを設定します。インスタンス数に応じて同時に処理できるリクエストの数が増えますが、コストもインスタンス数に比例して増加します。インスタンスタイプは検証の場合はml.g4dn.xlargeで十分ですが、性能を求める場合はml.g5.xlargeを入力します。その他の項目については変更しません。
タグは、AWSリソースに設定するキーと値のペアです。リソースの識別、分類、管理を目的として、必要に応じて設定します。詳しくはこちらの公式ドキュメントをご確認ください。
アクセス許可を必要に応じて設定します。デフォルトではユーザーの権限で実行されますが、IAMロールを指定してCloudFormationを実行したい場合は設定します。
「その他の設定」については特に理由が無ければデフォルト設定で構いません。詳細についてはこちらのドキュメントをご確認ください。
右下の「スタックの作成」を選択します。
スタックの作成には時間がかかります。作成したスタックのステータスがCREATE_IN_PROGRESSからCREATE_COMPLETEになるまで待ちます。論理IDがスタック名、ステータスがCREATE_COMPLETEのイベントが発生したかどうかなどでスタックの作成が完了したかどうかを確認することができます。