Technical Blog テクニカルブログ
  1. HOME
  2. テクニカルブログ
  3. IBM Turbonomicを利用したリソースの最適化

IBM Turbonomicを利用したリソースの最適化

投稿者:AIOps担当

こんにちは。私どものAIOps担当では、システム運用を効率化・高度化するため、機械学習の技術を採用した「AIOps」・アプリケーションパフォーマンス管理の「APM」といった製品の、ご提案から構築・導入後の支援まで担当しています。

第1回目ではTurbonomicの特徴・機能についてご紹介いたしました。

AIでシステムのパフォーマンス監視・リソース調整を自動化するTurbonomic ARMとは?

Turbonomicは、次世代型のアプリケーションリソース管理(ARM)システム・アプリケーションが動作するのに最適なリソースを自動的に調整する製品です。

本ブログではTurbonomicを利用して具体的にどのようにシステムの利用状況やリソース状況を把握し、状態に合せてリソースの最適化を行う事が出来るかをご紹介します。

システムの利用状況やリソースの状態の把握

それでは早速Turbonomicにログインしてみましょう。

HOME画面ではシステムの利用状況やリソースの状態のサマリ情報が表示され、一目でシステムの状況を把握する事が出来るようになっています。

また、サマリだけではなく、ドリルダウンする事で気になるコンポーネントの詳細を確認する事ができます。

今回は「Demo-RobotShop-OCP」という特定のアプリケーションをより詳しく確認したいと思いますので、Top Business Applicationsより「Demo-RobotShop-OCP」をクリックしていきます。

詳細画面では「Demo-RobotShop-OCP」関連の情報に絞り込まれたリソースサプライチェーンが表示され、問題が発生している可能性がある箇所をクイックに確認する事が出来ます。

また、ResponseTimeセクションではアプリケーションのレスポンス状況が確認できます。

今回の例でいうと、グラフにいくつかのスパイクがあり、レスポンスが遅くなっているタイミングがあるのが分かります。

この事象に対して原因を探るためにトランザクションレベル、インフラレベルなどで細かく原因を調査していくことも出来ますが、PendingActionを確認すればアプリケーションを最適化するための推奨されるアクションをクイックに確認する事ができます。

システムの最適化

問題がある事がわかったところで、次にシステムの最適化についてみていきましょう。Turbonomicではデフォルトで30日間のリソースをウォッチして、使用率、社内のポリシー及び過去に学習したデータ等を元にAIが分析を行い、様々なアクションを推奨してくれます。

推奨されているアクションについてはActionCenterの画面より一覧で確認する事ができます。

アクションの中には不要なリソースの削除、不足しているリソースの追加、CPUやメモリのリサイズ、設定の変更等があります。

(※CPUやメモリ等のインフラ周りのパラメーターについてはTurbonomic経由で自動的に最適なパラメータに変更可能です。アプリ・ミドルについてもパラメータの推奨値を提示してくれるので、利用者は推奨値を設定することで最適化することができます。)

それでは早速「Demo-RobotShop-OCP」を最適化する為にどういったアクションが取れるのかを確認していきましょう。

まずはDemo-RobotShop-OCP」の画面のPendingActionの下のShow AllをクリックしActionCenter画面に遷移します。

ActionCenterでは「Demo-RobotShop-OCP」に関する推奨アクションが表示されており、推奨されているアクションについてAIがそのように判断した根拠についてもDETAILより確認する事が可能です。

試しに「SHIPPING」をクリックしてみます。

詳細画面が表示され、画面上部の概要セクションで今回はAWS上の「ocp47demo-2v5jc-worker-us-east-2a-xq4qz」という仮想マシンの GP3のIOPS を 3,000 IOPS から 3,600 IOPS にスケールアップし、IO スループットを125 MB/秒から 179 MB/秒に変更する事が推奨されている事がわかります。

また、これらのアクションが推奨されている根拠については左のグラフより確認することが出来ます。

この例ですと、30 日間の観察期間中の 95% の時間で IOPS 使用率が 84%と比較的高めな事等がわかります。

また、アクションを適応する際は必ずその影響等が気になるかと思いますが、適応した結果のコストやリソースの状況は右側のセクションで確認出来るようになっています。

今回でいうと3600 IOPSにスケールアップする事でIOPS 使用率が70%程度に低減されパフォーマンスが改善する事や、コスト面では対応する事で月当たり$5.16程度費用が増える事等が分かります。

そして確認した内容が必要なアクションと判断した場合は、Executeボタンを押下する事で自動で推奨された内容をシステムに反映し最適化を行うことが出来ます。

今回は手動でExecuteボタンで最適化を行っておりますが、ポリシーを設定することで同じような状況になった場合に自動的に同様の対応を行わせる事も可能です。

まとめ

Turbonomicではシステム全体の利用状況やリソースの状況をクイックに把握出来るUIを提供し、リソースの最適化を自動で継続的に行う事が出来ます。

この一連の動きを人手で行う場合、組織的にアプリを管理している人とインフラを管理している人が分かれている為なかなかコミュニケーションが難しく、調査・判断に時間がかかってしまう事が少なくありません。

なので今回の例でお見せしたように意思決定に役立つ情報を提供してくれるだけでも大幅に業務の負荷を減らす事が出来るかと思います。さらにリソースの使用状況が可視化され、自動でメンテナンスすることも可能な為、毎月クラウド環境のキャパシティー状況を確認して報告するといった手間も省けるようになります。

今回は以上となりますが、その他、より細かい使い方を知りたい、デモをしてほしい、費用感について相談したいなど、APMやAIOpsに関するご相談は日本情報通信にお任せください。

いつでもお待ちしております。

APMやAIOpsに関する
お問い合わせはこちら

ページのトップへ