AIでシステムのパフォーマンス監視・リソース調整を自動化するTurbonomic ARMとは?
投稿者:AIOps担当(森)
こんにちは。
私たちAIOps担当は、システム運用を効率化・高度化するため、機械学習の技術を採用した「AIOps」や、アプリケーションパフォーマンス管理の「APM」といったソリューションのご提案から構築・導入後の支援まで担当しています。
これらのソリューションから今回は、IBM Turbonomic Application Resource Management(以下、Turbonomic) を数回にわたってご紹介していきます。
アプリケーションリソース管理(ARM)とは?
IBMでは、Turbonomicをアプリケーションリソース管理(ARM)の製品とうたっています。簡単にいえば、システム・アプリケーションが動作するのに最適なリソースを自動的に調整する製品と言えます。
システムの運用を担当されている方は、「サーバーやシステムのパフォーマンス監視は、当然しているよ。」と思われるかもしれません。しかしパフォーマンスを監視しているだけでは、システムの安定稼働には不十分です。
・システムの利用状況やリソースの状態を把握する。
・システムの状態にあわせてリソース過不足を適正化する。
このような作業を人手で行うのは、サーバーやシステムが増加すると、作業工数の増大・人的リソースの制約、システムの状況に合わせた適切なタイミングでの実施が困難といった課題に直面します。
システム運用におけるリソース調整の課題
従来のシステムにおけるリソース調整の代表的な課題を挙げてみます。
●システム導入・更改時
数年先のシステム利用状況(需要)を予測し、さらに安全率を加算して、システムリソースを算出する。
⇒ 導入当初は需要よりシステムリソースが大きく、過剰なリソースによる無駄なコストが発生する。
●システム運用時
システムの性能情報を取得し、定期的(週次や月次)に性能情報を分析し、システムリソースの過不足を判定する。
⇒ 各種性能情報をとりまとめて、システムパフォーマスのレポートを作成する工数が発生する。またレポートを作成するのに時間を要するため情報が古くなっている。
●リソース変更時
CPUやメモリの使用量がしきい値に達しつつある状況で、リソースの追加を計画する。
⇒ 作業の度に、メンテナンス作業計画や作業手順の作成といった工数が発生する。リソース増強が必要と判断されてから、実行までに時間がかかる。
Turbonomic導入によるリソース調整の課題解決
TurbonomicはAIの技術を活用し、システムの状況をリアルタイムに把握し、状況に合わせたリソースの調整作業を、自動化・省力化します。
先ほど列挙した課題に対し、Turbonomicを導入することによる効果を挙げてみます。
●システム導入・更改時
Turbonomicを利用している環境であれば、最適なリソースに調整されているため、システム更改時にも適切なリソースで導入することが可能です。新規に構築するシステムの場合は、負荷テストからTurbonomicを利用することで、リソースを最適化して導入することが可能です。
●システム運用時
Turbonomicは収集している性能情報を常時解析しています。Turbonomicの画面から、アプリケーションの利用状況・処理量や、システムのパフォーマンス・リソース状況、そしてクラウドのコスト予測などの各種レポートをリアルタイムに確認することができます。調整すべきシステムのリソースについても、常時ガイドします。
●リソース変更時
Turbonomicはリソースの調整を完全に自動化することが可能です。Turbonomicは性能情報の常時解析から、システムのリソース変更の実行まで完全に自動で行います。したがって必要なタイミングでリソースの調整を行うことが可能です。
※ 性能情報の常時期解析と適正化すべきリソースの提示までをTurbonomicで自動化し、リソース変更の実行は運用担当者が行うといった運用も可能です。
まとめ
Turbonomicを導入することで、システムのリソースを最適な状態にし、以下のような問題を解決します。
・過剰なリソースによる無駄なコストの発生防止
・リソース不足によるパフォーマンス問題の予防(障害の予防)
・性能分析やリソース調整作業に必要な作業工数の削減(省力化)
次回以降はTurbonomicの各種機能のご紹介をいたします。