AIOpsとは?AIを活用したIT運用の概要とメリットを解説!
システムを効率よく利用する考え方として、AIOpsと呼ばれるものが浸透するようになってきました。人工知能や機械学習を活用して、IT業務全般を自動化したり効率化したりする考え方です。今までの業務内容をビッグデータとして学習させ、最適な行動を取らせる手法だと考えれば良いでしょう。
AIOpsは2016年にガートナー社によって提唱されましたが、その浸透度合いはまだまだ浅いものです。皆さんの中にも詳しく理解できていない人がいるでしょう。今回は、AIOpsとはどのような考え方であり、導入することでどのようなメリットをもたらしてくれるのか解説します。
AIOps(エーアイオプス)とは
AIOpsとは、どのような考え方であるのか解説します。
AIOpsの基本
AIOpsの基本的な考え方は、AIを用いて高速かつ正確にITシステムを運用することです。定義としては曖昧なものであり、あくまでもIT運用に関する概念であると捉えれば良いでしょう。例えば、大量の社内システムが存在している環境では、運用の担当者に大きな負担がかかってしまいます。また、人的ミスが生じる可能性も高くなってしまうため、AIが運用について学習して作業をサポートしたりミスなく確実にこなしたりするのです。
なお、このような自動化を活用した作業ミスの軽減や効率化は、現時点でも「DevOps」として提唱されています。AIOpsは、現在採用されていることも多いDevOpsの概念にAIを組み合わせたものだと考えましょう。DevOpsはAIの導入を前提としていないため、根本的に考え方が合致しない部分は含まれますが、総合的にはAIとDevOpsの良い部分を組み合わせたものだと考えられます。
AIOpsの特徴
AIOpsの特徴としては「大量のデータ収集」と「機械学習によるパターンの習得」が挙げられます。
まず、AIOpsは大量のシステムからデータを収集することが可能です。運用の対象となるシステムはもちろん、自社が利用しているシステム以外でもデータを収集したり取り込んだりできます。大量のデータソースから学習できる環境を整えることで、より正確な判断を下せるAIへと成長させられるのです。
また、AIの中でも機械学習によるパターンの習得に力が入れられています。上記のように大量のデータを収集し、それらの中からパターンを見つけ出そうとするのです。実際に運用するシステムでどのような行動をとったかはもちろん、運用外のデータも学習することで「このトラブルに対しては一般的にどのような対応が取られるか」なども学習できます。パターンを習得することによって、最適な運用を機械的に導き出せるのです。
また、フィードバックを受け付けているため、判断した内容に誤りがあればそれを踏まえられます。例えば、データから導き出したパターンに誤りがあるならば、それを修正できるのです。データからのパターン習得だけではなく、人間からのフィードバックも組み合わせることで、より最善の運用を実現できるという特徴があります。
AIOpsを活用できるビジネスシーン
AIOpsはどのようなビジネスシーンで利用できるのか紹介します。
監視・異常検知
ITシステムの監視や異常検知において、AIOpsが幅広く活躍します。例えば、システムから提供される大量のイベントデータを分析し、問題が起きていないか判断するのです。AIを組み合わせることで、通常の動作パターンから逸脱しているものを見つけ出し、それに対してアクションを起こします。
今までの監視や異常検知は、自動的な判断に限界がありました。ある程度は事前にプログラミングしておかないと、問題のある行動を検知できなかったのです。しかし、AIには学習機能や分析機能が搭載されているため、今まで検知できていなかったものでも、発見できる可能性があります。
問題の分析や原因特定
異常検知だけではなく、問題の分析や原因の特定にも活用される可能性があります。例えば、AIが収集したデータを元にシステム障害の原因を分析し、それを示すことでスムーズに根本的な解決ができるのです。
AIOpsをこのように活用するためには、ログやメトリクスをAIに連携しなければなりません。提供する情報が少ないと、問題の分析や原因の特定が遅くなってしまいます。ただ、適切に運用できれば、人間よりも短時間かつ正確に問題解決できるため、AIOpsが積極的に導入されるのです。
大量のシステム運用
大規模なITインフラの運用においては、AIOpsを採用することで効率化できる可能性があります。AIを活用して複数のシステムやアプリケーションを自動的に運用することで、システムの監視やパフォーマンスの最適化などが人間の手から離れるのです。
運用の業務は、地道なものが多く、人手が必要となる場合があります。システムの数が増えてくると、対応する人材も多く必要となってしまうのです。しかし、AIOpsを軸とした運用ならば、大量のシステム運用でも負担を軽減できます。
AIOpsによって実現される4つのメリット
AIOpsは多くのメリットをもたらしますが、それらの中でも注目すべきは以下の4つです。
運用コストの削減
システムの運用をAIに任せることで、コストの削減に繋げられることがメリットです。従来のシステム運用では、複雑なシステムと様々なアラートを処理するために、多くの人間や時間が必要とされました。しかし、AIOpsを導入することでこれらの作業が自動化されたり効率的に実施されたりすると、コストを大きく下げられるのです。
また、AIOpsは大量のデータから予測や分析ができるため、今後発生しそうな問題を特定することが可能です。事前に障害の発生を減らすことができれば、これに伴うコストの発生も抑えられるでしょう。例えば、データセンターにあるハードウェアの故障を事前に予想できれば、大規模な障害が起きる前にメンテナンスできます。
IT運用の効率化
複雑なシステム環境において、運用効率ができることは大きなメリットです。例えば、大量のログデータやアラートは人間の手では処理できませんが、AIに任せることで短時間で処理できます。また、ユーザー部門からの問い合わせなども、AIが受け付けたり分類したりすることで、少ないリソースでも効率的かつ迅速に対応できるようになるのです。
また、AIOpsはシステムのパフォーマンスデータをリアルタイムで分析し、その結果をアウトプットできます。そのため、アプリケーションのリソース状況から、問題が発生しないか予測して、先手を打てるのです。これにより、システムの障害を減らすなど無駄な運用作業を減らせます。また、ユーザーなど利用者の満足度向上にも繋がるでしょう。
短時間での問題解決
複雑なシステムでも、AIは大量にデータを処理できるため、短時間での問題解決が可能です。データから問題の原因をいち早く特定し、さらなる問題が発生する前に手を打てるようになります。システムのダウンタイムを最小限に抑えられることは、提供者側も利用者側もメリットのあることです。
例えば、非常に高い可用性が求められるシステムにおいて、AIOpsで問題を検知できると、素早く対処ができます。インフラをメンテナンスしたり、万が一に備えてバックアップをホットスタンバイさせるのです。問題が顕在化する前に手を打てば、問題解決までの時間をゼロやほぼゼロにできるでしょう。
AIOpsを導入する際のポイント
AIOpsを導入する際にはいくつものポイントがあるため、それらについて順番に解説します。
スモールスタートを意識する
可能な限り、スモールスタートを意識するようにしましょう。大規模なAIOpsをいきなり導入するのではなく、簡単なシステム運用を一部だけAIOpsに置き換えるのです。部分的にAIOpsを導入するだけでも、どのような効果を得られるか十分に評価できます。
もし、スモールスタートで十分な効果を実感できるならば、そこから他のシステムへ横展開すると良いでしょう。実体験に基づいてAIOpsを展開することによって、他のシステム担当者からも導入に向けた理解を得やすくなります。また、意思決定者も前向きに投資してくれるでしょう。
逆に、一気にAIOpsを推し進めて失敗すると、後戻りができなくなってしまいます。お金と時間が無駄になってしまうことが考えられるため、可能な限り小さい範囲でスモールスタートを意識すべきです。
できるだけ多くのデータを学習させる
AIにパターンを見つけ出させるため、できるだけ多くのデータを学習させるべきです。一般的に、学習するデータの内容が増えれば増えるほど、AIは様々な状況へと対応できるようになります。AIOpsの良さを最大限に引き出すならば、幅広い運用データをAIに提供しましょう。
学習させるデータは、これから運用するシステムのものに限らず、他のシステムも含まれます。例えば、リプレース前の運用に関するデータがあるならば、それをAIOpsに学習させると良いでしょう。今までにどのようなトラブルが発生し、どのように対処したかをパターン化することで、問題を検知しやすくなります。
ただ、あまりに異なるシステムのデータは、学習のノイズとなりかねません。どの程度が許容範囲かは一概に述べられないものの、少し意識しておくと良いでしょう。
AIOpsの採用における課題
AIOpsの採用は魅力的なことではありますが、現時点ではいくつかの課題が存在します。どのような課題があるのか、以下のとおり認識していきましょう。
技術面の難易度
新しい考え方ということもあり、技術面で難易度の高さが課題になります。これまでの運用だけではなく、自動化やAIの技術も習得しなければなりません。理解すべき内容が多く、対応できるエンジニアも少ないため、総じて課題になるでしょう。
特に、AIにデータを学習させる部分は、専門的な技術が必要です。外部にアウトソーシングする選択肢もあるものの、難易度が高いことには変わりありません。学習させるデータの選定、学習アルゴリズムの決定など、多くの知識が求められます。
組織構造
AIOpsを成功させるには、データ連携を実施しやすい組織体制が必要です。しかし、多くの企業はIT面でこのようなデータ連携を前提に組織されておらず、この点が課題になっています。データや情報の連携ができなければ「問題に対してビジネス部門がどのように解決したか」を把握できません。
データが連携されないと、AIOpsは少ないデータから学習するしかなくなります。しかし、AIは学習する内容が少ないと、それだけ精度の低いものになってしまうのです。運用の自動化や正確さの向上というAIOpsの魅力を失うことになりかねないため、早期に改善しなければなりません。
法規制やコンプライアンス
現状、AIは法規制やコンプライアンスへ十分には対応できていないと考えられます。これはAIOpsに限らず、AIを活用したサービス全般に言えることです。
そのような状況にあることから、AIOpsは何かしら大きな間違いを犯すかもしれません。例えば、誤った判断によって、情報が流出してしまうことが考えられます。また、文言を修正した際に、差別的な表現が含まれてしまうかもしれません。
これらは一例ですが、AIによって運用を自動化しても、何かしら大きな過ちが起きる可能性はあります。軽微なものならば、AIに指摘して学習させれば良いですが、内容によっては取り返しのつかないことになってしまうのです。
まとめ
AIを活用して、システムの運用を効率化したり自動化したりするAIOpsについて解説しました。今までのように、運用を自動化するだけではなく、AIがデータを分析してパターンを見つけるなどが特徴です。人間では処理できないような大量のデータも、AIは素早く処理して分析してくれます。
使いこなせると非常に有用なものですが、事前にデータを学習させるなどの準備が必要です。また、採用するにあたっては、運用の担当者にある程度の技術が求められます。今後、AIOpsが広がるにつれて採用のハードルは下がると考えられますが、現時点では一定の難しさがあることも認識しましょう。