記事を開いていただきありがとうございます。よしハムコロリと申します。熊本で25年以上ITエンジニアとして従事しています。
最近は何でも「AI、AI」と言われるようになってきました。日々の進化が目まぐるしく、できることが増えてきて、これまで私たちが行ってきた仕事もAIが奪ってしまうかもと言われたりします。
しかし、AI関連の用語をよく耳にするものの、あまり意味が分かっていないものが多いと思いますので、AI関連の用語を分かりやすく解説したいと思います。専門用語をなるべく使わずに、それぞれの役割や関係性を説明していきます。何より私自身の勉強も兼ねて書いている感が強いです。
本記事にはアフィリエイト広告を掲載しています。是非ご利用ください。
そもそもAIとは?
AI(Artificial Intelligence)は、日本語で「人工知能」と訳されます。
人間のように考えたり、学習したり、問題を解決したりする能力をコンピューターに持たせる為の技術や研究分野のことを指します。
AIは、特定のタスクをこなすためにプログラミングされた従来のコンピューターとは異なり、与えられたデータから自分でパターンやルールを見つけ出し、推論や予測を行います。
AIの身近な例
私たちの周りには、既に多くのAIが活用されています。
- スマートフォンの音声アシスタント(SiriやGoogleアシスタント): 話しかけた内容を理解し、質問に答えたり、タスクを実行したりします。
- レコメンド機能: NetflixやYouTubeが、過去の視聴履歴から「あなたにおすすめ」の作品を提案します。
- 迷惑メールフィルター: メールを自動的に分類し、迷惑メールかどうかを判断します。
- 自動運転: 周囲の状況を認識し、自分で最適な走行ルートや速度を判断します。
AIの3つの主要な能力
AIには様々な種類がありますが、主な能力として以下の3つが挙げられます。
- 認識: 音声や画像、文字など、様々なデータを識別する能力。
- 推論・判断: 蓄積したデータや情報から、論理的な結論を導き出す能力。
- 生成: これまでの学習データに基づいて、新しい文章や画像などを創り出す能力。
AI関連用語集
生成AI (Generative AI)
生成AIは、テキスト、画像、音楽、動画など、新しいコンテンツを創り出すことができるAIのことです。これまでのAIが、データを分析したり分類したりするのに特化していたのに対し、生成AIは学習したデータから独自のパターンやルールを学び、それらを使って新しいものを「生み出す」能力を持っています。
例:
- ChatGPTのような、自然な文章を書くAI
- MidjourneyやStable Diffusionのように、言葉の指示から画像を生成するAI
- 作曲や新しいデザインを提案するAI
マルチモーダルAI (Multimodal AI)
マルチモーダルAIは、複数の種類のデータ(「モダリティ」)を同時に扱って理解・生成できるAIです。例えば、テキストと画像、音声と動画など、異なる形式の情報を組み合わせて処理します。人間の五感のように、複数の情報を組み合わせて物事を理解する能力に近いと言えます。
例:
- 画像に写っているものを説明する文章を生成するAI
- 話しかけられた内容を理解し、その場で画像を生成するAI
AIエージェント (AI Agent)
AIエージェントは、特定の目標を達成するために自分で判断し行動するAIです。単に指示されたタスクをこなすだけでなく、自分で計画を立て、環境を認識し、状況に応じて判断を変えながら、目標に向かってタスクを遂行します。プロンプト(次項に説明を記載)への応答を返すだけでなく、例えばウェブサイトを検索したり、複数のツールを組み合わせて使用したりします。
例:
- 複雑な課題解決のために、必要な情報を自律的に検索・整理してレポートを作成するAI
- オンラインでの予約やショッピングを自動で行うAI
プロンプト (Prompt)
プロンプトは、AIに対して特定のタスクを実行させるための「指示文」のことです。AIとの対話における入力(インプット)に当たります。この指示文を工夫することで、AIの生成する結果は大きく変わります。
例:
- 「桜の花と富士山が描かれた浮世絵風のイラストを生成して」
- 「この文章を要約して、5つの箇条書きでまとめてください」
ハルシネーション (Hallucination)
ハルシネーションは、日本語では「もっともらしい嘘」、「幻覚」という意味に該当するようです。AIが事実に基づかない、でたらめな情報を生成してしまう現象を指します。まるでAIが「幻覚」を見ているかのように、自信満々に嘘をついたり、間違った情報を提示したりします。これは、AIが学習したデータに存在しない、あるいは関連性の低い情報を無理に結びつけようとすることで起こります。何だか怖いですね…
ファインチューニング (Fine-tuning)
ファインチューニングは、すでに学習済みのAIモデルを、特定の目的のために追加で学習させることです。例えば、一般的な知識を学んだ学生に、特定の専門分野(例えば法律や医学)を深く教え込むようなものです。これにより、特定のタスクやドメインに特化した、より精度の高いAIモデルを作成できます。
ニューラルネットワーク (Neural Network)
ニューラルネットワークは、人間の脳の神経細胞(ニューロン)の仕組みを模倣した、AIの基本的な構造です。複数の層(レイヤー)で構成されており、各層が情報を処理して次の層に伝達します。情報が層を通過するたびに、より複雑なパターンや特徴を認識できるようになります。こういうのを考えられる人ってすごい…
トランスフォーマー (Transformer)
トランスフォーマーは、特に自然言語処理(NLP:Natural Language Processing。人間が普段使っている言葉(自然言語)をコンピューターが理解・分析・生成できるようにするための技術)の分野で大きな進歩をもたらした、ニューラルネットワークの一種です。このモデルの最大の特徴は「自己注意機構(Attention Mechanism)」という仕組みです。これにより、文章中の単語同士の関連性を効率的に把握し、文脈全体を理解できるようになりました。多くの生成AI、特にChatGPTなどの大規模言語モデル(LLM:Large Language Models。自然言語処理(NLP)を、より大規模なデータセットと計算能力を使って実現した非常に高性能なAIモデルのこと)の基盤となっています。
さいごに
最後まで読んでいただきありがとうございました。AI関連用語について少しでも理解が深まったらうれしいです。余計分からなくなったらすみません…。これらの用語は密接に関係しており、それぞれが現代のAI技術を支える重要な要素です。感想や相談を問い合わせフォームやコメント欄で受け付けていますので、お気軽にどうぞ。最後に、寄付も募っておりますので、もし共感いただけましたらよろしくお願いいたします。
コメント