昨今話題の生成AI。文章、画像、音声など、さまざまな形式のデータを自動で生成することができる技術のことを指します。それぞれの生成AIに搭載されている「モデル」の違いにより、文章、画像、動画、音声と得意分野が異なり、業務で活用するにはそれぞれの生成AIで何ができるのか把握をすることが重要です。
本記事では、生成AIの定義から代表的な4つの分類、具体的なサービス・ツールの詳細までご紹介します。さらに、日々アップデートが繰り返される生成AIについて、トップランナーであるOpenAI、Google、Appleの最新の発表内容も合わせてご紹介します。
「yaritori」は、最新AI「GPT-4o」を活用した機能を備えた国内初のメールサービスです。メール文の自動生成・返信、翻訳・変換、メールの自動仕分け機能などさまざまなAI機能がつかえます。
サービス概要・導入事例などがわかる資料を無料でお送りしますので、お気軽に資料を請求してください。
生成AIとは?
生成AI(Generative AI)とは、文章、画像、音声など、さまざまな形式のデータを生成することができる技術のことを指します。これまでのAIは、決められた仕事を自動化してくれるものが大半でしたが、生成AIは膨大なデータのパターンや関係を学習し、新しいコンテンツを生成してくれることが特徴です。
生成AIが学習し、人間からの指示(プロンプト)に新しいコンテンツを生成する一連の流れは、「AIモデル」と呼ばれるシステムによりおこなわれます。
AIモデルにはさまざまな種類が存在し、できることや得意なことが異なります。代表的なAIモデルとしては、非常に高い言語処理能力をもち、さまざまな文章生成AIに採用されている「GPT」や、画像データの特徴を抽出し、新たな画像を生成できる「VAE」などがあります。
なお、「GPT」はアメリカのスタートアップOpenAI社が開発・運営しているAIモデルで、昨今、ビジネスの世界で大きく話題になっているAIチャットサービス「ChatGPT」に組み込まれています。
生成AI代表的な4つの分類
現在、毎日のように生成AIを活用した新しいサービスやツールがリリースされています。今回は代表的な4種類の生成AIと、それらの生成AIを活用した具体的なサービス・ツールについてご紹介します。
文章生成AI
文章生成AIは、人間が書いたかのような文章を自動的に生成してくれるAIです。ユーザーが「〜の記事を要約して」「〜に関する記事をつくって」などのプロンプトを入力することで、テーマに沿った文章を自動的に生成してくれます。
⚫️ChatGPT
アメリカのスタートアップOpenAI社が開発・提供。会話形式で文章をつくってもらえることが特徴で、対話の流れや文脈を理解し、より自然で人間らしい応答を生成してもらえます。最新モデル「GPT-4o」では、テキスト、音声、画像、動画など複数のデータを同時に入力できるようになり、そのうえで、テキストだけでなく、音声や画像といった幅広い形式のデータを生成できるようになりました。
⚫️Microsoft Copilot
Microsoft社が開発・提供。Windowsに実装されており、文章の生成だけでなく、タスクの実行や情報の検索を代わりに実行してもらうことも可能です。
※ChatGPTとMicrosoft Copilotの違いについては、「ChatGPT と Microsoft Copilot: 違いは何ですか?」をご覧ください。
⚫️Gemini
Google社が開発・提供している生成AIの一つ。「マルチモーダル」と呼ばれる、テキスト、音声、画像、動画など、2種類以上のデータを組み合わせて操作できることが特徴です。画像からテキストを生成したり、テキストから音声を生成したりと、異なるデータ同士を変換することができます。
Googleは他にも、動画生成AIサービス「Veo」や画像生成AIサービス「Imagen 3」など、複数領域で別々のサービスを発表しています。
画像生成AI
画像生成AIは、テキストで指示するだけでオリジナルの画像を生成してくれるAIです。ツールによっては「写真風」「イラスト風」などトーンまで合わせて指定することもできます。
実際に画像生成サービス「Stable Diffusion」を活用して生成した画像。入力テキスト欄に「シュナウザーは渡り鳥と一緒に楽しそうに空を飛んでいます」と入力し、画像テーマは「写真」に設定。
⚫️Stable Diffusion
イギリスのスタートアップStability AI社が開発。テキストから画像の生成が可能で、入力したキーワードを元にオリジナル画像を自動で作成してもらえます。オープンソースとして無料で公開されたことで話題になりました。実際に利用するにはシステムへの組み込みが必要で、Web上で公開されているサービス「Dream Studio」にてトライアルが可能です。
Stability AI社は2022年10月、10億ドルの評価額で1億100万ドルの資金調達を発表。2020年の会社設立から、2年弱でユニコーン企業へと成長したことでも話題になりました。2024年6月には、最新バージョン「Stable Diffusion 3 Medium(SD3M)」が公開され、プロンプトの理解力向上や、生成画像の品質アップが実装されました。
⚫️Imagen3
Google社が開発・提供している生成AIの一つ。2024年5月に発表された最新ツールで、テキストからの画像生成を高精度で実現できます。2024年6月時点では、まだ一般公開されておらず、一つ前のバージョンにあたる「Imagen2」は、最新AIツールが利用できるプラットフォーム「AI Test Kitchen」よりトライアル可能です。
動画生成AI
動画生成AIは、テキストで指示するだけでオリジナルの動画を生成してくれるAIです。自身の画像や動画をもとにしたアバターを作成する、写真を動画に変換するなどさまざまなバリエーションが開発されています。
⚫️Synthesia
イギリスのスタートアップSynthesia社が開発・提供。自身のアバターに、入力したテキストを話させることが可能です。文章がメインの社内研修資料を動画化し、よりわかりやすい教材作成が可能です。世界的経済誌Forbesが発表した、注目すべきAI企業50社「AI 50」のうちの一社であり、世界的に注目されている。
⚫️InVideo
インドのスタートアップWhitesheep technology社が開発・提供。入力したキーワードを元にオリジナル動画を作成してもらえます。5000以上のテンプレートが用意されていたり、iPhone、Android用のアプリが提供されていたりと、使いやすさが特徴です。世界中の多くの人が利用しており、その数は190ヶ国、2500万ユーザー(2024年6月時点)にものぼります。
音声生成AI
音声生成AIは、入力したテキストをもとにオリジナルの音声を生成してくれるAIです。自身の声を入力することで、テキストの内容を自分の声で読み上げてもらえる技術も開発されています。自動応答システムの品質向上や外国語の翻訳に活用されています。
⚫️CoeFont
日本のスタートアップCoeFont社が開発・提供。自分の声を50文録音することで、オリジナルのボイスbotを作成できます。テキストを入力するだけで、自分が話しているかのような音声を生成可能です。著名人の音声が生成できることでも話題になっており、「おしゃべりひろゆきメーカー」「おしゃべりDaiGoメーカー」などのサービスも提供されています。
⚫️Speechify AI Voice Over
アメリカのスタートアップSpeechify社が開発・提供。入力したテキストをリアルな音声に変換してくれます。声色は性別や年代から選ぶことが可能で、日本語にも対応しています。The Wall Street Journal、Forbes、TIMEなど、多くのメディアで取り上げられており、注目されているサービスです。
生成AIに関する、直近の大きな動き
日々アップデートが繰り返される生成AIについて、トップランナーであるOpenAI、Google、Appleの最新の発表内容をご紹介します。
Apple社が、iPhoneやMacの標準搭載アプリで、生成AIを活用できるシステム「Apple Intelligence」をリリース
画像出典:プレスリリース | iPhone、iPad、Macの中心にパワフルな生成モデルを据えるパーソナルインテリジェンスシステム、Apple Intelligenceが登場 | Apple
Apple社は、iPhone、iPad、Macのためのパーソナルインテリジェンスシステム「Apple Intelligence」を発表しました。これにより、Apple製品に標準搭載されているさまざまなアプリケーションにて、新しい機能が利用できるようになります。
- メール、メモ、Pagesなどテキスト入力ツールに「書き直し」「校正」「要約」などの機能が追加
- メールにて、受信ボックスの先頭に優先度の高いメッセージが表示されるようになる
- メモアプリと電話アプリでは、ユーザーは音声の録音、書き起こし、要約ができるようになる
Apple Intelligenceは、iOS 18、iPadOS 18、macOS Sequoiaに搭載される予定です。
Google社が、複数のサービス活用を横断的にサポートしてくれる最新AIモデル「Gemini 1.5 Pro」をリリース
画像出典:Blog | Gemini が新たな領域へ : より高速なモデル、ロング コンテキスト、AI エージェント | Google
Google社は、開発・提供している生成AI「Gemini 1.5 Pro」の大幅な改善を発表しました。
とくに目玉となったのは、Google社が提供する、検索エンジン、Photo、YouTube、Gmailなどの幅広いサービスの活用を横断的にサポートしてくれる「エージェント機能」の搭載です。
動画の冒頭では、自車のナンバーを「Gemini」に聞く例が紹介されています。GeminiがGoogle Photoのデータを分析し、頻繁に写っている車のナンバーを特定し、教えてくれています。
他にも、細かい部分含めて、複数のアップデートも発表されています。
- コンテキスト長(AIに入力できるデータの長さ)の大幅な拡大・コスト削減
- マルチモーダルの品質向上
- 軽量・高速版モデル「Gemini 1.5 Flush」をリリース
OpenAI社が、文章に限らず複数データの入出力が可能になる最新AIモデル「GPT-4o」をリリース
画像出典:Research | Hello GPT-4o | OpenAI
多くの生成AIの開発・運営をおこなうOpenAI社は、文章生成AI「ChatGPT」の最新モデル「GPT-4o」のリリースを発表しました。
これまでのChatGPTでは、プロンプト(文章)を入力することで、指定した文章を生成してもらうことが可能でした。GPT-4oが搭載されることでテキスト、音声、画像、動画など複数のデータを同時に入力できるようになり、そのうえで、テキストだけでなく、音声や画像といった幅広い形式のデータを生成できるようになります。
公開されたデモ動画では、ユーザーがスマホのカメラを通じて周りの風景を入力しながらAIと会話している様子が紹介されています。
他にも、細かい部分含めて、複数のアップデートも発表されています。
- 音声応答がより高速に、自然になった
- APIのスピードが大幅に改善され、とくに前モデル「GPT-4 Turbo」と比べると約2倍高速になった
- 日本語を含む、英語以外のテキストでのパフォーマンスが向上した
GPT-4oによる日本語生成の質やスピードが向上したことで、同モデルが組み込まれているメール共有システム「yaritori」の機能も大幅に向上しています。特に「メール文の自動生成」機能のパフォーマンスが向上しており、これまでよりもさらに違和感のない返信文を、スピーディーに生成できるようになりました。使用イメージについては、下記の動画をご覧ください。
生成AIでビジネスメールを自動返信したいなら「yaritori」
「yaritori」は、「info@」や「support@」といった代表アドレスを複数人で共有・管理できる、メール共有・問い合わせ管理システムです。
yaritoriは、最新AI「GPT-4o」を活用した、国内初のメール生成機能「yaritori AI」を搭載しています。①メール文の自動生成、②丁寧な文章への変換、③日本語から英語への翻訳の3つの機能が利用可能です。
独自プロンプトにより、新入社員やITに疎い人でも精度の高いメール文を生成できるのが特徴です。
また、メールサービスにAIが直接組み込まれているため、 メール入力文にコピー&ペーストする手間がなくなります。
さらにyaritoriでは、商談の議事録を自動で要約・自動でお礼メールを作成する機能や、問い合わせメールへの返信文を自動作成し送信ボタンを押すだけで返信できる機能などを構想しています。
まとめ|生成AIの基礎知識と最新情報をご紹介
いかがだったでしょうか?
この記事では、「生成AI」の基礎知識と最新情報をご紹介についてご紹介させていただきました。
Onebox株式会社は、生成AIを活用した「メール文の自動生成」機能を搭載したメール共有システム「yaritori」を提供しています。OpenAI社が提供する、文章生成AI「ChatGPT」の最新モデル「GPT-4o」が組み込まれており、違和感のないメール文を、スピーディーに生成可能です。サービスサイトよりお気軽にお申し込みください。
生成AIを活用したメールサービスについて、詳しく知りたい方はぜひこちらもご参照ください。
生成AIが自動でビジネスメールを返信!?最新AIで変わる業務
生成AIの活用事例について知りたい方は是非以下もご確認ください。
生成AIの先進活用事例|日清・JR東海など大企業で進む業務プロセスの効率化と新サービス開発
※本サイトに掲載されている情報は、Onebox株式会社(以下「当社」といいます)または協力会社が独自に調査したものであり、当社はその内容の正確性や完全性を保証するものではありません。
記事の執筆者:メール共有システム「yaritori」メディア編集部営業・CSなど対外的なメール対応が多い方向けにメール対応を効率化するポイントなどの情報を発信します。複数人でのメール対応や、社内メンバーとのコミュニケーションのお悩み解決をします。 |