現在、多くのIT系の人たちがこう思っていますよね。
「生成AI系のツール多すぎ!」
ええ。僕も思っています。
Twitter等で情報を追っていると、もう毎日のように「新しい◯◯がヤバい!」って驚いてる人がいますよね。
で。結局自分は何からどう使えばいいのか分からない。
今回は、そんな人..というか僕自身のために、いろんな生成AIツールや情報についてまとめる記事を作ってみました。
・各目的やジャンルでのおすすめAIツール
・どんな特徴や違いがあるか
・有料プランとその内容
などについて、随時更新していきます。もしおすすめや最新情報、提言などあれば、Twitterなどで教えてください。
さて。さっそくまとめていきましょう。
もくじ
オールラウンダー系AI
まずは(プラグインなども利用すると)割と何でもできちゃう、というオールラウンダー系AIツールを紹介。
ChatGPT
まずは、言わずと知れたChat GPT。生成AI系ツールの中では一番有名ですよね。
文章生成/チャット系AI
ブログなどを書いたり、文章の校正したりする人は、文章生成系のAIツールがおすすめ。
Claude
Chat GPTも文章生成は得意ですが、2024年現在、Claude(クロード)の方がさらに文章作成が上手なようです。Chat GPTと同じく、けっこうオールラウンダーでもあります。
Notebook LM
これもかなり好評。GoogleのNotebook LM。
アップロードされたPDFやDocsの情報をもとに質問に答えてくれるチャットAIです。
例えば、とある仕事の契約書などを読み込ませたあとで、「この仕事の納期は何日まで?」と質問すれば「◯年◯月◯日です」と答えてくれたりするわけです。
社会人はもちろん、学生さんの場合も、テスト範囲のレジュメや資料を読み込ませてテスト対策用AI先生を作ってしまえたり、いろんな使い方ができますね!
Gemini
Gemini(ジェミニ)は、グーグルが運営するチャット系AI。CMとかよくやってますね。
大手ならではの安心感と使いやすさがあるので、AI初心者はここから入ってもいいかもしれません。
Web検索系AI
Perplexity
IT系ワーカーの間でかなり好評なのが、Web検索系AIの「Perplexity(パープレキシティ)」。言いにくいw
要は、「グーグル検索のAI版」みたいなアレです。
グーグルとの違いは
・文章や口語で検索をしてもいい感じの結果が出る
・Web上のページだけでなく、そのまとめもAIで回答してくれる
という感じです。「会話みたいに検索できるツール」って感じですね。
Genspark AI
Genspark AIも、新しく出てきたAI検索ツールです。
以下のような機能を提供しています。
- AIを使った高度な検索機能
- 検索結果をまとめた「Sparkpage」の生成
- 質問に応じたカスタム回答の作成
- 内蔵AIアシスタントによる追加情報の提供
- 複数の情報源からデータを統合・整理
これらの機能により、ユーザーは効率的に情報を収集・分析できます。
画像生成系AI
多くの人が使ってみたくて、またわかりやすいのは「画像生成系」のAIツールでしょう。
こんなのが簡単に作れます。↓
Midjourney
Midjourneyは、画像生成系AIの最大手のひとつ。
一番最初に話題になって有名になったツールじゃないでしょうか?
バージョンアップを重ねて、どんどんリアルな画像が作成できるようになっています。
Midjourneyのおすすめプロンプト集
Midjourneyで、「こういうテイストで作りたい」というときに、おすすめのプロンプトのまとめ記事を見つけました。
【保存版】Midjourney おすすめプロンプト100選+chatGPTで自動化するプロンプト
「CIVIT AI」でも、いろんな画像とそれに使用したプロンプトが公開されています。
Civitai: The Home of Open-Source Generative AI
Stable Diffusion
同じく最大手のStable Diffusion(ステイブル・ディフュージョン)。
こちらは、日本語のサイトもありますね!
画像生成AI Stable Diffusion — Stability AI Japan
ImageFX
2024年8月末にきて、画像生成の大本命が出てきました。
Googleの運営する、ImageFXです。
実際に触ってみると、登録も使い方もとにかく簡単。画像生成のレベルが高く、UIも優れています。
弱点らしい弱点は見当たらないのですが、しいて言うなら
・複雑なプロンプトを打ち込んでもそこまで生成レベルに関係がない
・非現実的な画像生成(3センチの子犬を描いて!とか)に弱いかも?
Googleアカウントがあればすぐに使い始められるので、生成AI初心者が最初に使うならこれ一択でしょう。
参考記事:Googleの画像生成AI「Imagen3」(ImageFX)の使用経験
Canva
画像編集、プレゼン資料作成ツールとして、Photoshop/Illustrator/PowerPointキラーとして有名なCanvaですが、最近、けっこうAI機能を搭載しています。
主に、画像生成やプレゼン資料用AIがあり、専用ツール(StableDiffusionやGammnaなど)と比べると生成の精度は見劣りするのですが、
「すでにCanva使ってるからちょっとやってみたいな!」というAI初心者の方にはおすすめできます。
ぜひ、Canvaをすでに使っている方は、AI機能も触ってみてください。
Luma AI/Dream Machine(画像から3Dモデル作成)
一枚の画像から3Dモデルを作成できるのがLuma AIです。
3Dモデルを動かすことも可能で、実質動画生成AIとしても使えます。
アプリ版もあるので、スマホでも手軽に試せます。
チャットAIツールと画像生成ツールなどの組み合わせ
①Perplexityで「日本の平成ギャル」など、人格情報を抽出する
②人格情報をまるごとClaudeに入力して「Midjourney用画像生成のプロンプトを作成して」
③Claudeが生成したプロンプトをMidjourneyで画像出力&アップスケール
④平成ギャルが生成される
⑤Lumaで動かす
などの組み合わせでの使い方も可能です。
Render Net(画像のリアル化など)
RenderNetは、キャラクターor人物画像作製系AIです。
キャラ生成ももちろん便利なんですが、特筆すべきは、「AIで作った画像をリアル化」させられること。
「AIっぽい」人物画像ってありますよね?なんかテカテカしてるというか。
それを、いい感じにリアルに近づけてくれて、本物の人物写真みたいにしてくれる機能が好評です。
RenderNet AI: Create Character-Driven Images & Videos
Reshot AI(画像の表情を調整)
せっかくいい感じに生成できた人物画像でも、「表情だけが惜しい!」ってこと、よくあります。
そんなときに役に立つのが、「Reshot AI」です。
目、口、眉などを細かく調整して、画像の表情を変化させることができます。
実写系画像はもちろん、2次元の人物でもいけるみたいです。
Magnific(画像の高画質化)
Magnific(マグにフィック)は、主に画像の高解像度化を行えるAIツールです。
Midjourneyなどで生成した画像は、500*500pxとかでけっこう小さいことも多いんですよね。
スマホ用ならともかく、大画面や紙媒体用の画像としては心もとないですよね。
Magnificと組み合わせて高画質化すれば、AI画像の用途もさらに広くなります。
Magnific AI — The magic image Upscaler & Enhancer
QRBTF(イラストQRコード生成)
ちょっとおもしろいのが、イラストQRコードを作成できる「QRBTF」。
discordアカウントでログインをして、URLとプロンプトを打ち込んだら、すぐにQRコードイラストが生成されます。
使ってみた内容はこちらでもレビューしました。↓
動画生成系AI
Runway Gen3
動画生成AIでよく使われているのが、RunwayのGen3です。画像やプロンプトから短い動画を生成可能。
これまでの動画生成AIよりもずば抜けて素晴らしいのが
- 眼球がちゃんと動く
- まわりのオブジェクト(手)がちゃんと動く
- アップにしても顔が崩れない
などの点。
映像制作のゲームチェンジャーともっぱらの噂です。
Runway Gen3おすすめプロンプト
おすすめのプロンプトは
She’s smiling as she talks.(彼女は微笑みながら話している)
→厳しい表情の画像でも、これでめっちゃニコニコしながら話してる表情になります。
他にも↓
Camcorder
Image To Videoで「Camcorder」のみでも、カメラに向かって話しているような構図で生成してくれます。
KLING
Gen3のライバルとしてよく挙げられるのが、中国の企業の動画生成ツール「KLING」です。
僕の周りの声では、Gen3より生成レベルが高いと言う人も多く、こちらに課金している人が多いですね!
Nolang
動画作成AIなら「NoLang」もすごいです。
動画のテーマを文章で入れたら、10秒前後で1本の動画を作成してくれます。
「Webサイトの内容」をもとに生成も出来るので、要約動画も一瞬で作成できたりします。
生成できる動画は最大3分までとまだまだ小さな制約こそありますが、十分な性能を持つツールです。
vrew
僕もよく使っているのが、動画字幕生成のvrew(ブリュー)。
動画をアップして言語を選択してくれると、字幕を自動生成してくれます。
どれくらいの長さの文章でカットするかなども指定できるし、字幕の精度もどんどん上がっています。
また、簡単な動画もプロンプトから作成可能で、字幕生成だけでなく動画生成AIでもあります。
テキストエディターのように簡単で素早AI動画編集 | Vrew
CapCut(字幕生成)
スマホでの動画編集ツールとして有名なCapCutですが、自動での字幕生成機能も好評です。
動画のAI自動字幕生成は、vrewとCapCutの2強みたいですね!
OpusClip(切り抜き動画)
近年、盛り上がりを見せている切り抜き動画。
有名配信者やVtuberなどの配信の一部を、いろんなテーマで切り取って上げる動画です。
そんな切り抜き動画を作成するのに便利なツールが「OpusClip」。
動画をアップすると、いい感じの切り抜き動画を生成してくれると。
内容の精度は気になるところではありますが、確実にニーズのあるツールですね!
Domo AI(アニメ動画)
最近ちょいちょい見るようになった、実写動画をアニメにした映像。
それを作れるのが「Domo AI」です。
日本アニメ風、PixerCGアニメ風、ピカソなどの有名アート風…などいろんなテイストに変換可能。
実写を元にした二次創作ができる他、
動画を出したいけど顔出しはしたくない…という人などにピッタリですね。
Lens go ai(ダンス動画)
tiktokなどでバズってる美女ダンス動画は「Lens Go」で作れます。
ダンス動画と、差し替えたいキャラクターなどの画像があれば生成可能。
PhotoDance(ダンス動画作成)
「PhotoDance」は、1枚の画像を元にキャラクターのダンス動画を作成してくれるサービス。アプリで使用可能です。
動画の生成には課金が必要(週1000円〜)ですが、LensGoと比較しても、ダンス動画の出来がよく、課金する価値はあります。
実際に、作ってみた動画です↓
「Photo Dance: AI顔写真アニメーター&動画作成
HeyGen(自分の動画を台本から作成)
「HeyGen」は、「自分の動画を台本から作れる」動画作成AIツールです。
事前に学習させた自分の動画から、音声と口の動きを同期してくれます。すげえ!
つまり、台本一つで何時間だろうと1回も噛まずにコンテンツ(Youtube動画やセミナー動画など)が作成できます。
撮影ってめんどくさいですもんね。これを使えば効率10倍どころの騒ぎじゃありません。
HeyGen – AI Video Creator Tool
Kn1ght(喋るアニメーション動画)
「解説系のショート動画とか作りたいけど、自分が顔出しはしたくないんだよな〜」という人も多いんじゃないかと思います。
そんな人におすすめなのが、「Kn1ght(ナイト)」です。
日本のスタートアップ企業が運営しているサービスです。
アニメみたいなかわいいアバターを選んだり作ったりしたあと、台本の文章を入力して、音声の種類を選べば、簡単に「喋るアニメーション」が作れちゃいます。
アニメーション動画作成のほか、zoom用アバターもアニメーションで利用できる機能が新しく出たみたいです。
アバター同士で会話や会議をする時代になっちゃいました。SF漫画みたいだ!
Akool(ディープフェイク動画作成)
ある動画の顔だけを、有名人の顔に差し替える…
そんな、昔ならSF映画でしか見られなかったことが一般人でもできるツールが「Akool」です。
いわゆる「ディープフェイク動画」ですね。
いろんな便利な使い方ができるでしょうが、くれぐれも悪いことに使われませぬよう。
音声&作曲系AI
動画を作ったら、ほしくなるのが音楽。作曲が簡単にできてしまうAIツールを紹介します。
Suno(作曲)
Suno(スノー)は、作曲系AIツールの最大手。僕もけっこう使います。
例えば、姪っ子の誕生日プレゼント用に「birthday song, k-pop(K-popっぽいバースデーソング)」と入力するだけで、めちゃそれっぽいのができます。
歌詞の入力も可能なので、自分で歌詞を書いてもよし。
Chat GPTなどに書かせてもよし。1分で作詞作曲ができちゃいます。
Voice Space(音声生成)
評判の良い(日本語での)音声生成AIは「Voice space」です。特長として
- テキスト読み上げ
- 自分の声ボイスチェンジ
- モデル作成
- 無料プランあり
- 月額3,000円で10万文字
- テレ東など利用企業あり
などなど。
もう実質、ほぼAIだけで自分の出ている動画やオンライン講座を作るのが可能になっていて、実践している人も多いですね。
Web制作/開発系AI
主に、エンジニアやWebデザイナー、コーダーにとって役立つ生成AIを紹介。
数が増えて、さらに細かく分類できそうなら、適宜分けて書いていきます。
Create(ウェブサイト制作)
Create(クリエイト)は、Webサイト作成系AI。
プロンプトのみでWebサイトが作れるAIツール。すげえ時代になったもんです。
「どんなプロンプトを入れたらいいの?」という人は、Claudeなどのチャットツールに「Webサイト作成用のプロンプト(orコード)を書いて」とお願いすればいいんです。
このように、複数のAIツールを組み合わせて使うことで、その可能性はさらに広まります。
まあしかし、「create」みたいな一般名詞をサービス名に使うのって(検索しにくいし)ちょっとどうかとは思いますよね。
Dify(アプリ開発)
Difyは、AIアプリケーション開発を簡素化するオープンソースプラットフォームです。
エンジニアの間でも好評みたいですね。
主な機能は以下の通り。
・ノーコードでAIチャットボットやアシスタントの作成
・独自のナレッジベースを活用したRAG(検索拡張生成)の実装
・プロンプトエンジニアリングのための直感的なインターフェース
・複雑なAIワークフローの構築
・外部ツールとの連携によるタスク自動化
Difyを使用することで、プログラミングスキルがなくても、高度なAIアプリケーションを短時間で開発・デプロイすることが可能です。
Dify-先進的なAIアプリケーションのためのイノベーションエンジン
超便利なDifyテンプレ集も見つけました。
Coze(チャットボット開発)
Chatbot開発ならCoze。数年前は何百万も予算をかけて作っていたチャットボットが、今や個人でほぼタダで作れちゃいます。
Coze: Next-Gen AI Chatbot Developing Platform
Cursor(コードエディタ)
次世代コードエディタ「Cursor」は、AI機能搭載のコードエディタです。
プログラマが、途中までコードを書くと「こんなん書こうと思ってる?」というふうに、コードの提案や補完をしてくれます。
v0(UI生成)
v0(ブイゼロ)は、Vercelが提供するUI生成AIサービスです。
ユーザーが自然言語で指示を出すだけで、UIデザインを生成することができます
まだβ版ですが、すでに他開発系ツールを超えているのでは?と話題になっています。
・最新のNext.js, React, ウェブ検索に対応
・動的なウェブページ作成が容易に
・アニメーションなども簡単に実装可能
などの特長があります。
事務作業系AI
なんやかんや、AIにやってほしいのは退屈な単純作業ですよね。
スライド作成や議事録作成など、事務作業系AIツールを紹介します。
Gamma(スライド制作)
Gammaは、スライド作成系AI。
スライドのクオリティは少しずつ上っていってる感じですが、「明日朝イチのプレゼンに間に合わせたい!」というときは、徹夜をせずぜひAIを使ってみましょう。
tl;dv(zoom会議要約、議事録作成)
tl;dvは、zoomなどのオンラインミーティングの内容を録音、書き起こし、要約など行ってくれるツールです。
こういうのを見てると、簡単なアルバイトやインターンくらいの仕事は、もうAIにさせてしまった方が早いし安上がり、という時代になってますね!
tl;dv.io|Zoom 、Google Meet & MS TeamsのためのAIミーティング
Notta(文字起こし、zoom会議要約、議事録作成)
Notta(ノッタ)は、日本の企業が運営する、自動文字起こし/要約AIサービスです。
高精度の音声認識とAI要約機能を使って、1時間の音声をわずか5分で文字起こし・要約できます。
多くのAIツールが海外産なのに対して、やっぱり日本企業が運営するサービスだと、わかりやすいし、安心だし、(日本人のニーズに合わせてたりして)かゆいところに手が届くサービスであることが多いですよね。
僕も、以前使ってみてレビュー記事を書いています。
Zoom会議の議事録も作れる!AI自動文字起こしソフトウェア「Notta(ノッタ)」を使ってみた
使ってみた結果、強くおすすめできるので、ぜひ使ってみてください。
Mapify(マインドマップ作成)
Mapify(マッピファイ)は、マインドマップ作成系AIツール。
Youtube動画やブログ記事などのリンクを入力すると、その内容をまとめたマインドマップを作成してくれます。
長い動画や記事の内容を早く理解したい人にオススメのツールですね!
Napkin AI(図解作成)
Napkin AIは、テキストを入力するだけで自動的に視覚的コンテンツを生成できる便利なAIツールです。
特に、グラフや図解作成が得意な様子。
文章などを入力すると、その内容を元にいい感じの図解を作ってくれます。
そのまま資料も作成できるので、プレゼン資料やSNSの図解まとめ発信などに役立ちますね!
Napkin AI – The visual AI for business storytelling
学習/勉強系AI
個人的に、今後アツいと考えているのが「学習系AI」。つまり、AIを自分の先生や学習アシスタントにしちゃおう、という人のためのツールです。
Speak(英会話)
Speak(スピーク)は、AIと英会話ができるアプリ。
Chat GPTなどでも音声英会話はできますが、こちらは、レベルに合わせた設問や会話も出してくれて段階的に英会話を学べます。
ちょっと使ってみたんですが、かなりいい感じ。
先生としても優秀だし、何より「人前だとまだ話せない…」という恥ずかしがり屋のあなたでもすぐ英会話が学べます。
しかしやはり、「speak」みたいな一般動詞をアプリの名前にするのはやめてほしい笑
スピーク (Speak) | シリコンバレー発のAI英会話アプリ
ELSA speak(英会話)
ELSA speak(エルサスピーク)も、speakと同じくAIと英会話ができるアプリ。
発音の良さなども判定してくれます。
こちらも使ってみてかなり良いです。名前がちょっとかぶっとるけどな!
DeepL(英語翻訳)
DeepL(ディープエル)は、超高性能英語翻訳ツール。
AIツールが話題になりだすきっかけを作ったウェブサービスのひとつです。
その優秀さや便利さは未だ健在で、アプリやchromeプラグインもありますし、課金することで「ウェブページをまるごと翻訳」などができます。
英語の情報に触れることが多い人に、ぜひ使ってみてほしいツールです。
コマンドプロンプト(AIに命令をするときの言葉の書き方&使い方)についての情報です。
Prompt Engineering Guide(日本語版)