Creation

  • AGIという名の、静かな締め切り

    Anthropicのダリオ・アモデイは、2026年から2027年にかけてAGI(汎用人工知能)に相当するAIが登場する可能性があると公言している。MicrosoftのAI部門を率いるムスタファ・スレイマンは、これから12〜18ヶ月以内にほとんどのホワイトカラー職でAIが人間レベルのパフォーマンスに達すると述べた。イーロン・マスクは2026年と言い切っている。

    これらをCEOたちの楽観論と聞き流すことはできなくもないが、予測市場プラットフォームMetaculusでは2029年までのAGI到達確率を25%、2033年までには50%と見積もっており、この数字はわずか数年前と比べて劇的に前倒しになっている。DeepMindのデミス・ハサビスでさえ、2030年代内での実現に50%の確率を置いている。

    誰の数字を選ぶかは大きな問題ではない。重要なのは、この議論が「もしそうなったら」から「いつそうなるか」に完全に変わったのが、ほんのここ数年のことだという事実だ。

    皆んなよく意見をコロコロ変えるなぁ、で、結局いつ来るの?と多くの人は思っていて、僕もその一人だった。しかし、確実にその予測は早まっており、実際に僕たちが使う身近なLLMの進化速度は、多くの人が肌感として感じていることだろう。

    ポイントは、僕たちが「AI」と言う時、それは基本的にChatGPTやGeminiのようなテキスト対話型のLLMを差しているであり、テーマとして出ているAGIやASIの議論においては、それはとても表面的なものにすぎないということだ。

    2020年の時点で、研究者たちの中央値予測は「50年後」だった。それが今や、業界のリーダーたちのほぼ全員が「今年か、来年か、あるいは数年以内」と語っている。AGIを超えた先のASI(超知能)については、AGIが実現してAIが自己改善のループに入ったとき、移行がどれほどの速度で起きるかは現時点では予測できない。ただ一点だけ確かなのは、そこへ向かう道が今、静かに舗装されつつあるということだ。

    こういう話を読むと「それは遠い未来の話だ」と感じる人もいるだろう。だが、現在進行形でクリエイティブな仕事の周辺で起きていることを直視すれば、その感覚は少しずつ揺らいでくるはずだ。

    メンバーシップが必要です

    You must be a member to access this content.

    メンバーシップレベルを表示

    Already a member? ここでログイン
  • やりたいことの見つけ方

    毎日忙しすぎて、やりたいことを見失ってしまった。やりたい仕事がない。発信したいけど、なにをやりたいのかわからない。

    情報が多すぎる世界で、誰かが、何かをやっているように見える。でも自分にはやりたいことがない。

    今回はそう感じている人へ、ひとつの思考のフレームワークを提案したい。

    書いていて気づいたけれど、タイトルの同名の書籍があるが、全く関係がないのでご承知おきを。読んですらいません。

    話の腰を折るようだが、やりたいことは、未来に向かって探す必要はない。これがひとつの結論である。

    今回は少しラディカルに書く。

    「やりたいことを見つけなければならない」という思い込み自体が、そもそもの間違いだ。その思い込みは、メディアやSNS、あるいは義務教育や大学、そして就職活動によって作られる。あるいは就職活動が終わっても、婚活や終活でも問われることかもしれない。

    「お仕事は何をされてるんですか?」「やりたいことができていて、いいですね」

    「やりたいことをやってきたので、もうこの人生に悔いはない。さようなら」

    やりたいこと、について考える時は、むしろ終活側から考えたほうがリアリティがある。

    なぜか。やりたいことは未来の話だが、やってきたことは過去の話だからだ。確実な未来は誰にも語れないが、自分の過去は誰でも語れる。そして、やりたいことの答えは、実はすでに過去の中に埋まっている。

    だからそれを探すのではなく、掘り起こす感じ。タイトルに反するようだが、これがこのエッセイの骨格だ。

    メンバーシップが必要です

    You must be a member to access this content.

    メンバーシップレベルを表示

    Already a member? ここでログイン
  • クラウドストレージ脱却物語

    写真や動画が増えて、Apple iCloudのストレージは足りなくなる。

    「もう容量アップグレードでお金を払いたくない!」という強い声が聞こえる。

    無料の5ギガは一瞬で埋まり、50GBにアップグレードして月額150円になる。しばらくして足りなくなり、200GBで450円になる。新しいスマホに乗り換えるも、データを引き継いで当然足りず、2TBにして1500円になる。

    もう面倒だから、6Tを飛ばして、月額9000円を払って最大の12Tを手にいれるストレージセレブも、この世界で増えている。なってみてぇ、ストレージセレブに。

    このようなストレージ問題は、Appleだけでなくあらゆるクラウド系サービスで起こっている。

    現実的に2Tだと余裕がありそうだが、年間18000円を払い続けることになる。東京から福岡までの片道エコノミークラスのチケットが買える。ストレージセレブは、データ量について何も考えなくてよい代わりに、年間108,000円を失う。

    お金よりも愛、愛よりも時間、そして何よりもデータ量を愛するストレージセレブなら年間10万円を失うことは全く痛くないだろう。

    しかし、その10万円を年利7%のインデックスファンドに投資すれば、10年後には197000円になる。毎年10万円を元本として追加するなら(ストレージ年額払いはこちらに近い)、10年後には、147万円になる。これは決して小さくない。

    ストレージへの課金をちょっと節約するだけで、資産形成、子供の学費や、人生が楽しくなる他のことに、お金を使えそうだ。

    だが、ストレージを節約することは、データを保存できないことを意味する。つまり、現在の思い出を保存できないということであり、大切な人との今を残せないことにもなるかもしれない。撮られた写真は全て過去である。過去を思い出すために、現在を保存する。それは未来のためか。あるいは、過去を保存することを辞めて、今をただ生きるか。このあたりを考えるとまた別の問題に派生しそうなので、ここらで止めておく。

    2Tで月額1500円を支払うとして、年額18000円になったあたりから、多くの人はこう考えるようになる。

    「18000円の、2T外付けSSDをひとつ買えば済む話しではないか。」

    確かに、外付けSSDなら1度買えばそれで終わり。クラウドストレージのように永遠に課金され続けることはなくなる。ミニマリスト的には、物理的なモノが増えるのがちょっと嫌だけど、でもそれで毎月のサブスクが一つ無くなるのなら、許してやるか。そんな気持ちにもなる。

    ざっくり言えば、そのようなプロセスで、僕のクラウドストレージからの脱却物語は始まった。

    その経緯は過去にもJournalで書いている。昨年2025年の3月と5月に以下のようなことを考えてきた。

    クラウドストレージ課金からの離脱、ミニマルな写真整理術(3月)

    脱クラウドストレージ – 写真整理と管理のミニマル化(5月)

    ここでの思考は、以下の流れで止まっていた。

    1、SSDへのデータコピー完了
    2、Lightroomの解約
    3、Photosで直近必要なプロジェクトの立ち上げ
    4、iCloudを使うのか、ローカルでPhotosを操作か。新環境での効率的な「撮る→編集→アウトプット→アーカイブ」ワークフローの考察、構築が必要。

    1年ほど経って、ワークフローも固まったので、その現在地を記しておきたい。

    メンバーシップが必要です

    You must be a member to access this content.

    メンバーシップレベルを表示

    Already a member? ここでログイン
  • コンテンツ制作機材エッセンシャル

    読者から頂いた質問より。

    「もし今年、ゼロからコンテンツ制作や発信を始めるとしたら、Tokimaruさんならどのような機材を選びますか?何も持っていない状態でスタートする前提で教えて頂きたいです」

    この話には、前後の文脈があって、この人がこれまでどのようなことをやってきて、これからどのようになりたいか、どのようなものを作りたいか、が書かれている。

    だがここでは、あえて文脈を無いものとして、上記の条件を考えてみたい。

    過去にも、似たような話を書いているけれど、機材について書くのはそういえば久々な気がする。

    回答はこちら。

    1、カメラ(小型軽量ミラーレス)
    2、マイク(DJI mic mini)
    3、三脚
    4、MacBook Neo
    5、iPhone

    僕が使用しているアイテムは、サイトのGearリストを参照してみてください。ただし、このリストのものを最初から買うことはないと思う。

    もし僕が質問者の立場であれば、カメラはAPS-Cかできればフルサイズの動画に強いミラーレス機。なるべく小さく取り回しの良いものを選ぶ。それにレンズを一本。16mmから50mmの範囲をカバーできるもの。三脚もGitzoではなくカメラに合わせたものに、少しサイズダウンするだろう。マイクだけは、現在と同じDJI mic miniにする。

    メンバーシップが必要です

    You must be a member to access this content.

    メンバーシップレベルを表示

    Already a member? ここでログイン
  • AI時代に残る発信

    朝5時50分。東の空から太陽が昇りはじめ、窓から遠くに見える遮蔽物の高さを超えたころ、強力な光がホワイトボックスに刺す。その強烈な光の中で、真っ暗な画面に向かいながら、この文章を書いている。

    最近のルーティンをツイートした

    530 起床、捕食
    545 ディープワーク
    730 ヨガ
    830 瞑想
    930 朝食・コーヒー
    1000 ディープワーク or 撮影(ラン)
    1200 昼食
    1300 散歩
    1500 編集、読書、軽作業
    1600 (筋トレ)
    1900 夕食
    2200 就寝

    ()の活動は隔週で行う。つまり、ランした次の日は、筋トレ、その次はまたラン、という感じ。土曜日か日曜日は休息日で、完全オフ。それでも毎日1万歩の歩行と、1時間の瞑想はなるべく行うようにしている。

    この順序には理由がある。

    まず、朝起きて最も集中力が高まっている時間に、自分にとって最も重要な仕事「ディープワーク」を行う。最初の90分が大切だ。捕食では、プロテインやバナナのような簡単なものを食べる。思考する仕事前の適度なタンパク質の補給は、脳の効率を上げることがわかっている。

    ヨガを行う前には食べすぎてはいけない。ちょうど朝の補給から1時間程が経ったころ、アシュタンガヨガのシークエンスを始める。その後1時間の瞑想。アシュタンガヨガは動く瞑想と言われるが、静坐瞑想とはまた異なる。前者は心身全体のチューニングに効いて、後者は内省とメタ認知に寄与する。この言い方は半分正解で半分間違っている。なぜなら、瞑想には「効果」を求めてはならないからだ。面白いことに、効果を求めず、効果を忘れるくらいの状態が瞑想の成功であり、効いている状態となる。

    その後、朝食を取る。これはいつものキム・カーダシアンセット。(オートミール・豆乳、ナッツ、ブルーベリー、ヨーグルト、ピーナッツバター)キムカーダシアンが食いそうな飯だ、ということで僕が勝手に名付けた。実際、キムに確認したわけではないが、オートミールは食っている、という情報だけは出ている。今度来日した時にでも、聞いてみようと思う。

    メンバーシップが必要です

    You must be a member to access this content.

    メンバーシップレベルを表示

    Already a member? ここでログイン
  • クリエイターの居住地の選び方

    先週からフィリピンにいる。セブ島のモアルボアルという街から、セブシティ、そしてカオハガン島を巡ってきた。気温は27℃、時折りスコールのような雨が降っては止む、絵に描いたような南の島。花粉症がピタッと止んで、息がしやすい。やっほーみんな息してる?

    カオハガン島はセブ島から10キロの位置に浮かぶ、周囲2kmの小さな島。この島は90年代初頭に日本人が購入し、現在もオーナーが住んでいる。学校や宿を作り、島の自然を守りながら、元来の住民と共生している。もしこの方がオーナーになっていなければ、島は業者の手に渡り、もっと開発が進められ、住民は当然のように追い出されていた可能性もあっただろう。

    少ないもので、しかし豊かに、ゆとりを持って暮らしている人々からは学ぶことが多い。資本を拡大するにつれて、同時に欲望も膨れ上がる。いつまでたっても満たされることはない。消費と欲望にドライブされる資本主義からは、誰もが逃れられない世界になっている。それが環境に及ぼす影響は大きく、自然は破壊され、ますます地球の状態は悪化している。

    色々と考えさせられる旅の道中です。

    さて、本日の本題。

    「会社員を辞めると、住む場所に縛られなくなので、南の島や田舎、海外にも移住できる。」

    「サイドFIREしたなら、どこでも住めるからいいね。東京から地方に移住しないの?」

    などと、よく言われる。

    これは確かにそうなのだが、僕は逆だと思っていて、行くべき会社がないからこそ、住む場所の重要度が上がる、と考えている。だから、「どこでも好きなところに住める」というのは、ちょっと違う。

    考えてみて欲しい。会社に勤めていると、通勤が発生する。リモートワークの人でも週に1日でも出社する人は、家が職場から近い方が楽である。通勤すべき会社があるということは、自分の活動拠点が2拠点になるということだ。自宅と会社。会社の近くは熟知していて、美味しいランチやコーヒーの店を知っていて、街も人も少し馴染みがある、と感じている人は多いだろう。

    自宅周辺はなおさら馴染みの場所が多くなるし、住んでいる期間が長くなれば、それによる安心感も出てくる。1日8時間労働をしていると、自宅ではほとんど寝るだけになるかもしれないが、それでも毎日帰ってきて、土日は出かけたりするので、自分のフィールド(庭)的感覚が強まる。

    これが、ソロプレナーになり独立したり、経済的自立ができて退職したなら、自宅近辺が唯一のフィールドになる。それは1拠点。もし、その唯一の自分のフィールドが、好きなお店がなく、病院や役所などの社会インフラが乏しく、災害に弱く、雰囲気が悪かったらどうだろうか。独立して自宅を仕事場にする場合は、通勤がなくなるため、自宅の周辺で運動したりジムに通ったり食事をしたりすることになる。つまり、1日の大半を自宅周辺で過ごすことになるので、住む場所の重要度が上がるのだ。

    メンバーシップが必要です

    You must be a member to access this content.

    メンバーシップレベルを表示

    Already a member? ここでログイン
  • 抹茶を点てて、タイムラインを立てる

    午後三時四十分。抹茶を点てて、ダークチョコをひとかけだけ口に入れる。こういう時間があるだけで、一日の輪郭が戻ってくる。最近のチョコレートは驚くほど高い。価格の変化は、派手なニュースよりも先に、生活の端から世界の気配を運んでくる。

    抹茶もファイヤーキングのマグで飲んでいる。沸騰させない温度の湯を注ぐ。400FDを火にかけたら、気泡がぷつぷつと立ち始めるあたりで止める。70度から80度くらいの、ぎりぎり熱いけれど尖っていない温度。抹茶は本来もっと少量で濃く仕上げるものだが、一杯をネスカフェのように飲みたい。香り高く、シャキッと冴えるのにどこか落ち着く。カフェインとテアニンの効用か、あるいはただの気のせいかもしれない。

    今日はXを始めた話し。

    メンバーシップが必要です

    You must be a member to access this content.

    メンバーシップレベルを表示

    Already a member? ここでログイン
  • 個人ブランドの作り方

    目次

    1. ネーミングの重要性
    2. 理想の未来を設定する
    3. 模倣する
    4. ブランドコンテンツを作る
    5. 自分のストーリーを書く
    6. 問題が出たら引き算で

    1. ネーミングの重要性

    ブランド(会社)を立ち上げる時、名前は重要だ。名前は、最初のプロダクトであり、最初のUXだと言える。人はあなたの活動を、まず言葉として受け取る。だから、親しみやすく、書きやすく、覚えやすく、口に出しやすい名前ほど、出会いの摩擦が小さくなる。発音しやすい名前ほど好意や記憶に繋がりやすい。

    有名企業を思い浮かべると、摩擦の少なさが徹底されていることが分かる。Apple、Amazon。短く、口に出して気持ちいい。日本でも、メルカリ、ユニクロ、吉野家。どれも人が覚えるための負担を極限まで減らしたような名前だ。ここで大事なのは、センスよりも設計である。覚えやすさは美学であり、同時に戦略なのである。

    名前は人間の記憶のためだけでなく、検索と一覧のための名称でもある。かつては電話帳や企業ディレクトリが強かった時代があり、アルファベットの早い位置にある名前が有利になる場面が確かにあった。実際、スティーブ・ジョブズは「Atar(米国のゲーム・家電企業)より電話帳で先に出る」という理由もAppleという名前の一因だった、と振り返っている。Amazonも創業当時、サイトの一覧がアルファベット順で並ぶことを意識し、Aで始まる単語を辞書で探したという話が残っている。もちろん現代は、電話帳が主戦場ではないが、一覧に並ぶ、検索される、読み間違えられる、という現象自体は形を変えて今も残っている。App Store、SNS、検索結果、音声入力、友人への口頭紹介。どこでも、名前は並び、聞かれ、打たれるものである。

    ここで話は、ドメインに繋がる。ネット時代のビジネスは、極端に言えばドメインファーストだ。ドメインの重要さを理解していない経営者は意外に多い。会社の名前をつけたあとで、その名前が既にあったり、他のサービスが使用しているというパターンは最悪だ。

    サイトのURLだけでなく、独自ドメインのメールまで含めて、名前は信用の器になる。実際、独自ドメインのサイトやメールは信頼・信用の判断に影響するという調査が複数ある。

    名刺を配る前に、リンクを渡す前に、人は一瞬であなたを判断する。その一瞬で目に入るのが、ドメインとメールアドレスだ。ここが整っていると、たとえ小さな個人事業でもきちんとしているという印象が立つ。逆にここが崩れると、中身が良くても入口で損をする。

    だから、ブランドネームや会社名を考えるときは以下を考慮する

    • その名前は、子どもでも一発で書けるか(スペルミス耐性)
    • 初見で読めるか、口に出して気持ちいいか(発音の自然さ)
    • 一回聞いて覚えられるか(短さ・リズム)
    • そして何より、その名前で .com(あるいは主要TLD)が取れるか、主要SNSのハンドルが取れるか

    固有名詞の強さは、ここで効いてくる。唯一無二の単語は、ドメインも取りやすく、検索でもあなたに収束しやすい。逆に、半端に一般語に寄せた名前は、競合が増え、検索の文脈が散り、ブランドの輪郭がぼやける。昔はキーワードをそのままドメインに入れて上位を取るという発想が流行したが、Googleは低品質な完全一致ドメイン(EMD)を順位面で抑えるアップデートを行ってきた。つまり、ドメインや名前だけでショートカットしようとすると、長期ではむしろリスクになりうる。

    最後にもう一つ。名前は、あなたのビジョンを表すためにも重要だ。ブランド名は、看板であると同時に、羅針盤でもある。「この名前の人なら、こういう未来に向かっているはずだ」と、他者の期待を生むような名前は強い。期待が生まれると、物語が始まる。物語が始まると、コンテンツが積み上がる。積み上がったコンテンツは、やがて名前そのものを意味に変える。

    名前は最初の投資で、最初の約束である。軽く決めない。だが、こねくり回しすぎてもいけない。最小の言葉で、最大の未来を背負える名前を選ぶ。ここから、ブランドは始まる。

    2. 理想の未来を設定する

    個人ブランドは今の自分を飾り立てる作業ではない。むしろ逆で、未来の自分に向けて、いま何を捨て、何を積むかを決める設計だ。ブランドとは、世界に対する一種の約束であり、約束である以上、時間軸を持つ。だから最初に必要なのは、ロゴでも肩書きでもなく、どんな未来へ向かうのかという一点になる。

    たとえば今、ただ服やモノを作るだけでは勝ちにくい。安くて良いものは、ユニクロや無印良品のような巨大な仕組みが、すでに高い水準で供給している。価格・品質・流通という土俵で戦うと、個人や小さなブランドは消耗する可能性のほうが高い。これは冷たい現実だが、同時に救いでもある。埋もれないためには土俵を変えればいいからだ。価格ではなく、意味。機能ではなく、文脈を重視する。

    そこでストーリーが立ち現れてくる。

    メンバーシップが必要です

    You must be a member to access this content.

    メンバーシップレベルを表示

    Already a member? ここでログイン
  • 音楽レーベルの立ち上げと楽曲リリースワークフロー

    2025年の夏ごろから音楽制作に本腰を入れて取り掛かり、11月17日にTokimaru Tanaka名義の初EP「Confluence」をリリースした。同時に自社レーベル「tokimaru records」を立ち上げ、楽曲制作から配信までを全て一人で行っている。

    この一連の仕事で使用した機材とソフトウェアは以下の4つである。
    MacBookPro 14
    Novation Launchkey61 mk4
    Shure SE215
    Logic Pro

    HHKBのキーボードを「楽器」と呼ぶ勢がいて、それは密かに面白く、それを楽器とするのならばHHKBも含めるべきだろう。確かにHHKBを楽器的に打つのは楽しいが、MacBookのキーボードだけでも音楽制作はできるので、今回は除いておく。

    ヘッドフォンもスピーカーもオーディオインターフェースの類も使用していない。この機材ラインナップでも、楽曲制作をしている人から見れば随分ミニマルに映ると思うが、打ち込みとモニタリングをMacBookで行えば、MIDIとShureも不要になりMacBookとLogicだけというよりエクストリームなスタイルになる。作業の感触と速度は、全体のワークフローと品質にダイレクトに関わると考える。そういう意味では、上記の4つが快適に、かつストレスなく制作できる最低限のラインナップだと思っている。

    10代から20代にかけてずっと音楽・バンド活動をしていて、最後のバンドは宮崎で活動していたスリーピースのMelanchoLyだった。ギター&ヴォーカル、作詞作曲も担当していて、2007年に5曲入りのミニアルバムを発表して、その後解散した。それから現在のエレクトロミュージックに移行した経緯については、SpotifyかApple Musicのプロフィールを参照してほしい。

    およそ18年ぶりにEPを作ることができたのは、自分の中での「少ないものでより創る意欲」の盛り上がりと、機材とソフトウェアの進化のおかげだ。制作ワークフローの最適化にAIも用いており、LLMモデルの進化がなければ、今回の完全一人プロダクションは生まれなかったと思う。

    今はプロダクションやレーベルに所属せずとも、一人で音楽を作り、世界に配信できる時代だ。古参のプロデューサーが作る音楽に比べればその技術も音も足元にも及ばないことはわかっている。だが、古い業界構造に入れないがために、自分が作りたい音楽があるのにそれを諦めてしまっている人や、音楽制作をしているけれど発信の仕方がわからない人。そのようなクリエイターに今回のプロジェクトが何かのヒントになれば、幸いである。

    実際にレーベルの立ち上げから、楽曲制作、配信のプロセスを順を追って解説する。

    今回のプロジェクトで行ったことは以下の通り。

    メンバーシップが必要です

    You must be a member to access this content.

    メンバーシップレベルを表示

    Already a member? ここでログイン
  • YouTubeにおけるAI活用

    YouTubeを運用するにあたり、AIの活用について触れておかなければならない。拡張の手段としてAIは使える。だが同時に、多くの人が使用するため、生まれるコンテンツが標準化する恐れもあり、チャンネルの方向性によってはマイナスに働く諸刃の剣であることを忘れてはならない。

    AIの進歩は速いため、あくまでこれを書いている時点(2025/11/25)の情報として捉えてほしい。

    YouTubeに有効なAIの使い方には以下のようなものがある。

    1、台本やテーマ、アイデア出し
    2、サムネイルやインサート画像の作成
    3、音声の出力
    4、映像の出力
    5、チャプターの生成

    1、台本やテーマ、アイデア出し。

    これは多くの人が活用している。思いついたテーマから、台本を作ってもらう。ひとつのキーワードから、どのような動画にしたらいいかアイデアを出してもらう。バズりそうなタイトル候補を出してもらう、など。

    文章を扱うことはChatGPTでもClaudeでもGeminiでも、多くのLLMモデルが得意とする分野だ。特殊なプロンプトも不要で、会話するように「シンプルライフについての動画を作りたいので、台本を書いて」などと、打ち込んでいけばいい。より細かな設定やストーリーを入力するほど、出力の精度は高まる。あとはその台本を使用して、映像を収録すればいい。

    2、サムネイルやインサート画像の作成。

    これも最近増えてきている用法だ。ChatGPTには、OpenAIつまり自社のDALL-Eという画像生成AIが組み込まれている。これにより、ChatGPTの中で会話するように生成を指示すれば、画像を出力してくれる。他にも画像生成AIとしてはMidjourneyがある。こちらのほうが先に流行したが、最近は会話の流れで生成してくれるChatGPTやGeminiのほうが先を行っている感触がある。

    画像生成分野において最近急速な進化を見せたのが、GoogleのNano Bananaである。ようやくプロレベルで使用できるツールが登場したと言われ、実際に生成の精度や品質はChatGPTよりも高い。

    ChatGPTの画像生成はプロンプトによっては、なかなか良い絵を出力してくれる。しかし背景引き伸ばしや、正確な比率、文字入れがやや不得意。Nano Bananaは例えばYouTubeのサムネイルを作りたい時、「横位置、16:9の比率で」と指示すれば、サムネイルにそのまま使える比率で画像を出力してくれる。解像度も標準で2752 × 1536あり、十分使用に耐えうる。文字入れや、複数画像のデザインも得意な印象をうける。

    Nano Bananaは最初はAPIのみでの提供だったが、現在はGemini3に統合され、Geminiの中でツールから「画像を作成」(バナナのアイコンになっている)を選べば、ChatGPT同様に会話の流れで出力してくれる。一度出力させて、一部を直したり調整する精度も、これまでの画像生成AIに比べてかなり高い。これは既にYouTubeのサムネイルやインサート画像に使えるレベルだと感じる。

    3、4の音声と映像出力のAIも複数のプロダクトがしのぎを削っている状態だ。現在主力のツールとその特徴を簡潔に記す。

    3、音声の出力

    ElevenLabs

    – 最も自然な音声生成、多言語対応、感情表現も可能。最近は効果音生成 (Sound Effects) 機能や、長文読み上げに特化したアプリなど、エコシステム全体が強化されている。

    メンバーシップが必要です

    You must be a member to access this content.

    メンバーシップレベルを表示

    Already a member? ここでログイン