📚 つくる力の育て方

拡張性を手に入れろ!GPT×Whisperの自動レポート構築メモ

拡張性を手に入れろ!GPT×Whisperの自動レポート構築メモ

「ツールを作る」と聞くと、プログラミングができる人だけの世界だと思ってた。

でも今は、GPTやWhisperといったAIの力を借りて、コードが書けなくても“仕組み”は作れる時代になってきた。

実際にぼくも、英語コーチをしている姉のサポートとして、「セッションの録音をもとにレポートを自動生成するツール」を作ろうとしたのがはじまりだった。

最初はColabでGPTを使いながら .md.json を手動で整理してたけど、

  • もっとラクにしたい
  • もっと自動化したい
  • もっと人に使ってもらいたい

と思い始めた時にぶつかったのが、

「結局どこに何を置けばいいの?」「Colabだけで完結しないの?」

という「サーバー選び」の迷子問題だった。

この記事は、そんな自分の試行錯誤を残しておくための記録であり、同じように「ノーコードから始めて、本気でツール化したい人」に向けた道しるべです。

⚙️ Colab×Xserver時代:最初はこれで良かった

最初はね、もう「Colab×Xserver」でドヤってたんですよ。

「ほら見て!GPTがしゃべったレポートを.mdにして、Xserverで表示してやったぜ!」って。

もうね、“自作感”爆発してて最高。手間もスパイス、愛もスクリプト。

でもね、気づくんです。

「いや待て、毎回手で .md 書いてアップして、ファイル名も決めて、リンク貼って…って、地味にめんどくない?」と。

それでも最初のうちは愛せるのよ、手作業。

でもね、レポートの件数が増えるたびに、こっちのテンションが下がってくの。

愛が薄れるの。そう、「管理がダルい」ってやつ。

JavaScriptで表示してたんだけど…

  • ファイル名は手書きで配列に書かないとダメ
  • 新しいファイルを作るたびに手で追加
  • .mdファイルも全部URLで見れるようにしないと表示されない(=セキュリティちょっと不安

そんな感じで、「見せるだけ」の構成には限界があることに気づいたのです。

そしてつぶやく。

「おい…これ、自動で回るようにしないと未来ないぞ?」

ということで、ここから「拡張性」を求める旅に出るのでした。

🧱 本気で構築したくなった理由

最初は「とりあえず動けばOKでしょ」って思ってた。

GPTがレポートっぽいものを出してくれて、.mdで保存して、見れるようにして「うんうん、これは便利だわ」って自画自賛。

…でもね、“便利”はずっとは続かない。

📦 ファイル、爆増。

セッションが増えると、.mdが「謎のファイル地獄」になる。

ファイル名のルールが怪しくなってくるし、どれがどの生徒のレポートかも分かりづらい。

🧍‍♀️🧍‍♂️ 生徒が増えたら地獄。

「〇〇さんのレポート、どれだっけ?」
「先週のやつどこいった?」
→ 未来の自分、絶対迷子。

🔐 アクセス制限したいよね?

コーチが何人かいたら、「その人の生徒だけ表示させたい」ってなる。

でもJavaScriptだけだとそれすらできないのよ。ログインもできない。

🤖 GPTとWhisperも、いつまでも手動じゃツラい

  • Colabで音声ファイルアップロード
  • Whisperで文字起こし
  • GPTで整形
  • .mdとしてダウンロード
  • Xserverにアップ

……って、どんだけ“人力”GPTなんだよって話。

🧠 気づいた。

「これ、毎回ぼくがやる必要なくない?」

そう、ぼくはGPTに仕事を任せたいんだ。

手動作業を繰り返すんじゃなくて、“一度組んだら勝手に咲く仕組み”を作りたいんだ。

だから、ちゃんと考えた。

このままじゃ、咲かない。拡張しない。だるい。←ここ重要。

☁️ AWS?Heroku?Xserver?選定の迷いと決断

気づいたら、“仕組みのアップデート会議”を一人で始めてた。

ホワイトボードもないのに、頭の中でこう叫んでる。

  • 「拡張したい!でも難しいのは嫌!」
  • 「自動化したい!でも高いのは嫌!」
  • 「便利にしたい!でも訳わからんのはもっと嫌!!」

そんな中、候補に上がってきた3大サーバー戦士たち。

🟦 Xserver:ぼくの最初の相棒

  • HTMLとPHPがすぐ動く
  • 管理画面も分かりやすい
  • 安い(最安で月1000円切る)

でもね…

  • ❌ DB連携やファイル自動処理は微妙
  • ❌ Pythonが動かない(Whisper無理)
  • ❌ サービスっぽくするには物足りない

やっぱり“静的HTML+手動アップロード”っていう限界が見えてきた。

🟣 Heroku:魔法のようなPaaS(だった)

  • git pushだけでデプロイ完了!✨
  • Pythonも動くし、FlaskでAPIもいける!

初心者には天国…だった……

  • ❌ 無料枠が消滅(しかも寝てるとスリープ)
  • ❌ 商用には不安あり(速度・制限)
  • ❌ そもそも「今から本気出す」には頼りない

「楽だけど、ずっと乗る船じゃない」感がすごい。

☁️ AWS EC2:最初はこわい、でも最強の味方

  • サーバーまるごと1台を自分仕様にできる!
  • WhisperもGPTも、なんでも動かせる!
  • 起動してる時間分だけ課金だから最小コスト構成もOK!
  • ✅ Pythonで処理→DB保存→API提供、全部できる
  • ✅ サブドメインで処理と表示を分けることもできる
  • ✅ 将来的にコンテナ化やLambda移行も視野に入る

そう、“拡張性の化け物”なのだ…!

🤔 そして決断。

  • Heroku → お手軽だけど未来がない
  • Xserver → 愛着あるけどもう限界
  • AWS → ビビってたけど、やってみたらGPT先生が全部教えてくれる

🔥 よし、AWSで行こう。

最初はEC2一台で十分。Colabの代わりに、裏で働いてもらおう。

今まで手でやってたことを、自動で回す仕組みにしていこう。

💰 実際、AWSっていくらかかるの?

「AWS」って聞くと、なんかこう…

“月3万円くらい飛びそう”な名前してるじゃないですか?(わかる)

でも!実際はこうです👇

項目構成月額の目安
EC2(t3.micro)Python処理(Whisper/GPT)約500〜1000円前後(スケジューリングでさらに節約可)
RDS(MySQL)レポート・ユーザーデータ保存約500〜1000円前後(小規模ならもっと安い)
S3+CloudFrontWeb表示用(レポート閲覧)月数十円〜数百円程度(激安)
GPT APIOpenAI課金(トークン使用量次第)数百円〜数千円(処理量による)

🧮 トータルしても…

最小構成なら、全部合わせても月1500〜3000円くらいで運用できる。

つまり、「Colabで毎回起動して手動処理」してた時間をお金で買う感覚に近い。

で、拡張したくなったらサーバー分けたり、LambdaやDockerにしたり…あとから広げられる安心感がAWSにはある。

決め手は「いま安くても、あとで困らないか?」

いまの構成が「安い」だけじゃなくて、“このまま育てられる仕組み”になってるか?が大事。

AWSはそれを満たしてた。

🌱 AWSが持ってる“拡張性”って何?

「拡張性が高い」とか言うと、エンジニア界隈のかっこいい言葉っぽく聞こえるけど、ここでの“拡張性”ってこういうことです👇

① 処理を分けられる

例えば将来こうしたくなったら…

  • Whisper用のサーバー
  • GPT整形用のサーバー
  • Web表示だけのサーバー

って役割ごとに分けることで、処理が重くならない&安全に運用できる。

サーバーの分離が“面倒”じゃなく、“やって当然”くらいに簡単にできるのがAWSの強み。

② 利用者が増えても落ちにくい

アクセスが集中しても、必要に応じて自動でサーバー数が増えたり(オートスケール)できる。

ColabやXserverでは「アクセス増=遅くなる&落ちる」だったのが、AWSなら“耐えられる設計”が可能。

③ いつでも進化できる

最初は EC2 だけでいいけど、あとで…

  • バックエンドだけ Lambda にする(サーバーレス)
  • Docker コンテナにして移植しやすくする
  • WebフロントをNext.jsに切り替える
  • 検索性を高めるためにElasticsearch導入

…など、ステップアップが自在。

「今の構成に縛られない」って安心感がとにかくでかい。

④ ユーザーごとの制限や機能の切り分けもラク

  • コーチごとに見える生徒を制限
  • 生徒ごとに閲覧可能なページを絞る
  • 管理画面だけ別サブドメインにする

これ全部、「あ、それなら追加で書けばOKです」ってレベルで可能。

最初から「想定しておかないとできない」わけじゃないのがありがたい。

💡 拡張性は、未来の自分をラクにするための武器

今の作業を楽にするのは自動化、これからの変化に対応できるのが“拡張性”。

この2つをセットで持ってるAWS、そりゃ選ばない理由ないよね?って結論になったわけです。

🎧 WhisperはAPIじゃなくて“自前で回せる”と知った衝撃

最初ぼくは思ってたのよ。

「Whisperで文字起こししたいなら、OpenAIのAPI使うしかないっしょ?」

「毎回1分あたり○円かかるんでしょ?回した分だけ課金されるんでしょ?」

……と思ってたら、GPT先生が教えてくれた。

Whisperって、インストールすればローカルで動きますけど?

えっ!?🤯

つまり、こういうこと👇

項目Whisper APIローカルWhisper(EC2で実行)
課金方式分単位で従量課金無料(CPUならタダ)
処理場所OpenAIのサーバー自分のEC2インスタンス上
カスタマイズできないモデルサイズ・ノイズ除去など自由
起動までの速さ早い少し初期準備必要(でも1回だけ)

つまり、無料で Whisper 使える環境が作れる!

モデルサイズも base, small, medium, large から選べるし、「API代が気になるから文字起こし回数を減らす」みたいな貧乏性を脱出できる。

Whisperって実は、“無料で使い倒せるAI”だったんだよ!!!!(知らんかったやん)

この一歩だけで、毎月数千円レベルの節約になるケースも全然ある。

Colab時代にこの恩恵を感じるのは難しかったけど、AWS構成にすることでようやくこのポテンシャルを活かせたのです。

🛠 現在の構成(最小構成で拡張性◎)

「これが現時点の答えだッ…!」って感じで、ぼくがたどり着いたのがこの構成👇

Colabから卒業して、自動で回る“成長するシステム”の第一歩です。

broombudy.com(本体ドメイン)
├─ S3 + CloudFront → レポート表示(HTML)
├─ EC2(Python) → Whisper / GPT処理(音声→レポート)
├─ RDS(MySQL) → レポート・ユーザー・セッション情報保存
├─ Route53 → ドメイン管理
└─ api.broombudy.com(サブドメイン) → データのやり取り用(PHPやFlask)

💡 各パーツの役割

パーツ担当してることコメント
S3 + CloudFrontHTMLレポートを静的に表示超軽いし爆速。JSも置ける
EC2Whisperで文字起こし、GPTで整形Colabの代わり。ずっと起動してなくてOK
MySQL(RDS)セッションやユーザーの情報管理.md/.json卒業して、全部DBで
Route53ドメイン管理&サブドメイン制御表示と処理を分けられる安心感
サブドメイン(api.〜)API化して柔軟なデータ操作他サービスとの連携もいける◎

🔄 Colabとの違い

比較項目ColabAWS構成
処理の自動化❌ 手動起動✅ cronやAPIで全自動
Whisper実行✅ できる(無料)✅ できる(高速&制御自由)
GPT連携✅ できる✅ 同じようにできる
データ保存.md/.json手動DBに自動保存
表示方法JSで手動管理DBと連携した表示OK

📈 拡張も見据えて設計済み

  • 英語コーチング用営業支援用などサービスごとにサブドメインで分ける
  • 各コーチ用のログイン画面(生徒一覧+セッション履歴)を設置予定
  • 管理画面・分析画面など、役割ごとに機能を分離できる設計に

🤖 そして何より、GPT&Whisperの仕事量が激減(ぼくの手作業も)

  • 音声をアップロード → EC2が自動で処理開始
  • 文字起こし → GPT整形 → DB登録まで自動
  • 表示画面からすぐ確認できる

これぞ 「I build, You bloom」な仕組み

ぼくはもう、“咲かせる裏方”に徹するだけでいい。

🌈 今後の展望と残しておきたいメッセージ

正直、ここまで来るとは思ってなかった。

「音声からレポートが自動でできたら便利じゃない?」くらいのノリだった。

でも実際やってみたら、気づいた。

“ツールを作る”って、未来の自分を助ける作業なんだなって。

💭 自分の“めんどくさい”を大事にしてよかった

手作業がちょっとダルいなって思った瞬間に、ちゃんと立ち止まった。

「これ、いつまで続けるんだろう?」って未来の自分に問いかけた。

その声を無視しなかったから、今こうして“ラクに進化できる土台”ができた。

📈 これからやりたいこと

  • コーチごとのログイン管理・生徒一覧表示
  • セッションを横断した傾向分析(進捗・テーマの変化)
  • 営業マン向けツールへの応用展開
  • GPTが自動で定期振り返りレポートを送ってくれる機能
  • 1クリックで“次回セッションの流れ”を提案する仕組み

などなど…「また手でやってるな」って気づいたら、また一歩進めばいい。

🌱 最後に伝えたいこと

「拡張性のある仕組みを作る」と聞くと、なんだか難しそうに見える。

でも実際は、“未来に向けて、ちょっとだけラクになる選択を積み重ねる”ってことだった。

最初は手作業でもいい。Colabでもいい。Xserverでもいい。

でももし、「このままだと回らなくなりそうだな」って思ったら、迷わずAWSを選んでいい。

GPTも、Whisperも、未来の自分も、きっと味方になってくれる。

ということで、「拡張性を手に入れろ!GPT×Whisperの自動レポート構築メモ」

これにて完了です🎉

  • この記事を書いた人

SHIRAN

「コードは知らない。でも作れる。」AIとツールで便利を生む非エンジニア。挫折も経験しながら、今は作る楽しさを発信中。詳しくはこちら

-📚 つくる力の育て方
-, ,