わずか2.5GBでGPT-4級?ローカルLLM活用最前線と国際出張の現実

「MacBook Proのメモリ128GBは最強!」と喜んだのも束の間、ローカルLLMの世界がまたしても劇的に進化しました🤯。

なんと、わずか2.5GBの超軽量モデルで、Perplexityのような検索・要約機能がご家庭でも動くという衝撃のニュースが飛び込んできました。

本記事では、このローカルLLMの最新動向と、クラウドとの新たな連携戦略を解説。さらに、エアカナダのストライキやフライト直前まで確定しないという、技術者の国際出張におけるリアルなトラブルにも迫ります🤔✨。


導入:連休と国際出張のリアル

今回はお盆休み明けの収録ですが、ホストのドリキン氏からは浅草橋での二拠点生活を満喫した話が飛び出しました。

浅草橋はインバウンドが多く、すき家の朝食(混ぜのっけご飯 牛丼オプション)のような格安メニュー(420円)が外国人にも大人気だそうです。

利便性の高い場所を選んで住むことは、サンフランシスコ在住のドリキン氏にとっても重要だと語られています。

しかし、その裏で、ホストはすぐに控えるカナダ出張で大きなトラブルに直面していました。


60人規模の国際出張トラブル:エアカナダのストライキ

ドリキン氏はトロントでのワークショップのため、総勢60人ほどでカナダへ向かう予定でしたが、出発直前になってエアカナダの何十年ぶりかのストライキに遭遇しました。

  • 影響の深刻さ:カナダではトップニュースになるほどの大きなストライキで、日本やサンフランシスコから来る参加者全員が行けない事態となりました。
  • 航空会社の対応:ストが起きると、航空会社は自動的に近い日のフライトに振り替えを勝手に始めるらしいのですが、仕事での渡航であるため、勝手に振り替えられては困ります。
  • 水面下の攻防:結局、スト発生をモニターしながら、起きた瞬間にキャンセルを入れ、もう一つの保険として確保していたカゴ経由のアメリカンエアラインのフライトで飛ぶという計画を練っていました。
  • 事務処理の課題:事務手続きはトラベル会社を通じて行っているものの、アドバイスはしてくれるが、最終的には「自分でやってください」というスタンスで、結局自分で対応する必要があったそうです。
  • カナダ開催の背景:予算的に安くなることに加え、カナダチームが「誰も遊びに来てくれない」という雰囲気を出すため、グローバルなイベントとしてカナダ開催を推進した経緯がありました。

コードシェア便(エアカナダとユナイテッドなど)の場合、エアカナダが親(オペレーションを担う)の便だとパイロットやCAもエアカナダ所属のため、ストライキが起きたら完全に飛ばなくなってしまうのです。

感じたポイント👌:何十年ぶりかのストにピンポイントで当たるなんて、まさに技術者が遭遇する「確率的自傷」のようですね。グローバル企業でも、トラベルアドミニストレーションのサポート体制に課題があるという点は、現場のリアルが伝わってきます。


ゼンシ氏の出張準備と「怒る法則」

一方、テクニカルジャーナリストの西川善治氏も、ドイツ・ケルンで開催されるゲームズコムへの出張を控えていました。

フライトが直前(3、4日前)に確定するというタイトなスケジュールで、乗り継ぎ時間のバッファーがない危険なフライトを旅行代行業者が提示してきたそうです。

「怒ったり脅すと動く」外国企業

この不備に対し、ゼンシ氏は招待会社に「当日到着できなかった場合、翌日のイベント参加はできませんが、それは勘弁していただけますよね?」と伝えたところ、慌てて別の航空会社(ルフトハンザ)に振り替えが行われたそうです。

ゼンシ氏は、外国の企業は怒ったり脅したりすると動くという法則があるとし、「いかにあの血管浮き出させて熱弁するかが勝負」だとコメントしています。

これは、東洋人は基本バカにされているという前提のもと、きちんと「東洋人も怒るんだぞ」というところを見せないと、要求が通らないという、海外での交渉術のリアルな一面を示しています。


ゲームズコムの現在地

ゲームズコムは、E3がなくなった今、世界規模のゲームイベントとして重要な位置を占めています。

任天堂Switch 2の技術お披露目が行われた実績もあるなど、今回はGeForce 5000番台の応用技術や、IntelのPanther Lakeプロセッサーなど、新しい半導体技術の応用編に焦点が当たるのではないかと予想されていました。

感じたポイント👌:フライトの手配一つとっても、ここまで自分で交渉しなければならないとは、海外出張の洗礼ですね。また、E3の代わりにゲームズコムが重要になっているという現状は、業界の移り変わりを象徴していると感じました。

ローカルLLMの活用最前線:わずか2.5GBの衝撃

今回の目玉ネタは、わずか2.5GBのメモリサイズで動くLLMの登場です。

Mac vs Android、ローカルLLMのメモリ論争に終止符?

MacStudio 180万円、MacBook Pro 128GBメモリといったハイエンドデバイスでローカルLLMの活用を進めていた松尾氏やドリキン氏の試みを、この超軽量モデルが一気に覆す可能性が出てきました。

  • 2.5GBモデルで何ができるのか?
    このモデルは、Web検索とLLMを組み合わせることで、Perplexity(パープレクシー)のような検索・要約サービスを代替するものです。
  • 実用性への疑問
    ただし、Web検索を利用するため、完全なローカル処理ではなくなります。また、セットアップには「Surper API」を使用し、MCPサーバーを立てるなど、面倒な作業が必要であるという課題も指摘されています。
  • LLMのサイズの定義
    LLM Studio(Language Model Studio)の話が出た際、松尾氏とドリキン氏の間で、メモリに載るサイズのモデルはLLM(Large Language Model)ではなくSLM(Small Language Model)ではないかという議論が交わされました。しかし、LLMが「ローカルLanguage Model」と誤用されている可能性も指摘され、用語の定義がまだ曖昧なことが示されました。

LLM開発の現状:多様化するモデルとジェイルブレイク

OpenAIが公開したGPT OSSには、すでに多くの改良版(モディファイ版)が流通しています。

  • マルチリンガル化
    16GB VRAMで動く20Bモデルは日本語性能がイマイチでしたが、さらにバランスの取れた言語データを追加学習(ファインチューニング)させたマルチリンガル版が登場し、日本語での調子が非常に良くなったそうです。
  • ジェイルブレイク版の登場
    クラウド系のGPTは倫理的にお行儀が良いですが、ローカルLLMではそのプロテクトを破ったバージョンも流通しています。これにより、小説内で犯罪的なプロットを描写するなど、クリエイティブな表現が制限されないモデルも利用可能になっています。
  • 利用方法
    松尾氏は、LLM Studioの「ディスカバー」機能で、これらの新しいモデルを新作順に見ていくのが楽しいと語っており、昔のP2Pや新作サイト巡回に近い感覚だと表現しています。
  • 実験
    松尾氏は、コンテキスト長13万のマルチリンガルモデルに、自分と妻との「交換日記」のデータ(システムプロンプト)をコピペして、仮想キャラを作る実験を試みています。

感じたポイント👌:松尾氏の「交換日記」を学習させる試みは、プライベートなデータを使ったローカルLLMならではの活用法で、非常に興味深いです。クラウド系の「お行儀の良さ」がクリエイティブな活動の枷になるという指摘は、ローカルLLMが持つ大きなアドバンテージだと感じました。


クラウド vs ローカルの終焉

このローカルLLMの進化は、クラウド型のLLMの利用にも影響を与え始めています。

松尾氏がNHK出演時に使用したAIアバターは、バックエンドでGPTのAPIを叩き、システムプロンプトでキャラクター付けをしていました。

しかし、ローカルLLMが実用化すれば、テキスト処理を自分のデバイスで動かし、その結果のAPIをサーバーから叩くという形で、追加学習や最適化を自分のサイドで進めることが可能になります。

結論として、松尾氏はローカルLLMの活用は、クラウドかローカルかの「二者択一」ではなく、「組み合わせ」の時代に入っていると結論づけています。


この記事をまとめると…

  • ローカルLLMの超軽量化
    わずか2.5GBの超軽量モデルが登場し、MacBook Pro 128GBモデルの優位性すら揺らぎ始めています。これにより、Perplexityのような検索・要約サービスをローカルで代替することが可能になりつつあります。
  • モデルの多様化
    日本語性能を改善したマルチリンガル版や、倫理的制約を取り払ったジェイルブレイク版など、オープンソースLLMの改良モデルが日々流通しており、ユーザーはLLM Studioなどを通じて多様なモデルを探し楽しんでいます。
  • クラウド vs ローカルの終焉
    ローカルLLMの進化により、機能に応じてクラウドとローカルを組み合わせるハイブリッドな活用が主流になりつつあります。
  • 出張の現実
    カナダへの国際出張を控えるドリキン氏はエアカナダのストライキに遭遇し、トラベル会社のサポートが不十分なため、自身でフライト確保の対応に追われました。また、ゼンシ氏はフライト交渉において「怒ったり脅すと動く」という海外企業の法則を体験しました。

配信元情報

  • 番組名:backspace.fm
  • タイトル:クラウド vs ローカルではなかった!ローカルLLMの活用法! ep617
  • 配信日:2025年8月23日

コメント

タイトルとURLをコピーしました