大規模言語モデル(LLM)との対話といえば、テキストベースのチャット形式が一般的だ。この形式は反応が予測可能になりがちで、入力と出力の間に生じる“創造的なあそび”の余地が乏しい。このため、ユーザーの発想を広げる触媒にはなりにくいといえる。

そこでオーストラリアのモナシュ大学の研究チームは、音楽制作に使われるミキサーやアナログシンセサイザーに着想を得て、ノブやスライダーを手で動かしてLLMの性格や語調を調節できる装置「Memetic Mixer」を開発した。

ノブやスライダーを手で動かして大規模言語モデル(LLM)の性格や語調を調節できる装置「Memetic...

ノブやスライダーを手で動かして大規模言語モデル(LLM)の性格や語調を調節できる装置「Memetic Mixer」のプロトタイプ。言葉の入力は音声認識やキーボードではなく、左手前のプレート部分にマグネットに書かれた単語を並べる“アナログ”なシステムを採用した。

Photograph: Jon McCormack

AIを楽器のように“演奏”

Memetic Mixerの最大の特徴は、フェーダーによって人工知能(AI)の“人格”をミックスできる点にある。具体的には、「楽観と悲観」「夢想と現実」「主導的と従順」といった相反する性格軸がスライダーに対応しており、それぞれを微調整することで出力されるテキストのニュアンスが変化する仕組みだ。

この装置には複数のノブが設けられており、出力にフィルターやエフェクトをかけることもできる。例えば、語彙レベルや文章の長さ、皮肉や感情の強さ、政治的な傾向などを調節することで、同じ入力からでも異なる出力が得られる。この設計により、ユーザーは意味だけでなく口調を含めて生成AIとの対話を好みのものに変えられるという。

研究チームは今回、アートを専攻する6名の大学院生を対象に、単語だけを使ってLLMと対話する装置「Memetic Poet」と、これにノブやスライダーを取り付けたMemetic Mixerを1週間ずつ試用してもらい、その反応を比較した。

その結果、前モデルに相当するMemetic Poetに対しては「すぐに飽きてしまった」「単語を置き換えるだけでは想像力が膨らまない」といった声が多く、出力の幅や意外性に対する不満が目立った。一方で、Memetic Mixerへの反応は明らかに異なっていた。特に「自分の手で人格を調整している感じがしておもしろかった」という学生の感想は、物理的操作が創造性を喚起する体験として機能することを示唆しているという。

単語だけを使ってLLMと対話する「Memetic Poet」(左)と、これにノブやスライダーを取り付けたMemetic Mixer(右)。

単語だけを使ってLLMと対話する「Memetic Poet」(左)と、これにノブやスライダーを取り付けたMemetic Mixer(右)。

Photograph: Jon McCormack

特筆すべきは、参加者の誰ひとりとして装置の使い方を事前に説明されることなく、ノブやフェーダーの機能を即座に理解して使いこなしていた点だろう。これは音楽機器に由来する操作様式が文化的に広く浸透しており、専門家でなくても直感的に受け入れられることを示している。

このほか、装置を使って生成された言葉について音楽的な比喩で語る参加者が多かった点も注目に値する。なかでも「言葉をエフェクトでひずませる」といった表現からは、テキストを“音”として捉える認知的な転換がうかがえるという。インターフェイスの変化がユーザーの認識そのものを変える可能性を示唆していると、研究者たちは考えている。

WACOCA: People, Life, Style.

Pin
Exit mobile version