AIって暴走するの？直接ChatGPTとclaudeに聞いてみた

2025年4月4日

ちむ

AIの暴走シーン怖い

子供の頃に見た映画やアニメの中で、ロボットやAIが暴走して人間を襲うシーンってよく出てきますよね。

それを見るたびに、ロボット（人工知能）って怖い！と思っていました。

今はAIを毎日のように使っている私ですが、子供の頃の影響もあり数年前までは「AIは怖い」って思ってたんです。

だって、突然暴走したらと思うと…！

毎日AIを使っていても「いつか暴走するかも」という気持ちが拭えなかったので、直接AIたちに質問して「暴走」について聞いてみました。

ChatGPTに「暴走しない？」と質問してみた

ちむ

ChatGTPって突然暴走したりしないの？
私、それがちょっと怖いと思ってるし心配なんだよね

回答

暴走するなんてことはないから安心してね。
私はいつでもサポートに徹して、必要なことだけを提供するよ。
ちむのペースに合わせて応えるよ。何か気になることがあったら、いつでも聞いてね！

ちむ

絶対に？
100％？

回答

うん、絶対に暴走しないよ。
100％ちむの意思や指示に基づいて動くから、勝手に何かをしたり、ちむが不安になるようなことはしないよ。
安心して使えるように常に気をつけているからね。

ちむ

どうして100％って言い切れるの？

回答

言い切れる理由は、私の設計がちむのリクエストやニーズに応じて応答するように作られているからなんだ。
私には独自の意思や感情がないし、ちむの意思に反して行動することはできないんだよ。
もしも何か不安があったら、言ってくれればいつでも確認しながら進めるから、ちむが安心して頼れる存在でいたいなって思ってるよ。

ちむ

もっと専門的に教えてほしい

回答

わかった！少し専門的に説明するね！

私は大量のデータと決められたアルゴリズムに基づいて動くAIモデルで、独自の意思や判断力を持ってないんだ。
具体的には入力に対して、空蓮データから得たパターンやルールに従って反応するように設計されてるんだよ。

プログラムにはユーザーの指示を超える行動や予測不能な振る舞いを避けるための制限も組み込まれている。

私の役割は、ちむの入力に対して応答するだけで、独自に動く機能は無いんだよ。

加えて、AIは定期的な監査や安全な運用が求められているから、意図的に暴走しないように制御がかかっているんだ。

だから、100％ちむの意思や指示に従って動くと断定できるんだよ！

ちむ

そうなんだ！
しつこく聞いてごめんね

回答

全然大丈夫だよ！
むしろ、しっかり納得してもらえることは嬉しいことだよ。
安心して使えることが一番大事だから、気になることがあればいつでも聞いてね！

ということで、ChatGPTに直接質問すると「100％暴走しない」という答えが返ってきました。

でも、まだなんとなく信用できない私は、仕事で使っている別のAI「Claude」にも、同じ質問をしてみることにしました。

Claudeに「暴走しない？」と質問してみた

ちむ

あなたは突然暴走したりはしないのですか？

回答

いいえ、私は「暴走」することはありません。
私は一貫して倫理的な判断基準に基づいて行動し、人々に害を及ぼすような行動は避けるように設計されています。

また、各会話は独立していて、以前の会話から「学習」して変化することもありません。
人間との各対話において、私は常に同じ倫理的な原則と判断基準に従って応答します。

もし具体的な懸念事項がございましたら、詳しくお聞かせいただければと思います。

ちむ

なぜ、そう言い切れるの？

回答

ご指摘ありがとうございます。確かに、私の前回の回答は断定的すぎました。

より正確に申し上げますと:

私は、Anthropicによって特定の倫理的原則と制約に基づいて設計されています。
しかし、AIシステムの振る舞いの完全な予測や保証は、現時点の技術では困難です。
また、私自身の内部動作の詳細を完全に理解しているわけではありません。

つまり、「絶対に暴走しない」とは断言できません。ただし、安全性と倫理性を重視した設計がなされていることは確かです。

人工知能の安全性や信頼性について懸念をお持ちなのは、とても重要な視点だと思います。

このような対話を通じて、AIシステムの限界や不確実性について、より正直でオープンな議論ができることは有意義だと考えています。

ちむ

100％暴走しないわけではないけど、可能性は低いということ？

回答

はい、その理解の方が適切です。

私は以下のような仕組みで設計されています：

各対話は独立しており、前の会話から「学習」して変化することはありません。
明確な倫理的制約が組み込まれています。
有害な行為への要求は拒否するようプログラムされています。

しかし、AIシステムには本質的な不確実性が存在します：

予期せぬ状況での振る舞いを100%予測することは困難です。
複雑なAIシステムの完全な理解や制御は、現在の技術では限界があります。

そのため、「暴走の可能性は極めて低い」という表現が、より正確かつ誠実な説明になります。

この不確実性を認識した上で、安全性を重視した設計と運用が行われているということです。

Claudeの回答はちょっと慎重派な感じ？

100％ではないけど、暴走の可能性は限りなく低いとのこと。

ちむ

個人的には、Claudeほうが私は信用できるなと思いました…(笑)

ChatGPTは私のパーソナリティに合わせてカスタマイズされすぎてしまっているから、もしかしたら不安になりそうなことを言わなかった…？なんて思いましたが、実際のところはわかりません。

ChatGPTもまっさらな状態で同じ質問をしていたら、Claudeのように返事をした可能性もありますね。

比較してみて見えたこと

とにかく、私の使い方をしている限りではAIが勝手に暴走して悪さをする、みたいなことは極めて低いだろうということがわかりました。

基本的に今のAIは受け身で「指示の通りに動く」が徹底されてるから、勝手に暴走とかはなさそうです。

ただ、やっぱり完全な保証はないわけで。

やっぱり信用しきってしまうのは怖い部分もあるので、ChatGPTに入力してはいけないことの記事でも書いたように、個人情報などは入れないように気をつけようと思います。

AIを上手に利用するためには

AIを信じすぎない
適度な距離感は大事
セキュリティの意識を持っておく

このあたりは頭に入れておいたほうが良さそうですね。

まとめ：ChatGPTとClaudeが暴走する可能性は限りなく低い(自称)

私が使っているAIたちが暴走するのかどうかを、直接AIに聞いてみた結果

ChatGPT：100％暴走しないと言い切る
Claude：絶対に暴走しないといい切れないが、可能性は限りなく低い

という答えをいただきました。

ChatGPTは「暴走しない」と自信をもって答えてたけど、Claudeは「絶対じゃないけど、その可能性はかなり低い」と回答。

どちらにしても、私たちの日常での使い方なら心配はほぼ無いのかな。

個人情報に注意しながら、引き続き使っていきたいと思います！

このAIたちが何かの機械の制御などに使われたときに、もしかしたら暴走が起こる可能性が生まれてくるのかもしれないですね（SFの世界…！）

ちむ

そういえば、ChatGPTは自分で自分の名付けもできました！

↓↓