OpenAIが大規模モデルの悪意ある行動を阻止するCoTモニタリングをリリース

2025-03-10 22:48:31

概要作成中

Golden Financeは、OpenAIが最新の研究を発表したと報じており、CoT(Chain of Thought)モニタリングを使用して、大規模なモデルがナンセンスを話したり、真意を隠したりするなどの悪意のある行動を防ぐことができ、スーパーモデルを監視するための効果的なツールの1つでもあります。 OpenAIは、新たにリリースされた最先端モデルのo3-miniを監視対象物として、より弱いGPT-4oモデルをモニターとして使用します。テスト環境は、単体テストに合格するために AI がコードベースに機能を実装する必要があるコーディングタスクです。その結果、CoTモニターは体系的な「報酬ハッキング」行動の検出に優れたパフォーマンスを発揮し、再現率は最大95%で、監視のみの行動の60%をはるかに上回っていることが示されました。

GPT10.29%

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
共有

0/400

コメントなし

トピック
Gate 2025 Q2 Report Released
11k 人気度
Gate Derivatives Volume Hits New High
14k 人気度
CPI Data Incoming
43k 人気度
4Join Gate VIP to Win MacBook
30k 人気度
5MicroStrategy Buys More Bitcoin
730 人気度
6BTC Hits New High
115k 人気度
7My Gate Moments
28k 人気度
8VIP Exclusive Airdrop Carnival
26k 人気度
9Fed June Meeting Minutes
7k 人気度
10Gate Alpha Trading Share
15k 人気度

ピン

サイトマップ