OpenAI Merilis Pemantauan CoT untuk Menghentikan Perilaku Berbahaya Model Besar

2025-03-10 22:48:31

Pembuatan abstrak sedang berlangsung

Golden Finance melaporkan bahwa OpenAI merilis penelitian terbaru, menggunakan pemantauan CoT (chain of thought), dapat mencegah perilaku jahat seperti model besar berbicara omong kosong dan menyembunyikan niat sebenarnya, dan juga merupakan salah satu alat yang efektif untuk mengawasi model super. OpenAI menggunakan model mutakhir o3-mini yang baru dirilis sebagai objek yang dipantau, dan model GPT-4o yang lebih lemah sebagai monitor. Lingkungan pengujian adalah tugas pengkodean yang mengharuskan AI untuk mengimplementasikan fungsionalitas dalam basis kode untuk lulus pengujian unit. Hasil penelitian menunjukkan bahwa monitor CoT berkinerja baik dalam mendeteksi perilaku "reward hacking" yang sistematis, dengan tingkat recall hingga 95%, jauh melebihi 60% perilaku yang hanya dipantau.

GPT-0.64%

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
Gate 2025 Q2 Report Released
10k Popularitas
Gate Derivatives Volume Hits New High
13k Popularitas
CPI Data Incoming
42k Popularitas
4Join Gate VIP to Win MacBook
30k Popularitas
5MicroStrategy Buys More Bitcoin
700 Popularitas
6BTC Hits New High
115k Popularitas
7My Gate Moments
28k Popularitas
8VIP Exclusive Airdrop Carnival
26k Popularitas
9Fed June Meeting Minutes
7k Popularitas
10Gate Alpha Trading Share
15k Popularitas

Sematkan

peta situs