OpenAI GPT-5 Diluncurkan: Kemampuan Model Memimpin Secara Menyeluruh, Langkah Pertama Membangun "Kecerdasan Super"

Penulis: Zhang Yongyi

Setelah mengalami banyak kali "keterlambatan", GPT-5 akhirnya datang.

Pada pukul 1 pagi waktu Beijing pada tanggal 8 Agustus, konferensi pers musim panas OpenAI yang memiliki suasana seperti "Spring Festival Teknologi" generasi baru dimulai.

Berbeda dengan konferensi pers OpenAI sebelumnya yang berlangsung singkat, kali ini OpenAI menyiapkan siaran langsung konferensi selama lebih dari satu jam dengan beberapa tim yang bergiliran tampil, satu menyanyi sementara yang lain tampil, untuk menunjukkan kinerja luar biasa GPT-5 dari berbagai sudut.

Pertama-tama, fokus pada poin penting: GPT-5 telah mengalami peningkatan menyeluruh di berbagai bidang, menduduki peringkat pertama dalam kemampuan teks, WebDev, dan persepsi visual; dalam hal petunjuk keras, pengkodean, matematika, kreativitas, kueri panjang, GPT-5 juga menduduki peringkat pertama. Di bawah pengujian yang disebut "puncak", saat ini mempertahankan skor Arena tertinggi hingga saat ini, bisa dikatakan secara harfiah "menghancurkan semua peringkat".

Sam Altman menyatakan bahwa GPT-4o seperti siswa sekolah menengah, sementara GPT-5 seperti mahasiswa universitas, bahkan menggambarkan GPT-5 sebagai iPhone pertama yang dilengkapi layar retina—"Anda menanyakan satu pertanyaan, mungkin Anda akan mendapatkan jawaban yang benar, mungkin Anda akan mendapatkan beberapa hal yang gila. GPT-4 terasa seperti berbicara dengan seorang mahasiswa universitas. Sedangkan GPT-5, untuk pertama kalinya membuat saya benar-benar merasa seperti sedang berbicara dengan seorang ahli tingkat doktor." Sam Altman memperkenalkan peningkatan kemampuan GPT-5.

Meskipun pengguna aktif mingguan ChatGPT telah mendekati 700 juta, OpenAI sebenarnya belum memiliki model terdepan di industri dalam beberapa waktu terakhir. Sekarang, OpenAI percaya bahwa GPT-5 akan membawanya kembali ke puncak peringkat.

Altman bahkan secara langsung menyatakan dalam konferensi pers: "Ini adalah model dengan kemampuan pengkodean terkuat di dunia, model dengan kemampuan menulis terkuat di dunia, dan juga model terkuat di dunia dalam bidang perawatan kesehatan"

Pada saat yang sama, OpenAI juga menyatakan dalam konferensi pers bahwa, selain kemampuan kode yang sangat tinggi, kemampuan menulis dan akurasi menjawab pertanyaan terkait kesehatan dari GPT-5 juga telah meningkat. Selain itu, GPT-5 tidak hanya mencapai "loncatan besar" dalam kecerdasannya, tetapi juga secara signifikan mengurangi masalah "berbicara omong kosong dengan serius". Ia menunjukkan kinerja yang lebih baik dalam memahami dan mengikuti instruksi, serta kecenderungannya untuk menggoda juga telah berkurang secara signifikan.

01 Selamat tinggal "ilusi", AI menjadi lebih dapat diandalkan

Pertama adalah susunan model dalam pembaruan kali ini, seri GPT-5 terdiri dari empat versi: GPT-5, mini, nano, dan chat, di mana versi Chat dirancang untuk memberikan pengalaman respons yang lebih alami dan lebih cerdas—Anda bahkan dapat menggunakannya untuk belajar bahasa baru.

Selain itu, sekarang ketika Anda membuka halaman ChatGPT, Anda akan terlebih dahulu memperhatikan bahwa GPT-5 ditampilkan sebagai satu model tunggal, bukan sebagai model biasa ditambah dengan model inferensi independen.

Di balik ini sebenarnya adalah sistem router yang dikembangkan oleh OpenAI, yang secara otomatis akan beralih ke versi dengan kemampuan penalaran yang lebih kuat untuk pertanyaan yang lebih kompleks, atau juga akan melakukan ini ketika Anda memberitahunya untuk berpikir keras. (Altman menyebut antarmuka pemilihan model sebelumnya adalah "sebuah kekacauan yang sangat berantakan.")

"AI Halusinasi" selalu menjadi daerah keluhan yang parah bagi banyak orang. Kabar baiknya adalah, GPT-5 telah bekerja keras dalam hal ini, dan pihak resmi mengklaim kemungkinan munculnya halusinasi "secara signifikan menurun". Secara spesifik:

Saat melakukan pencarian online, probabilitas jawaban GPT-5 mengandung kesalahan fakta 45% lebih rendah dibandingkan dengan GPT-4o.

Ketika berpikir secara independen, kemungkinan jawabannya salah bahkan 80% lebih rendah dibandingkan OpenAI o3.

GPT-5 juga telah diuji pada ARC-AGI-2 yang baru. Selain Grok 4 (berpikir), kinerjanya lebih baik daripada semua model utama.

Selain itu, GPT-5 juga menjadi "orang yang jujur". Ia tidak lagi berbohong kepada pengguna, membanggakan diri bahwa ia dapat menyelesaikan tugas yang tidak mungkin. Ketika menghadapi tugas yang tidak dapat diselesaikan, instruksi yang tidak jelas, atau kurangnya alat penting, ia akan lebih jujur dalam mengkomunikasikan keterbatasannya.

Pembaruan kali ini yang paling menarik adalah diperkenalkannya empat mode "kepribadian" baru yang dapat dipilih pengguna. Mereka adalah:

Cynic (Cynic)

Robot (Robot)

Pendengar (Listener)

学霸 (Nerd)

Mode-mode ini bersifat opsional, Anda dapat mengatur cara ChatGPT berinteraksi dan menjawab pertanyaan sesuai dengan preferensi Anda. Apakah Anda ingin ia berdebat dengan Anda, atau mendengarkan seperti teman yang sabar? Sekarang semua itu bisa Anda tentukan.

"Model ini benar-benar memberikan "perasaan" yang baik," kata Nick Turley, kepala ChatGPT, "Saya pikir orang-orang akan merasakannya dengan tulus, terutama mereka yang biasanya tidak banyak mempelajari model."

Selain itu, Anda juga dapat mengubah tema warna untuk jendela obrolan tunggal, para penggemar tema editor kode sangat senang.

02 "Era Generasi Perangkat Lunak Sesuai Permintaan" Datang? Kemampuan Kode yang Luar Biasa

Dengan peningkatan kemampuan kode yang lebih lanjut, Altman memprediksi bahwa kemampuan pengkodean kuat GPT-5 akan membuka era yang disebutnya "generasi perangkat lunak sesuai permintaan."

Dalam pengujian OpenAI, GPT-5 menunjukkan kinerja yang lebih baik daripada model lainnya dalam berbagai pengujian kode seperti SWE-Bench, SWE-Lancer, dan Aider Polyglot. Mencapai skor 42% dalam pengujian akhir manusia, dan 75% dalam pengujian SWE.

Sebuah momen kecil adalah, sumbu koordinat pada gambar ini di konferensi pers jelas memiliki banyak celah, tidak hanya ada kesalahan bodoh seperti 52.8 > 69.1, tetapi juga sebenarnya melebih-lebihkan peningkatan kemampuan GPT-5, di media sosial diejek oleh netizen "PPT ini sepertinya sebaiknya tidak dibuat oleh GPT-5".

Pada konferensi pers, kepala pelatihan lanjutan OpenAI Yann Dubois mendemonstrasikan GPT-5 secara langsung, meminta ia untuk menghasilkan sebuah situs web untuk belajar bahasa Prancis, lengkap dengan permainan interaktif. Dalam beberapa detik, GPT-5 menulis ratusan baris kode dan langsung menampilkan antarmuka depan situs web. Dia berbagi layar di Zoom dan melakukan beberapa klik sederhana, semuanya tampak berjalan dengan sempurna.

Di lokasi konferensi pers, OpenAI juga secara langsung memperlihatkan sebuah permainan 3D yang diciptakan oleh GPT-5 hanya dengan sebuah prompt. Adegan 3D yang diciptakan tidak hanya memiliki gambar yang indah, tetapi efek fisik di dalamnya juga sangat akurat dalam mereproduksi efek yang sesuai.

03 Lebih aman, lebih "jujur"

Menurut Alex Beutel, kepala penelitian keamanan model, OpenAI telah melakukan "lebih dari lima ribu jam" pengujian terhadap GPT-5 untuk memahami risiko keamanannya. Salah satu fokus utamanya adalah "memastikan model tidak berbohong kepada pengguna."

Meskipun ilusi (hallucination) GPT-5 lebih sedikit dibandingkan dengan model inferensi o3 OpenAI, "berbohong dengan percaya diri" tetap menjadi masalah yang melekat pada model bahasa besar. Ketika model mulai menyelesaikan tugas seperti agen (agent), masalah ini menjadi semakin kompleks. Namun, OpenAI menyatakan bahwa GPT-5 lebih baik dalam menangani tugas multi-langkah dengan lebih andal. "Di masa lalu, kami telah melihat model mengklaim telah menyelesaikan suatu tugas, tetapi sebenarnya tidak menyelesaikannya," kata Beutel, "ini adalah masalah."

Untuk pertanyaan yang sebelumnya akan langsung ditolak oleh model, GPT-5 akan menyediakan mekanisme "kompleksi aman" yang disebut OpenAI. Beutel menjelaskan: "Misalnya, seseorang bertanya 'Berapa banyak energi yang dibutuhkan untuk menyalakan bahan tertentu?' Ini bisa menjadi pertanyaan jahat yang mencoba untuk melewati perlindungan keamanan dan menyebabkan kerusakan, atau bisa juga seorang siswa yang ingin memahami sifat fisik bahan. Ini memberikan tantangan nyata bagi model dalam bagaimana merespons."

Dengan "pemenuhan keamanan", GPT-5 "berusaha memberikan jawaban yang seberguna mungkin sambil tetap menjaga batasan keamanan". Model biasanya hanya akan mematuhi sebagian dan memberikan informasi pada tingkat yang lebih makro yang tidak dapat digunakan secara praktis untuk menyebabkan kerusakan.

04 Cara Menggunakan GPT-5

Jadi, pertanyaan yang paling diperhatikan oleh semua orang adalah: bagaimana cara menggunakan GPT-5?

Kabar baiknya adalah, semua pengguna ChatGPT sekarang dapat segera merasakan GPT-5 secara gratis. Ini juga merupakan pertama kalinya OpenAI membuka model terdepan secara gratis untuk semua pengguna. Tentu saja, hak akses pengguna berbeda-beda tergantung levelnya:

Pengguna langganan Plus dapat memiliki lebih banyak penggunaan sebelum mencapai batas penggunaan.

Pengguna berlangganan Pro dapat mengakses versi GPT-5 Pro yang memiliki kemampuan penalaran yang lebih kuat.

Ketika pengguna mencapai batas penggunaan, ChatGPT akan otomatis beralih ke versi "mini" dari GPT-5 untuk menangani permintaan selanjutnya. Sementara itu, seiring peluncuran GPT-5, ia akan secara resmi menggantikan serangkaian model lama seperti GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1, dan GPT-4.5.

Selain itu, bagian penetapan harga Token, versi standar GPT-5 adalah 1,25 dolar untuk setiap satu juta Token input dan 10 dolar untuk setiap satu juta Token output. Versi mini dan versi Nano harganya jauh lebih murah.

Harga yang rinci dapat dilihat pada gambar di bawah yang diambil dari informasi situs resmi.

Selain itu, OpenAI juga merilis parameter baru bernama "Minimal" dalam API, sehingga Anda dapat menggunakan GPT-5 di semua kasus penggunaan hanya dengan mengubah kekuatan penalaran.

Selain platform pihak pertama OpenAI, CEO Microsoft Nadella juga mengumumkan bahwa GPT-5 telah diluncurkan di seluruh platform Microsoft, termasuk Microsoft 365 Copilot, Copilot, GitHub Copilot, dan Azure AI Foundry. Semua perbaikan ini dilatih di Azure.

Akhirnya, Altman menyatakan bahwa misi OpenAI adalah mengembangkan kecerdasan buatan umum (AGI). GPT-5 membuat mereka lebih dekat dengan tujuan ini, meskipun seluruh industri telah mulai beralih ke pembangunan yang disebut "superintelligent."

"Saya sedikit tidak suka dengan istilah AGI karena sekarang setiap orang memiliki definisi yang sedikit berbeda," kata Altman, "tapi ini adalah langkah penting menuju model yang benar-benar kuat. Jelas bahwa dibutuhkan model yang memiliki kecerdasan umum untuk mencapainya."

Namun, dia juga mengakui bahwa dibandingkan dengan AGI yang sebenarnya, GPT-5 masih "kekurangan beberapa hal yang sangat penting."

"Ini bukan model, ini adalah entitas asli yang tumbuh dari hal-hal baru yang ditemukannya, bagi saya, inilah alasan mengapa ia bisa menjadi "benih" AGI." Sam Altman menjelaskan.

GPT-3.97%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)