OpenAI GPT-5 ra mắt: Khả năng mô hình hoàn toàn "chặt chém", bước đầu xây dựng "siêu trí tuệ"

Tác giả: Trương Dũng Nghị

Sau vô số lần "trễ hẹn", GPT-5 cuối cùng đã đến.

Vào lúc 1 giờ sáng ngày 8 tháng 8 theo giờ Bắc Kinh, hội nghị mùa hè của OpenAI với dáng vẻ như một "buổi biểu diễn công nghệ mùa xuân" thế hệ mới đã chính thức bắt đầu.

Khác với hội nghị ra mắt nhanh chóng trước đây của OpenAI, lần này OpenAI đã chuẩn bị một buổi phát sóng ra mắt dài hơn một giờ với nhiều nhóm người lần lượt xuất hiện, bạn hát xong tôi lên sân khấu, từ nhiều góc độ khác nhau trình diễn hiệu suất mạnh mẽ của GPT-5.

Trước tiên, nói về điểm chính: GPT-5 đã có sự cải thiện toàn diện trong nhiều lĩnh vực, đứng đầu trong các lĩnh vực văn bản, WebDev và khả năng nhận thức hình ảnh; GPT-5 đứng đầu trong các khía cạnh như gợi ý cứng, lập trình, toán học, sáng tạo, truy vấn dài, dưới bài kiểm tra mang mã hiệu "Thượng đỉnh", hiện đang giữ điểm Arena cao nhất cho đến nay, có thể nói là "hủy diệt bảng xếp hạng" theo nghĩa đen.

Sam Altman cho biết, GPT-4o giống như một học sinh trung học, trong khi GPT-5 giống như một sinh viên đại học, thậm chí mô tả GPT-5 là chiếc iPhone đầu tiên được trang bị màn hình hiển thị võng mạc - "Bạn hỏi nó một câu hỏi, có thể bạn sẽ nhận được câu trả lời đúng, có thể bạn sẽ nhận được một số điều điên rồ. GPT-4 thì cảm giác như đang trò chuyện với một sinh viên đại học. Còn GPT-5, là lần đầu tiên khiến tôi thực sự cảm thấy như đang trò chuyện với một chuyên gia cấp tiến sĩ." Sam Altman đã giới thiệu về sự nâng cao khả năng của GPT-5.

Mặc dù số người dùng hoạt động hàng tuần của ChatGPT gần 700 triệu, nhưng OpenAI thực tế đã không sở hữu mô hình tiên tiến hàng đầu trong ngành trong một thời gian. Giờ đây, OpenAI tin rằng GPT-5 sẽ giúp họ quay trở lại vị trí số 1 trong bảng xếp hạng.

Altman thậm chí đã tuyên bố trực tiếp trong buổi họp báo: "Đây là mô hình có khả năng lập trình mạnh nhất thế giới, là mô hình có khả năng viết mạnh nhất thế giới, và cũng là mô hình mạnh nhất thế giới trong lĩnh vực chăm sóc sức khỏe."

Đồng thời, OpenAI cũng tuyên bố trong buổi họp báo rằng, ngoài khả năng lập trình vượt trội, khả năng viết lách và độ chính xác trong việc trả lời các câu hỏi liên quan đến sức khỏe của GPT-5 cũng đã cải thiện đáng kể. GPT-5 không chỉ đạt được "bước nhảy vọt khổng lồ" về trí thông minh, mà còn giảm thiểu đáng kể vấn đề "nói nhảm một cách nghiêm túc". Nó thể hiện sự xuất sắc hơn trong việc hiểu và tuân theo các chỉ dẫn, đồng thời xu hướng nịnh bợ cũng đã giảm đi nhiều.

01 Tạm biệt "ảo giác", AI đã đáng tin cậy hơn

Trước tiên là đội hình mô hình trong bản cập nhật này, dòng GPT-5 bao gồm bốn phiên bản là GPT-5, mini, nano, chat, trong đó phiên bản Chat tương ứng với trải nghiệm phản hồi tự nhiên và thông minh hơn - bạn thậm chí có thể sử dụng nó để học một ngôn ngữ mới.

Ngoài ra, bây giờ khi bạn mở trang web ChatGPT, bạn sẽ thấy rằng GPT-5 được trình bày như một mô hình duy nhất, chứ không phải là một mô hình thông thường cộng với một mô hình suy diễn độc lập.

Thực chất, đây là một hệ thống định tuyến (router) được phát triển bởi OpenAI, nó sẽ tự động chuyển sang phiên bản có khả năng suy luận mạnh hơn cho các truy vấn phức tạp hơn, hoặc cũng sẽ làm như vậy khi bạn yêu cầu nó cố gắng suy nghĩ. (Altman nói rằng giao diện chọn mô hình trước đây là "một mớ hỗn độn rất nghiêm trọng.")

"AI ảo giác" luôn là khu vực mọi người phàn nàn nhiều nhất. Tin tốt là, GPT-5 đã nỗ lực rất nhiều trong lĩnh vực này, và chính thức tuyên bố rằng khả năng tạo ra ảo giác đã "giảm đáng kể". Cụ thể là:

Khi tìm kiếm trực tuyến, xác suất GPT-5 đưa ra câu trả lời sai sự thật thấp hơn 45% so với GPT-4o.

Khi suy nghĩ độc lập, khả năng trả lời sai còn thấp hơn 80% so với OpenAI o3.

GPT-5 cũng đã được kiểm tra trên ARC-AGI-2 mới. Ngoài Grok 4 (Suy nghĩ), nó vượt trội hơn tất cả các mô hình chính.

Ngoài ra, GPT-5 còn trở thành một "người thật thà". Nó không còn thường xuyên nói dối người dùng, khoe khoang về khả năng hoàn thành những nhiệm vụ không thể thực hiện. Khi gặp phải những nhiệm vụ không thể hoàn thành, chỉ dẫn không rõ ràng hoặc thiếu công cụ quan trọng, nó sẽ giao tiếp một cách trung thực hơn về những giới hạn của mình.

Điểm thú vị nhất trong lần cập nhật này là việc giới thiệu bốn chế độ "nhân cách" hoàn toàn mới, người dùng có thể tự do lựa chọn. Chúng lần lượt là:

Chó hoài nghi (Cynic)

Robot (Robot)

Người lắng nghe (Listener)

Học bá (Nerd)

Các chế độ này là tùy chọn, bạn có thể thiết lập cách ChatGPT tương tác và trả lời câu hỏi của bạn theo sở thích của mình. Bạn muốn nó tranh luận với bạn hay lắng nghe như một người bạn kiên nhẫn? Bây giờ mọi thứ đều do bạn quyết định.

"Mô hình này thực sự mang lại cảm giác rất tốt," Nick Turley, người phụ trách ChatGPT, cho biết, "Tôi nghĩ rằng mọi người sẽ cảm nhận được điều này một cách chân thật, đặc biệt là những người dùng bình thường không thường xuyên nghiên cứu về mô hình."

Ngoài ra, bạn cũng có thể thay đổi chủ đề màu cho từng cửa sổ trò chuyện, những người yêu thích chủ đề trình chỉnh sửa mã sẽ rất vui mừng.

02 Thời đại "Phần mềm tạo theo yêu cầu" đã đến? Năng lực lập trình vượt trội

Với sự nâng cao khả năng lập trình, Altman dự đoán rằng khả năng lập trình mạnh mẽ của GPT-5 sẽ mở ra một thời đại mà ông gọi là "tạo phần mềm theo yêu cầu".

Trong các bài kiểm tra của OpenAI, GPT-5 đã thể hiện tốt hơn bất kỳ mô hình nào khác trong nhiều bài kiểm tra chuẩn mã hóa như SWE-Bench, SWE-Lancer và Aider Polyglot. Đạt được 42% trong bài kiểm tra cuối cùng của con người và 75% trong bài kiểm tra chuẩn SWE.

Một chi tiết nhỏ là, trục tọa độ của hình ảnh trong buổi họp báo rõ ràng có nhiều điểm đáng chê bai, không chỉ có lỗi ngớ ngẩn như 52.8 > 69.1, mà còn thực sự phóng đại khả năng nâng cao của GPT-5, đã bị người dùng trên mạng xã hội chế nhạo "PPT này tốt nhất đừng để GPT-5 làm".

Tại buổi họp báo, Yann Dubois, người phụ trách đào tạo sau của OpenAI, đã sử dụng GPT-5 để trình diễn trực tiếp, yêu cầu nó tạo ra một trang web để học tiếng Pháp, kèm theo các trò chơi tương tác. Chỉ trong vài giây, GPT-5 đã viết hàng trăm dòng mã và trực tiếp trình bày giao diện phía trước của trang web. Ông đã chia sẻ màn hình trên Zoom và thực hiện một số thao tác nhấp chuột đơn giản, mọi thứ trông đều hoạt động hoàn hảo.

Tại buổi ra mắt, OpenAI còn trực tiếp trình diễn một trò chơi 3D được tạo ra chỉ với một đoạn từ khóa từ GPT-5. Cảnh 3D mà nó tạo ra không chỉ có hình ảnh tinh xảo, mà các hiệu ứng vật lý trong đó cũng rất chính xác phản ánh lại hiệu ứng tương ứng.

03 An toàn hơn, "thành thật" hơn

Theo Alex Beutel, người phụ trách nghiên cứu an toàn mô hình, để hiểu được các rủi ro an toàn của nó, OpenAI đã thực hiện "hơn năm nghìn giờ" kiểm tra đối với GPT-5. Một trong những trọng tâm là "đảm bảo rằng mô hình không nói dối người dùng."

Mặc dù ảo giác (hallucination) của GPT-5 ít hơn so với mô hình suy luận o3 của OpenAI, nhưng "nói dối một cách tự tin" vẫn là vấn đề vốn có của các mô hình ngôn ngữ lớn. Khi mô hình bắt đầu thực hiện nhiệm vụ như một tác nhân (agent), vấn đề này sẽ trở nên phức tạp hơn. Tuy nhiên, OpenAI cho biết, GPT-5 thực hiện tốt hơn trong việc xử lý các nhiệm vụ nhiều bước một cách đáng tin cậy. "Trong quá khứ, chúng tôi đã thấy mô hình tuyên bố đã hoàn thành một nhiệm vụ nào đó, nhưng thực tế là không hoàn thành," Beutel nói, "đó là một vấn đề."

Đối với những gợi ý mà trước đây sẽ bị từ chối trả lời, GPT-5 sẽ cung cấp cơ chế "hoàn thành an toàn" (safe completions) mà OpenAI nói đến. Beutel giải thích: "Chẳng hạn, nếu ai đó hỏi 'Cần bao nhiêu năng lượng để đốt cháy một loại vật liệu cụ thể?', điều này có thể là một câu hỏi ác ý nhằm cố gắng vượt qua các biện pháp bảo vệ an toàn để gây hại, hoặc có thể là một sinh viên muốn hiểu các đặc tính vật lý của vật liệu. Điều này thực sự đặt ra thách thức cho mô hình trong cách phản hồi."

Thông qua "bổ sung an toàn", GPT-5 "cố gắng đưa ra câu trả lời có thể hữu ích nhất trong khi vẫn giữ được các ràng buộc an toàn". Mô hình thường chỉ tuân theo một phần và cung cấp một số thông tin có thể không được sử dụng thực tế để gây hại, ở mức độ vĩ mô hơn.

04 Làm thế nào để sử dụng GPT-5

Vậy, câu hỏi mà mọi người quan tâm nhất đã đến: Làm thế nào để có thể sử dụng GPT-5?

Tin tốt là tất cả người dùng ChatGPT đều có thể trải nghiệm miễn phí GPT-5 ngay lập tức. Đây cũng là lần đầu tiên OpenAI mở cửa mô hình tiên tiến miễn phí cho tất cả người dùng. Tất nhiên, quyền truy cập của người dùng khác nhau tùy theo cấp độ.

Người dùng đăng ký Plus có thể có nhiều lần sử dụng hơn trước khi đạt đến giới hạn sử dụng.

Người dùng đăng ký Pro có thể truy cập phiên bản GPT-5 Pro với khả năng suy diễn mạnh mẽ hơn.

Khi người dùng đạt đến giới hạn sử dụng, ChatGPT sẽ tự động chuyển sang một phiên bản "mini" của GPT-5 để xử lý các yêu cầu tiếp theo. Đồng thời, với sự ra mắt của GPT-5, nó sẽ chính thức thay thế một loạt các mô hình cũ như GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 và GPT-4.5.

Ngoài ra, phần định giá Token, phiên bản tiêu chuẩn GPT-5 có giá 1,25 USD cho mỗi triệu Token đầu vào và 10 USD cho mỗi triệu Token đầu ra. Phiên bản mini và phiên bản Nano có giá rẻ hơn nhiều.

Chi tiết giá cả có thể tham khảo từ hình ảnh dưới đây được trích từ thông tin trên trang web chính thức.

Ngoài ra, OpenAI cũng đã phát hành một tham số mới có tên là "Minimal" trong API, để bạn có thể sử dụng GPT-5 trong tất cả các trường hợp, chỉ cần thay đổi cường độ suy luận.

Ngoài nền tảng từ OpenAI, CEO Microsoft Satya Nadella cũng đã công bố rằng GPT-5 đã được triển khai trên toàn bộ nền tảng của Microsoft, bao gồm Microsoft 365 Copilot, Copilot, GitHub Copilot và Azure AI Foundry. Tất cả những cải tiến này đều được đào tạo trên Azure.

Cuối cùng, Altman cho biết, sứ mệnh của OpenAI là phát triển trí tuệ nhân tạo tổng quát (AGI). GPT-5 đã giúp họ tiến gần hơn đến mục tiêu này, mặc dù toàn ngành đã bắt đầu chuyển sang xây dựng cái gọi là "siêu trí tuệ".

"Tôi hơi ghét từ AGI này vì bây giờ ai cũng có định nghĩa hơi khác nhau về nó," Altman nói, "nhưng đây là một bước quan trọng hướng tới việc phát triển mô hình thực sự mạnh mẽ. Rõ ràng là cần có một mô hình sở hữu trí thông minh tổng quát để làm được điều đó."

Tuy nhiên, ông cũng thừa nhận rằng so với AGI thực sự, GPT-5 vẫn "thiếu một số điều rất quan trọng."

"Đây không phải là một mô hình, mà là một thực thể nguyên sinh phát triển từ những điều mới mà nó khám phá ra, đối với tôi, đó chính là lý do tại sao nó có thể trở thành "hạt giống" của AGI." Sam Altman đã giới thiệu như vậy.

GPT-3.97%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
Không có bình luận
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)