GPT-4 Cheat Sheet: GPT-4 là gì và nó có khả năng gì?

GPT-4 có khả năng cải thiện đến mức nào so với các mô hình trước đó? Hãy cùng tìm hiểu về chi phí và khả năng của nó nhé.

Image: LALAKA/Adobe Stock

GPT-4 là một hệ thống trí tuệ nhân tạo mô hình ngôn ngữ lớn có khả năng mô phỏng giọng nói và tư duy giống như con người. Điều này được thực hiện thông qua việc huấn luyện trên một thư viện lớn chứa nhiều loại giao tiếp của con người, từ các tác phẩm văn học kinh điển đến những phần lớn của Internet.

Trí tuệ nhân tạo của loại này xây dựng trên quá trình huấn luyện để dự đoán ký tự nào, số nào hoặc ký tự khác có khả năng xuất hiện tiếp theo trong chuỗi. Tờ cẩm nang này khám phá GPT-4 ở mức độ cao: cách truy cập GPT-4 cho mục đích sử dụng cá nhân hoặc doanh nghiệp, người nào đã tạo ra nó và cách nó hoạt động.

GPT-4 là gì?

GPT-4 là một mô hình đa phương tiện lớn có thể mô phỏng văn xuôi, nghệ thuật, video hoặc âm thanh tạo ra bởi con người. GPT-4 có khả năng giải quyết vấn đề bằng văn bản hoặc tạo ra văn bản hoặc hình ảnh sáng tạo. GPT-4 là thế hệ thứ tư của mô hình cơ sở của OpenAI.

GPT-4 API, cũng như các API GPT-3.5 Turbo, DALL·E và Whisper, hiện đã chính thức có sẵn từ ngày 7 tháng 7 năm 2023.

Vào ngày 6 tháng 11 năm 2023, OpenAI thông báo về thế hệ tiếp theo của GPT-4, GPT-4 Turbo.

Ai sở hữu GPT-4?

GPT-4 thuộc sở hữu của OpenAI, một công ty trí tuệ nhân tạo độc lập có trụ sở tại San Francisco. OpenAI được thành lập vào năm 2015; ban đầu nó hoạt động như một tổ chức phi lợi nhuận nhưng sau đó đã chuyển sang mô hình có lợi nhuận. OpenAI đã nhận được nguồn tài trợ từ Elon Musk, Microsoft, Amazon Web Services, Infosys và các nhà đầu tư doanh nghiệp và cá nhân khác.

OpenAI cũng đã phát triển ChatGPT, một chatbot miễn phí được tạo ra từ mô hình thế hệ trước, GPT-3.5, và DALL-E, một mô hình học sâu tạo hình ảnh. Khi công nghệ ngày càng cải thiện và mở rộng khả năng, OpenAI tiết lộ ít thông tin hơn về cách các giải pháp trí tuệ nhân tạo của họ được huấn luyện.

GPT-4 được phát hành khi nào? OpenAI thông báo về việc phát hành GPT-4 vào ngày 14 tháng 3 năm 2023. GPT-4 ngay lập tức được cung cấp cho các đăng ký thuê bao ChatGPT Plus, trong khi người dùng khác quan tâm cần tham gia danh sách chờ để có quyền truy cập.

Xem thêm: Salesforce tích hợp trí tuệ nhân tạo tạo ra sản phẩm dịch vụ và bán hàng của mình. (TechRepublic)

Làm thế nào để truy cập GPT-4? Phiên bản công khai của GPT-4 có sẵn tại trang web cổng thông tin ChatGPT.

Vào ngày 7 tháng 7 năm 2023, OpenAI đã công bố API GPT-4 cho việc sử dụng chung cho “tất cả các nhà phát triển API hiện có có lịch sử thanh toán thành công.” OpenAI cũng dự kiến mở quyền truy cập cho những nhà phát triển mới vào cuối tháng 7 năm 2023. Giới hạn tốc độ có thể được nâng sau thời kỳ đó tùy thuộc vào lượng nguồn tính toán có sẵn.

Vào tháng 8 năm 2023, GPT-4 đã được đóng gói làm một phần của ChatGPT Enterprise. Người dùng của gói đăng ký dành cho doanh nghiệp nhận được sử dụng không giới hạn của một đường ống tốc độ cao đến GPT-4.

GPT-4 có giá sử dụng như thế nào?

Đối với cá nhân, việc sử dụng dịch vụ đăng ký ChatGPT Plus có giá 20 đô la mỗi tháng.

Giá sử dụng API GPT-4 chỉ với văn bản bắt đầu từ 0,03 đô la cho mỗi 1.000 token của câu hỏi (một token tương đương khoảng bốn ký tự tiếng Anh) và 0,06 đô la cho mỗi 1.000 token của kết quả (đầu ra), theo thông báo từ OpenAI. (OpenAI giải thích thêm về cách đếm token tại đây.)

Một lựa chọn thứ hai với độ dài bối cảnh lớn hơn – khoảng 50 trang văn bản – được gọi là gpt-4-32k cũng có sẵn. Lựa chọn này có giá 0,06 đô la cho mỗi 1.000 token của câu hỏi và 0,12 đô la cho mỗi 1.000 token của kết quả.

Các dịch vụ hỗ trợ trí tuệ nhân tạo khác như Microsoft Copilot và GitHub’s Copilot X hiện đang chạy trên nền tảng GPT-4.

ChatGPT Cheat Sheets

Các khả năng của GPT-4 là gì?

Giống như bản tiền nhiệm của nó là GPT-3.5, điểm nổi bật chính của GPT-4 là khả năng tạo ra đầu ra phản ứng theo các câu hỏi ngôn ngữ tự nhiên và các yêu cầu khác. OpenAI cho biết GPT-4 có thể “tuân theo các chỉ dẫn phức tạp trong ngôn ngữ tự nhiên và giải quyết các vấn đề khó khăn một cách chính xác.” Cụ thể, GPT-4 có thể giải các bài toán toán học, trả lời câu hỏi, suy luận hoặc kể chuyện. Ngoài ra, GPT-4 có khả năng tóm tắt các đoạn văn lớn, điều này có thể hữu ích cho việc tham khảo của người tiêu dùng hoặc các trường hợp sử dụng doanh nghiệp, chẳng hạn như một y tá tóm tắt kết quả của họ sau khi thăm một bệnh nhân.

OpenAI đã kiểm tra khả năng của GPT-4 trong việc lặp lại thông tin theo một trình tự có logic bằng nhiều bài kiểm tra kỹ năng, bao gồm kỳ thi AP và Olympiad cũng như kỳ thi Bar thống nhất. Model đạt điểm ở khoảng 90% trên kỳ thi Bar và 93% trên kỳ thi SAT về Đọc và Viết dựa trên Bằng chứng. GPT-4 đạt điểm khác nhau trên các kỳ thi AP.

Những bài kiểm tra này không phải là kiểm tra kiến thức thực sự; thay vào đó, việc chạy GPT-4 qua các bài kiểm tra tiêu chuẩn chỉ ra khả năng của mô hình tạo ra câu trả lời có vẻ chính xác từ lượng văn bản và nghệ thuật đã được huấn luyện sẵn.

GPT-4 dự đoán xem token nào có khả năng xuất hiện tiếp theo trong một chuỗi. (Một token có thể là một phần của một chuỗi số, chữ cái, khoảng trắng hoặc ký tự khác.) Mặc dù OpenAI giữ kín thông tin cụ thể về quá trình đào tạo của GPT-4, mô hình ngôn ngữ sinh tự nhiên thường được huấn luyện bằng cách chuyển đổi thông tin trong một tập dữ liệu thành các token; sau đó, tập dữ liệu thường được làm sạch để loại bỏ dữ liệu nhiễu hoặc lặp lại. Tiếp theo, các công ty trí tuệ nhân tạo thường sử dụng phương pháp học tăng cường để đưa mô hình về phía các phản ứng có ý nghĩa thông thường. Trong giai đoạn này, các trọng số, đơn giản là các tham số cho biết cho trí tuệ nhân tạo những khái niệm nào liên quan đến nhau, có thể được điều chỉnh.

API Hoàn thiện Cuộc trò chuyện và các nâng cấp của nó

API Hoàn thiện Cuộc trò chuyện cho phép các nhà phát triển sử dụng API GPT-4 thông qua định dạng yêu cầu văn bản tự do. Với nó, họ có thể xây dựng chatbot hoặc các chức năng khác yêu cầu cuộc trò chuyện qua lại. API Hoàn thiện Cuộc trò chuyện đã có sẵn lần đầu vào tháng 6 năm 2020.

Vào tháng 1 năm 2024, API Hoàn thiện Cuộc trò chuyện sẽ được nâng cấp để sử dụng các mô hình hoàn thiện mới hơn. Các mô hình ada, babbage, curie và davinci của OpenAI sẽ được nâng cấp lên phiên bản 002, trong khi các nhiệm vụ Hoàn thiện Cuộc trò chuyện sử dụng các mô hình khác sẽ chuyển sang gpt-3.5-turbo-instruct.

Tinh chỉnh tốc độ GPT-3.5 Turbo và tin tức khác

Ngày 22 tháng 8 năm 2023, OpenAPI thông báo về sự có sẵn của tinh chỉnh tốc độ cho GPT-3.5 Turbo. Điều này cho phép nhà phát triển tùy chỉnh mô hình và kiểm tra những mô hình tùy chỉnh đó cho các trường hợp sử dụng cụ thể của họ.

Vào tháng 1 năm 2023, OpenAI phát hành phiên bản mới nhất của API Kiểm duyệt, giúp nhà phát triển xác định văn bản có thể gây hại. Phiên bản mới nhất được biết đến với tên là text-moderation-007 và hoạt động theo các Quy tắc an toàn tốt nhất của OpenAI.

Bing Chat là gì?

Bing Chat của Microsoft là một trợ lý trí tuệ nhân tạo được triển khai như một thanh bên cùng với công cụ tìm kiếm Bing. Người dùng có thể yêu cầu nó trả lời câu hỏi hoặc tạo ra hình ảnh. Bing Chat chạy trên nền tảng GPT-4. Nó khác biệt với ChatGPT bởi khả năng ghi nhớ các cuộc trò chuyện trước đó, tuy nhiên đôi khi khả năng này không đáp ứng kỳ vọng của người dùng.

Bing Chat yêu cầu người dùng có tài khoản Microsoft và sử dụng trình duyệt Edge.

Ngoài ra, Microsoft cung cấp Bing Chat Enterprise, giới thiệu bảo vệ dữ liệu và các chức năng bổ sung cho Bing Chat. Quản trị viên có thể cung cấp quyền truy cập quản lý vào Bing Chat Enterprise thông qua Microsoft Entra ID (Azure Active Directory).

Những hạn chế của GPT-4 trong lĩnh vực kinh doanh là gì?

Giống như các công cụ Trí tuệ Nhân tạo khác trong dạng của nó, GPT-4 có những hạn chế. Ví dụ, GPT-4 không kiểm tra xem các tuyên bố của nó có chính xác hay không. Quá trình huấn luyện trên văn bản và hình ảnh từ khắp nơi trên Internet có thể làm cho các phản ứng của nó trở nên không có logic hoặc kích động. Tuy nhiên, OpenAI đã tích hợp kiểm soát kỹ thuật số và người huấn luyện để cố gắng duy trì đầu ra sao cho hữu ích và phù hợp với môi trường doanh nghiệp nhất có thể.

Hơn nữa, GPT-4 thường tạo ra ‘ảo giác,’ đó là thuật ngữ Trí tuệ Nhân tạo chỉ sự không chính xác. Những từ của nó có thể hợp lý khi được xếp theo trình tự do chúng dựa trên xác suất được thiết lập bởi những gì hệ thống được huấn luyện, nhưng chúng không được kiểm tra chính xác hoặc liên quan trực tiếp đến các sự kiện thực tế. OpenAI đang nỗ lực giảm số lượng thông tin sai lệch mô hình tạo ra.

Một hạn chế lớn khác là câu hỏi về việc liệu thông tin doanh nghiệp nhạy cảm được cung cấp cho GPT-4 có được sử dụng để huấn luyện mô hình và tiết lộ dữ liệu đó cho bên ngoại không. Microsoft, có thỏa thuận bán lại với OpenAI, dự định cung cấp phiên bản ChatGPT riêng tư cho các công ty vào cuối quý hai năm 2023, theo một báo cáo vào tháng 4.

Giống như GPT-3.5, GPT-4 không tích hợp thông tin cập nhật hơn tháng 9 năm 2021 vào từ vựng của mình. Một trong những đối thủ của GPT-4, Google Bard, có thông tin cập nhật đến phút vì nó được huấn luyện trên Internet đương đại.

Trí tuệ Nhân tạo có thể gặp vấn đề về sự sụp đổ của mô hình khi được huấn luyện trên dữ liệu được tạo ra bởi Trí tuệ Nhân tạo; vấn đề này đang trở nên phổ biến hơn khi các mô hình Trí tuệ Nhân tạo ngày càng tăng lên.

GPT-4 so với GPT-3.5 hoặc ChatGPT

Mô hình gần đây thứ hai của OpenAI, GPT-3.5, khác biệt với thế hệ hiện tại ở một số điểm. OpenAI không tiết lộ kích thước của mô hình mà GPT-4 được huấn luyện, nhưng nói rằng nó “có nhiều dữ liệu và tính toán hơn” so với hàng tỷ tham số mà ChatGPT được huấn luyện. GPT-4 cũng thể hiện sự khéo léo hơn khi viết một loại văn bản đa dạng hơn, bao gồm cả hư cấu.GPT-4 thực hiện tốt hơn ChatGPT trên các bài kiểm tra tiêu chuẩn được đề cập ở trên. Câu trả lời cho các yêu cầu của chatbot có thể ngắn gọn hơn và dễ phân tích hơn. OpenAI lưu ý rằng GPT-3.5 Turbo sánh kịp hoặc vượt trội so với GPT-4 trong một số nhiệm vụ tùy chỉnh.Ngoài ra, GPT-4 tốt hơn GPT-3.5 trong việc đưa ra quyết định kinh doanh, chẳng hạn như lên lịch hoặc tóm tắt. GPT-4 “ít 82% khả năng phản ứng lại yêu cầu về nội dung không được phép và nhiều 40% khả năng tạo ra các câu trả lời có tính chất thực tế,” OpenAI nói.XEM THÊM: Học cách sử dụng ChatGPT. (TechRepublic Academy)Một sự khác biệt lớn khác giữa hai mô hình là GPT-4 có thể xử lý hình ảnh. Nó có thể phục vụ như một hỗ trợ hình ảnh, mô tả các đối tượng trong thế giới thực hoặc xác định các yếu tố quan trọng nhất của một trang web và mô tả chúng.”Trong một loạt các lĩnh vực – bao gồm tài liệu có văn bản và hình ảnh, sơ đồ hoặc ảnh chụp màn hình – GPT-4 có khả năng tương tự như nó trên đầu vào chỉ với văn bản,” OpenAI mô tả trong tài liệu của GPT-4.

Có đáng nâng cấp lên GPT-4 không?

Việc nâng cấp lên GPT-4 có đáng giá đối với doanh nghiệp của bạn hay không là một quyết định chủ yếu phụ thuộc vào các trường hợp sử dụng của bạn và liệu bạn đã đạt được thành công với trí tuệ nhân tạo ngôn ngữ tự nhiên hay không. Xem xét các khả năng và hạn chế được liệt kê ở trên, và xem xét nơi mà GPT-4 có thể giúp tiết kiệm thời gian hoặc giảm chi phí; ngược lại, xem xét công việc nào có thể hưởng lợi đáng kể từ kiến thức, kỹ năng và trí tuệ thông thường của con người.

Những xu hướng mới nhất của GPT-4 Microsoft đã thông báo vào đầu tháng 8 rằng sự có sẵn của GPT-4 trong Dịch vụ Azure OpenAI đã mở rộng đến một số khu vực mới.

Đến tháng 11 năm 2023, người dùng đang tìm hiểu về việc tinh chỉnh GPT-3.5 có thể đăng ký tham gia Chương trình Truy cập thử nghiệm tinh chỉnh GPT-4.

OpenAI cũng đã triển khai chương trình

Mô hình Tùy chỉnh, cung cấp sự tùy chỉnh hơn nhiều so với những gì tinh chỉnh cho phép. Tổ chức có thể đăng ký cho một số lượng hạn chế các khe (bắt đầu từ 2-3 triệu đô la) tại đây.

Tại hội nghị DevDay đầu tiên của OpenAI vào tháng 11, OpenAI đã cho thấy rằng GPT-4 Turbo có thể xử lý nhiều nội dung hơn trong cùng một lần (hơn 300 trang của một cuốn sách tiêu chuẩn) so với GPT-4. GPT-4 Turbo đã có sẵn trong bản xem trước kể từ tháng 11. OpenAI giảm giá GPT-4 Turbo vào tháng 11 năm 2023. Giá của GPT-3.5 Turbo đã được giảm nhiều lần, lần gần đây nhất là vào tháng 1 năm 2024.