Codex đang chuyển sang sử dụng dựa trên định giá API cho tất cả người dùng
AI/ML·Hacker News·3 lượt xem

Codex đang chuyển sang sử dụng dựa trên định giá API cho tất cả người dùng

Codex is switching to API pricing based usage for all users

AI Summary

Codex đang chuyển sang mô hình định giá API dựa trên lượng token tiêu thụ trên tất cả các gói, thay thế cho cách tính ước tính mỗi tin nhắn trước đây bằng các mức giá chi tiết cho token đầu vào (input tokens), token trong bộ nhớ đệm (cached tokens) và token đầu ra (output tokens). Thay đổi này giúp các developer kiểm soát chi phí chính xác hơn bằng cách liên kết trực tiếp các lệnh gọi API với việc sử dụng credit, từ đó tối ưu hóa hiệu quả các tương tác với AI model. Các bạn nên theo dõi sát sao lượng token tiêu thụ của mình và hiểu rõ cách các loại token khác nhau ảnh hưởng đến chi phí, đặc biệt lưu ý đến các tính năng như "fast mode" có thể nhân đôi lượng credit sử dụng.

Tìm hiểu cách hoạt động của lãi suất tín dụng Codex trên các gói Plus, Pro, Business và Enterprise/Edu.Tổng quanBài viết này phác thảo lãi suất tín dụng hiện tại cho Codex, theo cơ cấu định giá linh hoạt cho Plus, Pro,...

Tìm hiểu cách tính tín dụng Codex hoạt động trên các gói Plus, Pro, Business và Enterprise/Edu.

Tổng quan

Bài viết này phác thảo tỷ lệ tín dụng hiện tại cho Codex, theo cấu trúc giá linh hoạt cho các gói Plus, Pro, Business và Enterprise/Edu.

Tìm hiểu thêm về tín dụng trong ChatGPT Plus và Pro.

Tìm hiểu thêm về tín dụng trong ChatGPT Business, Enterprise và Edu.

Bảng giá Codex - định giá theo token

Việc sử dụng Codex được định giá dựa trên việc sử dụng token API, được tính bằng tín dụng trên mỗi triệu token đầu vào, token đầu vào đã lưu vào bộ nhớ cache và token đầu ra. Tìm hiểu thêm về token tại đây.

Định dạng này thay thế ước tính trung bình trên mỗi tin nhắn bằng ánh xạ trực tiếp giữa việc sử dụng token và tín dụng. Nó hữu ích nhất khi bạn muốn có cái nhìn rõ ràng hơn về cách đầu vào, đầu vào đã lưu vào bộ nhớ cache và đầu ra ảnh hưởng đến mức tiêu thụ tín dụng.

Theo mô hình này, việc sử dụng tín dụng thực tế phụ thuộc vào sự kết hợp giữa token đầu vào, token đầu vào đã lưu vào bộ nhớ cache và token đầu ra trong mỗi tác vụ. Bảng dưới đây hiển thị tín dụng trên mỗi 1 triệu token cho mỗi loại token.

ModelInput Tokens Cached input tokensOutput Tokens
GPT-5.462.50 credits6.250 credits375 credits
GPT-5.4-Mini18.75 credits1.875 credits113 credits
GPT-5.3-Codex43.75 credits4.375 credits350 credits
GPT-5.2-Codex43.75 credits4.375 credits350 credits
GPT-5.243.75 credits4.375 credits350 credits
GPT-5.1-Codex-Max31.25 credits3.125 credits250 credits
GPT-5.1-Codex-mini6.25 credits0.625 credits50 credits

Lưu ý:

  • Chế độ nhanh tiêu tốn nhiều tín dụng gấp 2 lần.

  • Xem xét mã sử dụng GPT-5.3-Codex.

  • GPT-5.3-Codex-Spark có thể có sẵn trong Codex dưới dạng bản xem trước nghiên cứu - tỷ lệ tín dụng cho mô hình này chưa được chốt.

  • Đọc về giới hạn tốc độ sử dụng Codex.

Trung bình, Codex có giá khoảng 100-200 đô la/nhà phát triển mỗi tháng, mặc dù có sự khác biệt lớn tùy thuộc vào mô hình được sử dụng, số lượng phiên bản người dùng đang chạy, tự động hóa và việc sử dụng chế độ nhanh. Đọc thêm về các thực hành tốt nhất để tối đa hóa giới hạn tốc độ và quản lý mức tiêu thụ token.

Bạn có thể theo dõi việc sử dụng token của không gian làm việc trong cài đặt Codex > bảng điều khiển Usage.

Thẻ giá cũ

Các khách hàng Plus/Pro và Enterprise/Edu hiện tại nên tiếp tục sử dụng thẻ giá cũ hiển thị bên dưới, cho đến khi chúng tôi chuyển bạn sang mức giá mới trong tương lai.

Người dùng Plus/Pro và Edu nên theo dõi thẻ giá này và các trang ghi chú phát hành của chúng tôi để biết thông tin về thời điểm áp dụng mức giá mới.

Các chi tiết cụ thể về việc chuyển đổi, bao gồm cả các mốc thời gian, sẽ được cung cấp cho quản trị viên và chủ sở hữu doanh nghiệp qua email - liên hệ với đại diện bán hàng OpenAI của bạn nếu bạn có câu hỏi về việc chuyển đổi.

Thẻ giá cũ biểu thị việc sử dụng Codex dưới dạng tín dụng trung bình ước tính trên mỗi tin nhắn hoặc yêu cầu kéo. Các giá trị trung bình này hữu ích cho việc lập kế hoạch sơ bộ, nhưng việc sử dụng tín dụng thực tế có thể thay đổi tùy thuộc vào kích thước tác vụ, lựa chọn mô hình và yêu cầu suy luận.

UnitGPT-5.4GPT-5.3-CodexGPT-5.1-Codex-mini
Local Tasks1 message~7 credits~5 credits~1 credit
Cloud Tasks1 message~34 credits~25 creditsNot available
Code Review1 pull request~34 credits~25 creditsNot available

Các giá trị trung bình này cũng áp dụng cho các phiên bản cũ GPT-5.2, GPT-5.2-Codex, GPT-5.1, GPT-5.1-Codex-Max, GPT-5, GPT-5-Codex và GPT-5-Codex-Mini.

Câu hỏi thường gặp

Tại sao có hai thẻ giá Codex?

Chúng tôi đã sửa đổi cách định giá của mình từ tín dụng trên mỗi tin nhắn sang tín dụng trên mỗi loại token được tiêu thụ. OpenAI hỗ trợ cả thẻ giá cũ và thẻ giá cập nhật dựa trên token. Phiên bản áp dụng phụ thuộc vào trạng thái di chuyển của không gian làm việc.

Tôi nên sử dụng thẻ giá nào?

Khách hàng mới và hiện tại của ChatGPT Business, và khách hàng mới của ChatGPT Enterprise nên sử dụng thẻ giá định giá dựa trên token . Khách hàng trên tất cả các gói khác nên sử dụng thẻ giá cũ . Chúng tôi sẽ tiếp tục cập nhật trang này theo thời gian khi chúng tôi di chuyển gói của bạn sang mức giá mới.

Điều gì đã thay đổi trong thẻ giá dựa trên token cập nhật?

Thẻ giá cũ hiển thị tín dụng trung bình ước tính trên mỗi tin nhắn hoặc yêu cầu kéo. Thẻ giá dựa trên token cập nhật hiển thị tín dụng theo loại token và chuyển đổi mức sử dụng được định giá bằng API sang tín dụng.

Tại sao thẻ giá lại được thay đổi?

Tín dụng vẫn là đơn vị định giá cốt lõi mà khách hàng mua và tiêu thụ. Định dạng dựa trên token cập nhật giúp việc sử dụng tín dụng dễ dàng hơn để ánh xạ với hoạt động mô hình thực tế, điều chỉnh giá Codex gần hơn với việc đo lường dựa trên token và cung cấp khả năng hiển thị rõ ràng hơn về cách đầu vào, đầu vào đã lưu vào bộ nhớ cache và đầu ra đóng góp vào tổng mức sử dụng.

Điều này ảnh hưởng đến giá của tôi như thế nào?

Tác động phụ thuộc vào sự kết hợp khối lượng công việc của bạn. Một số người dùng có thể thấy mức tiêu thụ tín dụng cao hơn, trong khi những người khác có thể thấy mức tiêu thụ tín dụng thấp hơn, tùy thuộc vào lượng đầu vào, đầu vào đã lưu vào bộ nhớ cache và đầu ra mà tác vụ của họ sử dụng. Các tác vụ nặng về đầu ra và chế độ nhanh thường tiêu tốn nhiều tín dụng hơn các tác vụ nhẹ hơn.

Tác giả: ccmcarey

#discussion