Reducto phát hành Deep Extract

Hôm nay, chúng tôi ra mắt bản cập nhật mạnh mẽ nhất từ trước đến nay cho việc trích xuất có cấu trúc: Deep Extract.

Deep Extract là một phương pháp tạo agent mới để trích xuất, phương pháp này xác minh và sửa lỗi đầu ra của chính nó cho đến khi kết quả chính xác. Tương tự như con người trong vòng lặp (human-in-the-loop), Deep Extract có agent trong vòng lặp (agent-in-the-loop), giúp giảm bớt gánh nặng cho người xem xét thủ công bằng một chu kỳ xác minh tự động, tự chịu trách nhiệm về độ chính xác.

Điều này đặc biệt mạnh mẽ khi bạn xử lý một danh sách dài các mục cần trích xuất — hãy nghĩ đến các dòng mục hóa đơn, giao dịch sao kê môi giới, danh sách thiết bị, v.v. Deep Extract đã trích xuất hơn 28 triệu trường trên các tài liệu dài tới 2.500 trang trong bản beta sản xuất của chúng tôi và chúng tôi tiếp tục mở rộng những gì có thể.

Đối với các tài liệu quan trọng nhất, nó đạt độ chính xác 99–100% cho từng trường, thậm chí còn vượt trội hơn các chuyên gia gắn nhãn thủ công trong các tác vụ trích xuất.

Thách thức với các giải pháp trích xuất dài hiện nay

Trong năm qua, chúng tôi liên tục nhận được phản hồi giống nhau từ khách hàng. Các quy trình trích xuất hiện tại của họ gặp sự cố với các tài liệu dài, phức tạp — hóa đơn hàng chục trang, báo cáo tài chính hàng trăm trang. Tuy nhiên, tổng cộng không khớp và điều đó báo hiệu cho các nhóm rằng các dòng mục đã bị bỏ sót hoàn toàn. Khi chúng tôi hỏi họ xử lý như thế nào, câu trả lời gần như luôn giống nhau: họ đã thuê người để thực hiện quy trình con người trong vòng lặp (HITL) kiểm tra thủ công đầu ra.

Vấn đề không phải là các mô hình kém trong việc đọc tài liệu. Vấn đề là việc trích xuất một lần duy nhất không có cơ chế nào để phát hiện lỗi của chính nó, và các mô hình trở nên lười biếng. Các mô hình có xu hướng đi đường tắt trong các tác vụ dài, lặp đi lặp lại. Với hàng nghìn dòng mục cần trích xuất, chúng thường dừng lại sớm, hợp nhất hoặc bỏ qua các mục nhập thay vì xử lý từng hàng cuối cùng.

Điều này còn được khuếch đại hơn nữa khi cần có trích dẫn. Đối với nhiều khách hàng của chúng tôi, trích dẫn không chỉ là tùy chọn mà là cần thiết để chứng minh đầu ra của họ.

Phương pháp tạo agent của Reducto

Sự phát triển của các agent đường dài và kiến trúc tạo agent đã chỉ ra một con đường tốt hơn. Nếu các agent có thể xử lý đáng tin cậy các tác vụ phức tạp, nhiều bước trong các lĩnh vực khác, thì cùng một phương pháp cũng nên áp dụng cho việc trích xuất: chia nhỏ vấn đề, xác minh công việc và lặp lại cho đến khi đúng.

Deep Extract mang kỷ luật tương tự vào việc trích xuất tự động. Thay vì một lần chạy, nó thực hiện một vòng lặp agentic: trích xuất, xác minh kết quả với tài liệu nguồn, xác định những gì còn thiếu hoặc không nhất quán và trích xuất lại cho đến khi đầu ra đáp ứng ngưỡng chất lượng đã xác định.

Thay vì coi một tài liệu phức tạp là một tác vụ nguyên khối duy nhất, Deep Extract triển khai các sub-agent để chia nhỏ và chinh phục từng phần, đó là những gì cho phép nó duy trì độ chính xác ngay cả trên các tài liệu có hàng nghìn dòng trên hàng trăm trang.

Điều quan trọng là bạn có thể xác định "đúng" trông như thế nào, trực tiếp trong system prompt của bạn. Nếu không có, Deep Extract vẫn có thể tự động xác định một cách thông minh cái nào phù hợp nhất với tác vụ.

Đối với hóa đơn, điều đó có thể là: "đảm bảo tất cả các dòng mục cộng lại bằng tổng đã nêu." Đối với báo cáo tài chính: "xác minh rằng tài sản bằng nợ phải trả cộng với vốn chủ sở hữu." Nếu không có điều này, giải pháp thay thế là một người kiểm tra thủ công từng trường — một quy trình có thể mất hàng giờ hoặc thậm chí hàng ngày tùy thuộc vào độ dài của tài liệu.

Với cờ trích dẫn được bật, đầu ra cũng chứa các bounding box chi tiết cho tất cả các trường được trích xuất. Điều này có thể cực kỳ mạnh mẽ cho các luồng kiểm toán, quy trình xem xét thủ công và bất kỳ ứng dụng nào mà bạn cần truy xuất một giá trị đã trích xuất về vị trí chính xác của nó trong tài liệu gốc.

Deep Extract mở khóa những gì trong các trường hợp sản xuất thực tế

Trong thời gian thử nghiệm beta, chúng tôi đã làm việc chặt chẽ với các đối tác thiết kế của Reducto để đảm bảo Deep Extract có hiệu quả với các tài liệu và trường hợp sử dụng trong thế giới thực. Nhiều nhóm kỹ thuật của họ đã thử tất cả các giải pháp khác trên thị trường, nhưng không có kết quả.

Một số trường hợp sử dụng khác bao gồm trích xuất từ:

Báo cáo thanh toán của quận với số chuyển tiếp, số séc, giá, mô tả, ngày thanh toán và hơn thế nữa
Báo cáo vị thế giao ngay có kỳ hạn với mã hiệu, cơ sở chi phí và lãi/lỗ chưa thực hiện
Hóa đơn nông nghiệp với chi tiết thanh toán như số hóa đơn, số/ngày séc, số tiền thanh toán, khoản khấu trừ, số tiền ròng và hơn thế nữa
Hóa đơn bán gia súc, báo cáo phê duyệt thanh toán của quận, đơn đăng ký giấy phép dân cư và báo cáo chi tiết công việc

Mỗi dòng mục có thể có hơn 10 cột để tính toán, với hàng nghìn trang cho mỗi tài liệu. Chúng tôi đã thấy khách hàng tăng từ 10-20% độ chính xác trường với một mô hình tiên phong lên 99-100% chỉ bằng cách chuyển sang sử dụng Deep Extract của Reducto.

Vì Deep Extract thực hiện nhiều công việc hơn, nên nó mất nhiều thời gian hơn một lệnh gọi trích xuất tiêu chuẩn. Tuy nhiên, so với giải pháp thay thế thực tế là một người xem xét thủ công một báo cáo quỹ 500 trang từng trường một, thì giải pháp này nhanh hơn, rẻ hơn và nhất quán ở quy mô lớn.

Bắt đầu ngay hôm nay

Deep Extract hiện có sẵn dưới dạng cấu hình cho điểm cuối Extract của chúng tôi. Kích hoạt nó bằng cách đặt deep_extract: true trong cài đặt trích xuất của bạn và tùy chọn thêm các tiêu chí xác minh vào system prompt của bạn.

Dành cho nhà phát triển: Tài liệu đầy đủ tại docs.reducto.ai.

Dành cho các nhóm Doanh nghiệp: Nếu bạn đang xử lý các tài liệu quan trọng ở quy mô lớn và muốn thảo luận xem liệu Deep Extract có phù hợp hay không, hãy liên hệ trực tiếp với chúng tôi.

Chúng tôi mong muốn tiếp tục đẩy mạnh các tương tác của chúng tôi với tài liệu.