Mỗi ngày, có một số lượng lớn hoá đơn được các tài xế nhà Min chụp ảnh và gửi về hệ thống để lưu trữ và phục vụ cho công tác quản lý hoạt động của tài xế. Hiện tại loại thông tin này được xử lý bằng công nghệ Nhận dạng Kí tự Quang học (Optical Character Recognition - OCR). Từ dữ liệu hình ảnh nhận được, OCR cho phép nhận diện, khoanh vùng và trích xuất nội dung. Việc ứng dụng OCR vào quy trình xử lý hoá đơn đem lại vô số lợi ích. Trong use case này, OCR giúp lưu trữ và truy xuất dữ liệu một cách có hệ thống về mặt kỹ thuật, và tăng cường rõ rệt mức độ tuân thủ quy trình hoạt động của các tài xế về mặt vận hành. Vậy BAEMIN đã triển khai OCR thế nào? Thay vì xây dựng một mô hình từ đầu, đội ngũ Data sử dụng các thuật toán của PaddleOCR - đây là bộ công cụ cung cấp các mô hình được đào tạo sẵn (pretrained model) với chất lượng cao và cho phép huấn luyện thêm một cách dễ dàng. Vì sao lựa chọn sử dụng mô hình đã được đào tạo trước mà không xây dựng mô hình từ đầu? Có thể kể đến một số khó khăn thường gặp phải trong việc xây dựng mô hình từ đầu như bộ dữ liệu nhỏ, mất cân bằng dữ liệu (imbalanced dataset), ngay cả việc thiết kế được một mô hình có kiến trúc phù hợp cũng là bài toán khó. Do đó, thay vì xây dựng một mô hình từ đầu, đội ngũ Data sử dụng các mô hình được đào tạo sẵn do PaddleOCR cung cấp, sau đó đào tạo thêm nhằm cải thiện độ chính xác và tiết kiệm chi phí và thời gian huấn luyện. Việc đào tạo thêm cho các pretrained model trong use case mà chúng tôi đang giới thiệu được gọi là Transfer Learning: ứng dụng tri thức mà mô hình đã học được từ một lĩnh vực sang một lĩnh vực mới có liên quan. Bằng việc sử dụng Transfer Learning, team Data đã tránh được nhiều bất cập có thể xảy ra khi huấn luyện mô hình một cách đơn lẻ và biệt lập, như tri thức mà mô hình đã học không được duy trì, tích lũy và kế thừa. Transfer Learning giúp mô hình học nhanh hơn, với ít dữ liệu huấn luyện hơn, hiệu năng ban đầu cao hơn, và độ chính xác cũng cao hơn. Cụ thể, với bài toán: - Trích xuất các chuỗi kí tự có trên hoá đơn - Kiểm tra 4 mã số cuối có trên hoá đơn tương ứng với mã số được ghi nhận trên hệ thống Đội ngũ tiếp tục huấn luyện mô hình đã được đào tạo từ PaddleOCR với bộ dữ liệu hoá đơn thật để mô hình này đạt độ chính xác cao hơn. Khi đạt đến hiệu suất được chấp nhận, mô hình đã tinh chỉnh được đưa vào sử dụng. Một mô hình đã chạy trên production không có nghĩa là công việc đã hoàn tất. Trên thực tế, không có mô hình nào hoạt động tốt được mãi, bất chấp sự chuẩn bị kỹ lưỡng và thường xuyên của dữ liệu cả về chất và về lượng. Một nguyên nhân thường gặp trong sự suy giảm chất lượng của mô hình là data drift. Hiện tượng data drift xảy ra khi dữ liệu đầu vào (input) của mô hình có sự thay đổi về mặt phân bổ, làm giảm độ chính xác của mô hình so với lúc ban đầu. Ví dụ, tại BAEMIN, tuỳ thuộc vào nhu cầu kinh doanh và vận hành mà mẫu hoá đơn có thể thay đổi theo thời gian, dẫn đến việc mô hình lúc đầu không còn nhận diện được chính xác nữa. Vì vậy, cần liên tục giám sát mô hình trên môi trường production nhằm huấn luyện lại mô hình với các mẫu dữ liệu mới hoặc đưa ra các logic xử lý phù hợp.

5 tháng 2 năm 2023 am 7:02

 • 

20 lượt lưu36 lượt xem

Bình luận 0