API OCR – Optical Character Recognition


  • URL http://viettelgroup.ai/cv/api/v1/ocr

  • Method POST

  • Header Paramter “Content-Type: multipart/form-data"

Dữ liệu gửi lên

Request: multipart upload file với thông tin:

"name"='file','filename'=$FILE_PATH

Dữ liệu gửi lên là hình của bài báo được truyền qua trường file

Loại file hỗ trợ 'bmp', 'png', 'jpg', 'jpeg', 'tif', 'tiff', 'PNG'

Success Response

Code: 200
Content: inputstream (Json default format)

Mô tả các tham số

Thuộc tính Value Description
id Int Chỉ mục của đầu vào được khai báo dùng để phân biệt kết quả OCR của các trang của file pdf hoặc hình ảnh của file tff, với input đầu vào chỉ có 1 ảnh sẽ mặc định là 1
position Array Chứa đựng vị trí của từng từ, mỗi từ gồm các trường (x,y,w,h (bouding box của từ) trong đó tọa độ x y của điểm bên trái trên cùng và w h là chiều rộng và chiều cao của bouding box), word (nội dung)
textline Array Chứa đựng vị trí của 1 textline, mỗi từ gồm các trường (x,y,w,h (bouding box của từ) trong đó tọa độ x y của điểm bên trái trên cùng và w h là chiều rộng và chiều cao của bouding box), text (nội dung)

Hỗ trợ việc trả file word

  • URL http://10.240.17.141:8176/response_word

  • Method: POST

  • Header Paramter: “Content-Type: multipart/form-data”

Dữ liệu gửi lên

-Dữ liệu gửi lên là hình của bài báo được truyền qua trường file

-Loại file hỗ trợ 'bmp', 'png', 'jpg', 'jpeg', 'tif', 'tiff', 'PNG'

-Dữ liệu trả về là 1 file word

Ví dụ :

curl -o [name doc].docx -X POST 10.240.17.141:8176/response_word -F "file=@{file image}"
Nội dung