API NLP – Part-of-Speech Tagging (Gán nhãn từ loại)


  • URL http://viettelgroup.ai/nlp/api/v1/postag

  • Method POST

  • Header Parameters

    1. header "Content-Type: application/json" 2. header "token: token_id"

    Để có "token id" bạn có thể đăng ký tài khoản tại viettelgroup.ai, sau đó login, rồi vào menu token để tạo

Định dạng data gửi lên: Json (default)

{
    "sentence": "input text"
}

Trong đó: sentence là câu văn cần kiểm tra

Success Response

Code: 200
Content: Json array

Mô tả các tham số

API nhận đầu vào là một câu văn, đưa ra danh sách các từ cùng nhãn từ loại và vị trí của từ đó trong câu

Thuộc tính Value Description
word string từ trong câu
type Int nhãn từ loại
start_index Int vị trí bắt đầu tiếng trong câu văn
end_index Int vị trí kết thúc tiếng trong câu

Example Output

Success

{ 
   "code:":0,
   "message":"OK",
   "result":[ 
      { 
         "end_index":7,
         "start_index":0,
         "type":"Np",
         "word":"Viettel"
      },
      { 
         "end_index":10,
         "start_index":8,
         "type":"V",
         "word":"là"
      },
      { 
         "end_index":17,
         "start_index":11,
         "type":"N",
         "word":"đợn vị"
      },
      { 
         "end_index":28,
         "start_index":18,
         "type":"N",
         "word":"trực thuộc"
      },
      { 
         "end_index":42,
         "start_index":29,
         "type":"N",
         "word":"Bộ Quốc Phòng"
      },
      { 
         "end_index":51,
         "start_index":43,
         "type":"Np",
         "word":"Việt Nam"
      }
   ]
}

Failure

{ 
   "code":1,
   "message":"Invalid json syntax! Cannot parse request!"
}

Word type list

Stt Mã từ loại Description Ví dụ
1 N danh từ (noun) bàn, ghế, lợn, gà, ngày, tháng,...
2 Np danh từ riêng (proper noun)
3 Nc danh từ chỉ loại (loại từ) (classifier noun) cái, con, chiếc, cục, cây (cột, nến, rơm), lá (gan), quả (tim, cật), tờ, tập, tệp, mẩu, bánh, mảnh, miếng, cuốn, quyển, pho, ngôi, toà, túp, căn, thửa, súc, suất, ngọn (gió), bông, đoá, cái (tình), cái (tát), cái (vỗ vai), (ngã một) cái, (đùng một) cái...
4 Nu danh từ chỉ đơn vị đo lường, tiền tệ (Measure and Monetary Unit) watt, jun, ha, cm, mm, kg, m², m³, cân, yến, tạ, tấn, lít, độ, hào, đồng, xu, quan, đôla, nhân dân tệ, yên, bảng, ..... [Không gán nhãn Nu cho các từ chỉ dụng cụ đo lường như ca, bò/bơ, đấu, thùng, can...]
5 Nux tổ hợp danh từ chỉ đơn vị mở rộng (Extended Unit Noun) lần/phút, chu_kỳ/p, độ C, ml/24h
6 M số từ (Numeral) một, hai, trăm, nghìn, 3, ½, 2018, 20/10, 30/4/1975, ...
7 Mx số từ mở rộng (Extended Numeral) 10h, 12A1, B2345, 29A.1007, 10h30p, 7-9h, 300.000đ, 3cm, 10m2, 2m, 50ml,...
8 L lượng từ (Quantifier) các, những, vài, đôi, dăm, mọi (người), mỗi (lần), từng (ngày), chút (thời gian), một_vài, một_số, dăm_ba, mỗi. tất_cả, cả, mọi, cái (ba cái con gà này), một (có một người đang)...
9 V động từ (Verb) muốn, đi, chơi, ăn, uống,….
10 A tính từ (Adjective) tốt, xấu, to, nhỏ,...
11 P đại từ (Pronoun) tôi, tao, mày, nó, ấy, bao_nhiêu, ai, kia, gì, nào, vậy, thế, sao,...
12 R phụ từ (Adverb) đã, sẽ, đang, rất, lắm, hết_sức, vô_cùng, có_lẽ...
13 E giới từ (Preposition) của, để, từ, đến...
14 C liên từ (Conjunction) và, hoặc, nhưng, nếu, thì, vì, nên ...
15 T trợ từ (Auxiliary) à, ư, nhỉ, nhé...; ngay, cả, chính, đích_thị, chỉ, những,…
16 I cảm từ (Interjection) ái chà, ôi, chao ôi, trời ơi...; haizzz, hihihi
17 G từ tổ (tổ hợp từ) (Group) là các quán ngữ: lên_lớp, lên_mặt, còn_mệt, nói_tóm_lại, thì_ra, thì_có,...
18 MW ngữ cố định (Multi-word expression) là các thành ngữ, tục ngữ: lời_ong_tiếng_ve, lời_qua_tiếng_lại, anh_hùng_bàn_phím, bạch_mã_hoàng_tử, ...
19 D tổ hợp từ biểu thị ý nghĩa tục tĩu (Dirty word) đù_má, đù_mẹ, đéo, đếch, vãi_luyện, đcmn, [đ con mẹ nó], f..ck,...
20 X tổ hợp không thể xác định từ loại (Undetermined group) x² = a, x+y = 36, √A² = │A│, A1 x √A², 9X {người thế hệ những năm 1990}, 2ker {người thế hệ những năm 2000}
21 FW Từ nguyên dạng tiếng nước ngoài (Foreign words) Nhãn này thường được gán cho những từ ngữ, những cụm từ hay câu tiếng nước ngoài (như tiếng Anh chẳng hạn) được trộn mã hay chuyển mã vào tiếng Việt: made, in, Thailand (made in Thailand), anyway, and, or, but, I, love, you, too (I love you too), how, are, you (how are you)….
22 CH kí hiệu (Symbol) - @ # $ % & * ! < > ( ) { } [ ] ...
23 Nb Danh từ vay mượn (Borrowed Noun) Internet, video, shop, (thẻ) Gold, (thẻ) debit,…
24 Vb Động từ vay mượn (Borrowed Verb) Chat, check, comment, inbox, add,…
25 Ab Tính từ vay mượn (Borrowed Adjective) Cute, xì tin, sexy,…
26 Ny Danh từ viết tắt (Abbreviation of Noun) Nv (nhân viên), a (anh), e (em),…
27 Vy Động từ viết tắt (Abbreviation of Verb) Kt (kiểm tra), nc (nói chuyện),…
28 Ay Tính từ viết tắt (Abbreviation of Adjective) Dt (dễ thương),…
29 Npy Danh từ riêng viết tắt (Abbreviation of Proper Noun) VN (Việt Nam), HCM (Hồ Chí Minh), HN (Hà Nội), BIDV, HIV, WTO, NATO, FTU,…
30 Cy Liên từ viết tắt (Abbreviation of Conjunction) Vs (với), Nh (nhưng),…
31 Dy Tổ hợp từ dung tục viết tắt (Abbreviation of Dirty word) Đcm, Đm, vl, clgt,…
32 My Số từ viết tắt (Abbreviation of Numeral) 200k, 50k, 2k1, 2k2
33 Py Đại từ viết tắt (Abbreviation of Pronoun) M (mình/mày), t (tôi/tớ/tao), bn (bao nhiêu), tn (thế nào), bg (bao giờ),…
34 Ry Phụ từ viết tắt (Abbreviation of Adverb) Ko/k (không), đc (được), ms (mới),...
35 Gy Tổ hợp từ viết tắt (Abbreviation of Group) Ntn (như thế nào),...
36 Nby Danh từ vay mượn viết tắt (Abbreviation of Borrowed Noun) 3G, mic, ATM,…
37 Vby Động từ vay mượn viết tắt (Abbreviation of Borrowed Verb) Cmt (comment), ib (inbox)
38 Aby Tính từ vay mượn viết tắt (Abbreviation of Borrowed Adjective) Onl (online), ok ( hàng của shop dùng khá ok)
39 DP Lỗi tiền xử lý (Pre-processing Error) Anhem, ĐHBK, TP.HCM,…
Nội dung