CSDL Bài trích Báo - Tạp chí
chủ đề: Gom nhóm văn bản
1 Gom nhóm văn bản dựa trên mẫu hữu ích được đánh trọng phổ biến / Trần Thanh Trâm, Võ Đình Bảy // Khoa học Công nghệ Việt Nam - B .- 2018 .- Số 8 (Tập 60) .- Số 8 (Tập 60) .- 004
Đề xuất một phương pháp mới để gom nhóm văn bản dựa vào mẫu hữu ích được đánh trọng phổ biến thông qua việc sử dụng TF cho mỗi từ trong văn bản. Trọng số của từ trên toàn bộ tập văn bản được tính dự vào IDF, sau đó sử dụng thuật toán MWIT-FWUI để khai thác các mẫu hữu ích phổ biến. Tiếp theo, tiến hành gom nhóm văn bản bằng thuật toán MC. Kết quả thử nghiệm trên kho ngữ liệu gồm 1600 văn bản (16 chủ đề) cho thấy, phương pháp mới đã cải thiện đáng kể độ chính xác của việc gom nhóm văn bản so với phương pháp dựa vào mẫu phổ biến.