Gom nhóm văn bản dựa trên mẫu hữu ích được đánh trọng phổ biến
Tác giả: Trần Thanh Trâm, Võ Đình Bảy
Số trang:
Số 8 (Tập 60)
Tên tạp chí:
Khoa học Công nghệ Việt Nam - B
Số phát hành:
Số 8 (Tập 60)
Kiểu tài liệu:
Tạp chí trong nước
Nơi lưu trữ:
03 Quang Trung
Mã phân loại:
004
Ngôn ngữ:
Tiếng Việt
Từ khóa:
Gom nhóm văn bản
Chủ đề:
Gom nhóm văn bản
Tóm tắt:
Đề xuất một phương pháp mới để gom nhóm văn bản dựa vào mẫu hữu ích được đánh trọng phổ biến thông qua việc sử dụng TF cho mỗi từ trong văn bản. Trọng số của từ trên toàn bộ tập văn bản được tính dự vào IDF, sau đó sử dụng thuật toán MWIT-FWUI để khai thác các mẫu hữu ích phổ biến. Tiếp theo, tiến hành gom nhóm văn bản bằng thuật toán MC. Kết quả thử nghiệm trên kho ngữ liệu gồm 1600 văn bản (16 chủ đề) cho thấy, phương pháp mới đã cải thiện đáng kể độ chính xác của việc gom nhóm văn bản so với phương pháp dựa vào mẫu phổ biến.
Tạp chí liên quan
- Constrained optimization using swarm intelligence integrated with Deb’s feasibility rules developed in Python = Giải bài toán tối ưu hóa ràng buộc sử dụng trí tuệ bầy đàn kết hợp quy tắc khả thi của Deb được phát triển bằng Python
- Particle Swarm Optimization using ε constraint-handling method developed in Python = Thuật toán tối ưu hóa bầy đàn sử dụng phương pháp xử lý ràng buộc ε được phát triển với Python
- Solving constrained optimization tasks in civil engineering using ε- Differential Evolution developed with Visual C#. NET = Giải các bài toán tối ưu hóa có ràng buộc trong ngành xây dựng sử dụng thuật toán ε - tiến hóa vi phân được phát triển với ngôn ngữ
- Optimizing cantilever retaining wall design using feasibility rule-based evolutionary algorithm developed with Visual C# .NET = Tối ưu hóa thiết kế tường chắn đất sử dụng thuật toán tiến hóa được kết hợp quy tắc khả thi và phát triển với ngôn ngữ C# .NET
- IFC5 : kỳ vọng về cuộc cách mạng trao đổi thông tin trong xây dựng kỹ thuật số