A new information theory based algorithm for clustering categorical data
Tác giả: Do Si Truong, Lam Thanh Hien, Nguyen Thanh TungTóm tắt:
In this paper, we review two baseline algorithms for use with categorical data, namely Min-Min Roughness (MMR) and Mean Gain Ratio (MGR), and propose a new algorithm, called Minimum Mean Normalized Variation of Information (MMNVI). MMNVI algorithm uses the Mean Normalized Variation of Information of one attribute concerning another for finding the best clustering attribute, and the entropy of equivalence classes generated by the selected clustering attribute for binary splitting the clustering dataset. Experimental results on real datasets from UCI indicate that the MMNVI algorithm can be used successfully in clustering categorical data. It produces better or equivalent clustering results than the baseline algorithms.
- Nâng cao hiệu quả kiểm soát quyền hành pháp trong Nhà nước pháp quyền xã hội chủ nghĩa Việt Nam
- Yêu cầu tội phạm hóa trong Công ước Liên Hợp Quốc về chống tội phạm mạng và những vấn đề đặt ra đối với việc hoàn thiện quy định của Bộ luật Hình sự Việt Nam
- Thực trạng kiểm sát giải quyết vụ án tranh chấp kinh doanh bất động sản theo thủ tục sơ thẩm và giải pháp
- Thời điểm phát sinh quyền đại diện của người đại diện theo pháp luật của pháp nhân : một số bất cập của pháp luật hiện hành cần hoàn thiện
- Tổ chức cuộc thi tranh biện tại Học viện Tư pháp : một số vấn đề lý luận và thực tiễn